Mimic-code: ํŒŒ์ผ chartevents.csv ์•Œ ์ˆ˜ ์—†๋Š” ์˜ค๋ฅ˜๋ฅผ ํ†ต๊ณ„ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

์— ๋งŒ๋“  2018๋…„ 10์›” 29์ผ  ยท  25์ฝ”๋ฉ˜ํŠธ  ยท  ์ถœ์ฒ˜: MIT-LCP/mimic-code

์ „์ œ ์กฐ๊ฑด

  • [ X] ๋‹ค์Œ์„ ๋ชจ๋‘ ์ˆ˜ํ–‰ํ•œ ๊ฒฝ์šฐ ์ด ์ค„์˜ ๋Œ€๊ด„ํ˜ธ ์‚ฌ์ด์— X๋ฅผ ๋„ฃ์œผ์‹ญ์‹œ์˜ค.

Postgres_load_data ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์ฒ˜์Œ ์„ธ ๊ฐœ์˜ ํ…Œ์ด๋ธ”์ด ๋กœ๋“œ๋˜๊ณ  ๊ทธ ํ›„์— ๋‹ค์Œ ๋ฉ”์‹œ์ง€๊ฐ€ ๋‚˜ํƒ€๋‚ฉ๋‹ˆ๋‹ค. CHARTEVENTS.csv ํŒŒ์ผ์„ ํ†ต๊ณ„ํ•  ์ˆ˜ ์—†์Œ: ์•Œ ์ˆ˜ ์—†๋Š” ์˜ค๋ฅ˜ ๋ˆ„๊ตฌ๋“ ์ง€์ด ์ƒํ™ฉ์ด ์žˆ๊ณ  ๋„์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

๊ฐ€์žฅ ์œ ์šฉํ•œ ๋Œ“๊ธ€

์ข‹์Šต๋‹ˆ๋‹ค. could not stat file "CHARTEVENTS.csv": Unknown error ๋Š” ์‹ค์ œ๋กœ PostgreSQL 11์˜ ๋ฒ„๊ทธ์ž…๋‹ˆ๋‹ค. ํ›„๋“œ ์•„๋ž˜์—์„œ fstat() ๋ฅผ ํ˜ธ์ถœํ•˜์—ฌ ํŒŒ์ผ์ด ๋””๋ ‰ํ† ๋ฆฌ๊ฐ€ ์•„๋‹Œ์ง€ ํ™•์ธํ•˜๊ณ  ๋ถˆํ–‰ํžˆ๋„ fstat() ๋Š” chartevent์™€ ๊ฐ™์€ ๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†๋Š” 32๋น„ํŠธ ํ”„๋กœ๊ทธ๋žจ์ž…๋‹ˆ๋‹ค. PostgreSQL 10.5๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Windows์—์„œ ๋นŒ๋“œ๋ฅผ ํ…Œ์ŠคํŠธํ–ˆ๋Š”๋ฐ ์ด ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์•˜์œผ๋ฏ€๋กœ ์ƒ๋‹นํžˆ ์ƒˆ๋กญ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๊ฐ€์žฅ ์ข‹์€ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์€ ํŒŒ์ผ์„ ์••์ถ•๋œ ์ƒํƒœ๋กœ ์œ ์ง€ํ•˜๊ณ (์ฆ‰, .csv.gz ํŒŒ์ผ๋กœ ์œ ์ง€) 7zip์„ ์‚ฌ์šฉํ•˜์—ฌ ์••์ถ•๋œ ํŒŒ์ผ์—์„œ ์ง์ ‘ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ…Œ์ŠคํŠธ์—์„œ ์ด๊ฒƒ์€ ์—ฌ์ „ํžˆ โ€‹โ€‹์ž‘๋™ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ๋งค์šฐ ์ž์„ธํ•œ ์ž์Šต์„œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. https://mimic.physionet.org/tutorials/install-mimic-locally-windows/

์œ„์˜ ๊ฐ„๋‹จํ•œ ๋ฒ„์ „์€ .csv.gz ํŒŒ์ผ์„ ์œ ์ง€ํ•˜๊ณ  Windows ํ™˜๊ฒฝ ๊ฒฝ๋กœ์— 7zip ๋ฐ”์ด๋„ˆ๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ•œ ๋‹ค์Œ postgres_load_data_7zip.sql ํŒŒ์ผ์„ ํ˜ธ์ถœํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋กœ๋“œํ–ˆ๋Š”์ง€ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋“  ํ›„์— postgres_checks.sql ํŒŒ์ผ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํŽธ์ง‘: ์ด 7zip ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜๋Š” ๋‚˜์ค‘ ์˜ค๋ฅ˜์˜ ๊ฒฝ์šฐ ๋กœ๋“œ๋˜์ง€ ์•Š๋Š” ์ด์œ ๊ฐ€ ํ™•์‹คํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ADMISSIONS.csv.gz ํŒŒ์ผ๋งŒ ๋‹ค์‹œ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์—ฌ์ „ํžˆ ๋™์ผํ•œ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์Šคํฌ๋ฆฝํŠธ๋‚˜ ๋ฌด์–ธ๊ฐ€๋ฅผ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•˜๋Š” 7zip์˜ ์ƒˆ ๋ฒ„์ „์ด ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

๋ชจ๋“  25 ๋Œ“๊ธ€

ํ”„๋กœ์ ํŠธ์˜ ๋‹ค์šด๋กœ๋“œ ํŽ˜์ด์ง€์— ์ œ๊ณต๋œ ์ฒดํฌ์„ฌ ํŒŒ์ผ์„ ์‚ฌ์šฉํ•˜์—ฌ chartevents.csv ์‚ฌ๋ณธ์˜ ๋ฌด๊ฒฐ์„ฑ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๊นŒ? ๋‹ค์šด๋กœ๋“œ ๋˜๋Š” ์••์ถ• ํ•ด์ œ ์ค‘์— ์†์ƒ๋˜์—ˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์˜ˆ, md5 checksum_md5_zipped.txt ๋ช…๋ น์„ ์‚ฌ์šฉํ–ˆ์œผ๋ฉฐ ๋ชจ๋“  ํ…Œ์ด๋ธ”์—์„œ ๋ชจ๋“  ๊ฒƒ์ด ์ •์ƒ์ž…๋‹ˆ๋‹ค...

๋˜ํ•œ ์••์ถ• ๋ฐ์ดํ„ฐ๋กœ ์‹œ๋„ํ•˜๊ณ  postgres_load_data script_7zip์„ ์‹คํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ์—์„œ ์ธ์šฉ๋˜์ง€ ์•Š์€ ์ค„ ๋ฐ”๊ฟˆ์„ ์ฐพ์•˜์Šต๋‹ˆ๋‹ค. ํžŒํŠธ: ์ธ์šฉ๋œ CSV ํ•„๋“œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ƒˆ ์ค„์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

๋‚˜๋Š” ๋˜ํ•œ md5 checksum_md5_unzipped.txt๋ฅผ ํ™•์ธํ–ˆ๊ณ  ๋ชจ๋“  ๊ฒƒ์ด ์ •์ƒ์ž…๋‹ˆ๋‹ค.

์‹คํ–‰ ์ค‘์ธ ์Šคํฌ๋ฆฝํŠธ์™€ ๋ณด์œ ํ•œ ๋ฐ์ดํ„ฐ ์‚ฌ์ด์— ๋ถˆ์ผ์น˜๊ฐ€ ์žˆ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋“ค๋ฆฝ๋‹ˆ๋‹ค. ๋‚˜๋Š” ํ™•์‹ ํ•  ๊ฒƒ์ด๋‹ค:

  1. ๋ชจ๋“  ํŒŒ์ผ์€ ๊ฐ™์€ ๋””๋ ‰ํ† ๋ฆฌ์— ์žˆ์Šต๋‹ˆ๋‹ค
  2. ๋ชจ๋“  ํŒŒ์ผ์˜ ํŒŒ์ผ ํ™•์žฅ์ž๋Š” ๋™์ผํ•ฉ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด ๋ชจ๋‘ .csv.gz
  3. postgres_load_data_7zip.sql ํŒŒ์ผ์„ (i) ๋™์ผํ•œ ํด๋”์—์„œ ๋˜๋Š” (ii) ๋ฐ์ดํ„ฐ ๋””๋ ‰ํ† ๋ฆฌ๋ฅผ ๊ฐ€๋ฆฌํ‚ค๋„๋ก mimic_data_dir์„ ๊ตฌ์„ฑํ•œ ํ›„ ์‹คํ–‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณผ๊ฑฐ์—๋Š” ํด๋” ์„ค์ •์˜ ์Šคํฌ๋ฆฐ์ƒท, ์‹œ์Šคํ…œ ์ •๋ณด, ์‹คํ–‰ํ•œ ์ •ํ™•ํ•œ ๋ช…๋ น ๋ฐ ์ •ํ™•ํ•œ ์˜ค๋ฅ˜ ๋ฉ”์‹œ์ง€์™€ ๊ฐ™์€ ์ถ”๊ฐ€ ์ •๋ณด ์—†์ด ์›๊ฒฉ์œผ๋กœ ๋””๋ฒ„๊ทธํ•˜๊ธฐ๊ฐ€ ์ •๋ง ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

์•ˆ๋…•ํ•˜์„ธ์š”,

๋‹ต๋ณ€ ์ฃผ์…”์„œ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

  1. ๋ชจ๋“  ํŒŒ์ผ์€ ๊ฐ™์€ ๋””๋ ‰ํ† ๋ฆฌ์— ์žˆ์Šต๋‹ˆ๋‹ค
  2. ๋ชจ๋“  ํŒŒ์ผ์˜ ํŒŒ์ผ ํ™•์žฅ์ž๋Š” csv์ž…๋‹ˆ๋‹ค.
  3. ๋ฐ์ดํ„ฐ ๋””๋ ‰ํ† ๋ฆฌ๋ฅผ ๊ฐ€๋ฆฌํ‚ค๋„๋ก mimic_data_dir์„ ๊ตฌ์„ฑํ•œ ํ›„ posgres_load_data.sql ํŒŒ์ผ์„ ์‹คํ–‰ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
    ์—ฌ๊ธฐ์— ๋‚ด ์ •ํ™•ํ•œ ๋ช…๋ น๊ณผ ์˜ค๋ฅ˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.
    step1
    step2
    system_information

์ถ”๊ฐ€ ์ •๋ณด ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํŒŒ์ผ์ด ํด๋”์— ์—†๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ฐ„๋‹จํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. C:/Users/Lejla/Desktop/MIMICIII ํด๋”์— CHARTEVENTS.csv ํŒŒ์ผ์ด ์žˆ๋Š”์ง€ ๋‹ค์‹œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์••์ถ• ํŒŒ์ผ์„ ๋ชจ๋‘ ์ถ”์ถœํ•˜๋ ค๊ณ  ์‹œ๋„ํ–ˆ์ง€๋งŒ chartevent์— ๋Œ€ํ•ด ์‹คํŒจํ•˜์—ฌ .csv.gz ํŒŒ์ผ .csv.gz ์—์„œ ์ง์ ‘ ๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์„ ๋Œ€์ฒดํ•˜์—ฌ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

\copy CHARTEVENTS from 'CHARTEVENTS.csv' delimiter ',' csv header NULL ''

~์™€ ํ•จ๊ป˜

\copy CHARTEVENTS from PROGRAM '7z e -so CHARTEVENTS.csv.gz' delimiter ',' csv header NULL ''

๋‹ต๋ณ€ ์ •๋ง ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฒˆ์—๋Š” zip ํŒŒ์ผ๋กœ ์ž‘์—…ํ•˜๊ณ  ์Šคํฌ๋ฆฝํŠธ๋ฅผ ์‹คํ–‰ํ•ด ๋ณด์•˜์Šต๋‹ˆ๋‹ค. ์ด๋ฒˆ์— ๋‚˜๋Š” ๋‹ค๋ฅธ
zip_file
๋ฉ”์‹œ์ง€ ... ์•„๋งˆ๋„ ๋„์›€์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋””๋ ‰ํ† ๋ฆฌ ๋‚ด์šฉ์„ ๋ณด์—ฌ์ฃผ์‹œ๊ฒ ์Šต๋‹ˆ๊นŒ?

I don't mind. ์—ฌ๊ธฐ์— ๋‚ด ํด๋”์˜ ๋‚ด์šฉ์ด ์žˆ์Šต๋‹ˆ๋‹ค.
directory

์ข‹์Šต๋‹ˆ๋‹ค. could not stat file "CHARTEVENTS.csv": Unknown error ๋Š” ์‹ค์ œ๋กœ PostgreSQL 11์˜ ๋ฒ„๊ทธ์ž…๋‹ˆ๋‹ค. ํ›„๋“œ ์•„๋ž˜์—์„œ fstat() ๋ฅผ ํ˜ธ์ถœํ•˜์—ฌ ํŒŒ์ผ์ด ๋””๋ ‰ํ† ๋ฆฌ๊ฐ€ ์•„๋‹Œ์ง€ ํ™•์ธํ•˜๊ณ  ๋ถˆํ–‰ํžˆ๋„ fstat() ๋Š” chartevent์™€ ๊ฐ™์€ ๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†๋Š” 32๋น„ํŠธ ํ”„๋กœ๊ทธ๋žจ์ž…๋‹ˆ๋‹ค. PostgreSQL 10.5๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Windows์—์„œ ๋นŒ๋“œ๋ฅผ ํ…Œ์ŠคํŠธํ–ˆ๋Š”๋ฐ ์ด ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์•˜์œผ๋ฏ€๋กœ ์ƒ๋‹นํžˆ ์ƒˆ๋กญ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๊ฐ€์žฅ ์ข‹์€ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์€ ํŒŒ์ผ์„ ์••์ถ•๋œ ์ƒํƒœ๋กœ ์œ ์ง€ํ•˜๊ณ (์ฆ‰, .csv.gz ํŒŒ์ผ๋กœ ์œ ์ง€) 7zip์„ ์‚ฌ์šฉํ•˜์—ฌ ์••์ถ•๋œ ํŒŒ์ผ์—์„œ ์ง์ ‘ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ…Œ์ŠคํŠธ์—์„œ ์ด๊ฒƒ์€ ์—ฌ์ „ํžˆ โ€‹โ€‹์ž‘๋™ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ๋งค์šฐ ์ž์„ธํ•œ ์ž์Šต์„œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. https://mimic.physionet.org/tutorials/install-mimic-locally-windows/

์œ„์˜ ๊ฐ„๋‹จํ•œ ๋ฒ„์ „์€ .csv.gz ํŒŒ์ผ์„ ์œ ์ง€ํ•˜๊ณ  Windows ํ™˜๊ฒฝ ๊ฒฝ๋กœ์— 7zip ๋ฐ”์ด๋„ˆ๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ•œ ๋‹ค์Œ postgres_load_data_7zip.sql ํŒŒ์ผ์„ ํ˜ธ์ถœํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋กœ๋“œํ–ˆ๋Š”์ง€ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋“  ํ›„์— postgres_checks.sql ํŒŒ์ผ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํŽธ์ง‘: ์ด 7zip ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜๋Š” ๋‚˜์ค‘ ์˜ค๋ฅ˜์˜ ๊ฒฝ์šฐ ๋กœ๋“œ๋˜์ง€ ์•Š๋Š” ์ด์œ ๊ฐ€ ํ™•์‹คํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ADMISSIONS.csv.gz ํŒŒ์ผ๋งŒ ๋‹ค์‹œ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์—ฌ์ „ํžˆ ๋™์ผํ•œ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์Šคํฌ๋ฆฝํŠธ๋‚˜ ๋ฌด์–ธ๊ฐ€๋ฅผ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•˜๋Š” 7zip์˜ ์ƒˆ ๋ฒ„์ „์ด ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

์•ˆ๋…•ํ•˜์„ธ์š”,
์ž์„ธํ•œ ์„ค๋ช… ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. PostgreSQL 10.5๋ฅผ ์„ค์น˜ํ–ˆ๊ณ  ์ด์ œ ํ”„๋กœ์„ธ์Šค๊ฐ€ ์‹คํ–‰ ์ค‘์ž…๋‹ˆ๋‹ค. ๋ชจ๋“  ํ…Œ์ด๋ธ”์„ ๋กœ๋“œํ•˜๋Š” ๋ฐ ๋งŽ์€ ์‹œ๊ฐ„์ด ๊ฑธ๋ฆด ๊ฒƒ์ด๋ผ๊ณ  ์ƒ๊ฐํ•˜์ง€๋งŒ ๋” ์ด์ƒ "์•Œ ์ˆ˜ ์—†๋Š” ์˜ค๋ฅ˜"๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ๋„์›€์„ ์ฃผ์…”์„œ ๋Œ€๋‹จํžˆ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

์—„์ฒญ๋‚œ!

์ข‹์Šต๋‹ˆ๋‹ค. could not stat file "CHARTEVENTS.csv": Unknown error ๋Š” ์‹ค์ œ๋กœ PostgreSQL 11์˜ ๋ฒ„๊ทธ์ž…๋‹ˆ๋‹ค. ํ›„๋“œ ์•„๋ž˜์—์„œ fstat() ๋ฅผ ํ˜ธ์ถœํ•˜์—ฌ ํŒŒ์ผ์ด ๋””๋ ‰ํ† ๋ฆฌ๊ฐ€ ์•„๋‹Œ์ง€ ํ™•์ธํ•˜๊ณ  ๋ถˆํ–‰ํžˆ๋„ fstat() ๋Š” chartevent์™€ ๊ฐ™์€ ๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†๋Š” 32๋น„ํŠธ ํ”„๋กœ๊ทธ๋žจ์ž…๋‹ˆ๋‹ค. PostgreSQL 10.5๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ Windows์—์„œ ๋นŒ๋“œ๋ฅผ ํ…Œ์ŠคํŠธํ–ˆ๋Š”๋ฐ ์ด ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜์ง€ ์•Š์•˜์œผ๋ฏ€๋กœ ์ƒ๋‹นํžˆ ์ƒˆ๋กญ๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค.

๊ฐ€์žฅ ์ข‹์€ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์€ ํŒŒ์ผ์„ ์••์ถ•๋œ ์ƒํƒœ๋กœ ์œ ์ง€ํ•˜๊ณ (์ฆ‰, .csv.gz ํŒŒ์ผ๋กœ ์œ ์ง€) 7zip์„ ์‚ฌ์šฉํ•˜์—ฌ ์••์ถ•๋œ ํŒŒ์ผ์—์„œ ์ง์ ‘ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ…Œ์ŠคํŠธ์—์„œ ์ด๊ฒƒ์€ ์—ฌ์ „ํžˆ โ€‹โ€‹์ž‘๋™ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ๋งค์šฐ ์ž์„ธํ•œ ์ž์Šต์„œ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. https://mimic.physionet.org/tutorials/install-mimic-locally-windows/

์œ„์˜ ๊ฐ„๋‹จํ•œ ๋ฒ„์ „์€ .csv.gz ํŒŒ์ผ์„ ์œ ์ง€ํ•˜๊ณ  Windows ํ™˜๊ฒฝ ๊ฒฝ๋กœ์— 7zip ๋ฐ”์ด๋„ˆ๋ฆฌ๋ฅผ ์ถ”๊ฐ€ํ•œ ๋‹ค์Œ postgres_load_data_7zip.sql ํŒŒ์ผ์„ ํ˜ธ์ถœํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋กœ๋“œํ–ˆ๋Š”์ง€ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ๋ชจ๋“  ํ›„์— postgres_checks.sql ํŒŒ์ผ์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํŽธ์ง‘: ์ด 7zip ์ ‘๊ทผ ๋ฐฉ์‹์„ ์‚ฌ์šฉํ•˜๋Š” ๋‚˜์ค‘ ์˜ค๋ฅ˜์˜ ๊ฒฝ์šฐ ๋กœ๋“œ๋˜์ง€ ์•Š๋Š” ์ด์œ ๊ฐ€ ํ™•์‹คํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ADMISSIONS.csv.gz ํŒŒ์ผ๋งŒ ๋‹ค์‹œ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์—ฌ์ „ํžˆ ๋™์ผํ•œ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์Šคํฌ๋ฆฝํŠธ๋‚˜ ๋ฌด์–ธ๊ฐ€๋ฅผ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•˜๋Š” 7zip์˜ ์ƒˆ ๋ฒ„์ „์ด ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค!

PostgreSQL 10.11์„ ์‚ฌ์šฉํ•˜๋ฉด ๋„์›€์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค... ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค

์ถ”๊ฐ€ ์ •๋ณด ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํŒŒ์ผ์ด ํด๋”์— ์—†๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ฐ„๋‹จํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. C:/Users/Lejla/Desktop/MIMICIII ํด๋”์— CHARTEVENTS.csv ํŒŒ์ผ์ด ์žˆ๋Š”์ง€ ๋‹ค์‹œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์••์ถ• ํŒŒ์ผ์„ ๋ชจ๋‘ ์ถ”์ถœํ•˜๋ ค๊ณ  ์‹œ๋„ํ–ˆ์ง€๋งŒ chartevent์— ๋Œ€ํ•ด ์‹คํŒจํ•˜์—ฌ .csv.gz ํŒŒ์ผ .csv.gz ์—์„œ ์ง์ ‘ ๋กœ๋“œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ์„ ๋Œ€์ฒดํ•˜์—ฌ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

\copy CHARTEVENTS from 'CHARTEVENTS.csv' delimiter ',' csv header NULL ''

~์™€ ํ•จ๊ป˜

\copy CHARTEVENTS from PROGRAM '7z e -so CHARTEVENTS.csv.gz' delimiter ',' csv header NULL ''

๊ณ ๋งˆ์›Œ, ์ด๊ฒƒ์€ ๋‚˜๋ฅผ ์œ„ํ•ด ์ผํ–ˆ๋‹ค.
\copy my_table_name from program 'cmd /c type input_data.csv' ๊ตฌ๋ถ„ ๊ธฐํ˜ธ ',' csv ํ—ค๋”;
11GB ํฌ๊ธฐ์™€ ๊ฐ™์€ input_data.csv.

"๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ์„ ๋ณต์‚ฌํ•  ์ˆ˜ ์—†์Œ" ๋ฌธ์ œ๋Š” 11 ๋ฐ 12 ๋ฒ„์ „์—์„œ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ 10์€ ๊ดœ์ฐฎ์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ํŒŒ์ผ์„ ์••์ถ•ํ•˜์ง€ ์•Š๊ณ  ์žฌ์ •์˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์žˆ์ง€๋งŒ ์ผ๋ถ€ Postgresql ํ”„๋กœ๊ทธ๋žจ ํŒŒ์ผ์„ v.10์—์„œ v 11 ๋ฐ 12๋กœ ์—…์„œํŠธ/์Šค์™‘ํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?
ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•:
(ํ˜•์‹ ํ…์ŠคํŠธ)์™€ ํ•จ๊ป˜ ํ”„๋กœ๊ทธ๋žจ 'cmd /c "type x:\pathto\file.txt"'์—์„œ t(c,d)๋ฅผ ๋ณต์‚ฌํ•ฉ๋‹ˆ๋‹ค.
- ๋‚ด ํ•„์š”์— ๋น„ํ•ด ๊ฝค ๋Š๋ฆฝ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ ๋ณต์‚ฌ ๋ช…๋ น์˜ ์†๋„๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๋‹ค๋ฅธ ๋ช…๋ น์ค„ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํŒŒ์ผ์„ ์—ฌ๋Ÿฌ ํŒŒ์ผ๋กœ ๋ถ„ํ• ํ•œ ๋‹ค์Œ ๊ฐœ๋ณ„ ํŒŒ์ผ์„ ํ•œ ๋ฒˆ์— ํ•˜๋‚˜์”ฉ ๋กœ๋“œํ•˜๋Š” ๊ฒƒ์„ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์œ ๋‹‰์Šค ์‹œ์Šคํ…œ์—์„œ ์ด๊ฒƒ์€ split ์‚ฌ์šฉํ•˜์—ฌ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ Windows์šฉ GNU coreutils๋ฅผ ์„ค์น˜ํ•˜์—ฌ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ €๋„ ๋‹˜๊ณผ ๊ฐ™์€ ๋ฌธ์ œ๋ฅผ ๊ฒช์€ ๊ฒƒ ๊ฐ™์€๋ฐ ์ตœ์‹  ๋ฒ„์ „ 12๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์ด ์—†์„๊นŒ์š”? ์••์ถ• ํŒŒ์ผ์„ ์‚ฌ์šฉํ•˜์‹œ๊ฒ ์Šต๋‹ˆ๊นŒ?

์˜ˆ, ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๊ธฐ์–ตํ•œ๋‹ค๋ฉด ์••์ถ• ํŒŒ์ผ์ด 4GB ๋ฏธ๋งŒ์ด๊ณ  ์••์ถ• ๋กœ๋“œ ์Šคํฌ๋ฆฝํŠธ(7z ๋˜๋Š” gzip)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ด ์˜ค๋ฅ˜๋ฅผ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์•Œ๊ฒ ์Šต๋‹ˆ๋‹ค. ์ง€๊ธˆ ์ด ๋ฐฉ๋ฒ•์„ ์‹œ๋„ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ๋‹ต๋ณ€ ์ฃผ์…”์„œ ๋Œ€๋‹จํžˆ ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

๊ทธ๋ ‡๋‹ค๋ฉด ์••์ถ•์ด๋‚˜ ๋ถ„ํ• ์„ ์ „ํ˜€ ์‚ฌ์šฉํ•˜์ง€ ์•Š๊ณ ๋Š” ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์ด ์—†์Šต๋‹ˆ๊นŒ? 11, 12 ์—”์ง„์— Postgresql์˜ COPY ๋ช…๋ น 10 ๋ฒ„์ „ ์‚ฌ์šฉ?
๋‚ด๊ฐ€ ์–ธ๊ธ‰ ํ•œ ๋ฐ”์™€ ๊ฐ™์ด:
๊ธฐ๋ณธ ๋ณต์‚ฌ ๋ช…๋ น์˜ ์†๋„๊ฐ€ ํ•„์š”ํ•˜์ง€๋งŒ ๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ + 12 ๋ฒ„์ „์˜ ๊ฒฝ์šฐ
์ด๊ฒƒ์€ ๋‚ด ํ•„์š”์— ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๊ธ€์Ž„์š”, PostgreSQL์€ ์˜คํ”ˆ ์†Œ์Šค์ด๋ฏ€๋กœ ์ง์ ‘ ์ˆ˜์ •์„ ์‹œ๋„ํ•˜๊ณ  ๊ธฐ์—ฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. :)

๊ด€๋ จ ํ† ๋ก ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. https://www.postgresql.org/message-id/20181104000405.GA1743%40paquier.xyz

๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด ์ด ์Šค๋ ˆ๋“œ์—์„œ ์ œ์•ˆ๋œ ์„ธ ๊ฐ€์ง€ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค(๋ฒ„์ „ ๋ณ€๊ฒฝ, ์••์ถ• ํŒŒ์ผ ์‚ฌ์šฉ, ํŒŒ์ผ์„ ์—ฌ๋Ÿฌ ๋ถ€๋ถ„์œผ๋กœ ๋ถ„ํ• ). ๋‹ค๋ฅธ ํ•ด๊ฒฐ ๋ฐฉ๋ฒ•๋„ ์žˆ๋‹ค๊ณ  ํ™•์‹ ํ•ฉ๋‹ˆ๋‹ค.

COPY ๊ธฐ๋Šฅ์˜ v. 10's ์ฝ”๋“œ์˜ ์ž‘์—… ๋ถ€๋ถ„์„ 11๊ณผ 12๋กœ ๋งˆ์ด๊ทธ๋ ˆ์ด์…˜ํ•˜๋Š” ๊ฒƒ์ด ๋ป”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๊นŒ? ์•„๋‹ˆ๋ฉด ํ•˜๋“œ์ฝ”๋”ฉ๋˜์–ด ๋ชจ๋‘์—๊ฒŒ ์ถฉ๋Œ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๊นŒ? :)

@ghYura ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ๊ด€๋ฆฌํ•˜๋Š” ๋ฆฌ์†Œ์Šค์ด๋ฏ€๋กœ ์ฝ”๋“œ๋ฒ ์ด์Šค๋ฅผ ๊ฐœ์„ ํ•˜๊ธฐ ์œ„ํ•œ ์ œ์•ˆ ์‚ฌํ•ญ์ด ์žˆ์œผ๋ฉด ๋Œ์–ด์˜ค๊ธฐ ์š”์ฒญ์„ ํ•˜๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.

CSV๋ฅผ 12.X ๋ฐ 13.X ๋ฒ„์ „ ๋ชจ๋‘์˜ ํ…Œ์ด๋ธ”์— ๋กœ๋“œํ•˜๋Š” ๋™์•ˆ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ–ˆ์ง€๋งŒ PostgreSQL ๋ฒ„์ „ 10.15์˜ ๋งค๋ ฅ์ฒ˜๋Ÿผ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค. ๋„์›€์„ ์ฃผ์‹  ๋ชจ๋“  ๋ถ„๋“ค๊ป˜ ๊ฐ์‚ฌ๋“œ๋ฆฝ๋‹ˆ๋‹ค :)

์ด ํŽ˜์ด์ง€๊ฐ€ ๋„์›€์ด ๋˜์—ˆ๋‚˜์š”?
0 / 5 - 0 ๋“ฑ๊ธ‰