Mimic-code: λ‹€λ₯Έ ν”„λ‘œμ νŠΈ/μ—°κ΅¬μ—μ„œ μ „λ‹¬λœ λ³΅μž‘ν•œ SQL 슀크립트λ₯Ό μ‹€ν–‰ν•˜λŠ” 방법에 λŒ€ν•œ 쑰언이 μžˆμŠ΅λ‹ˆκΉŒ?

에 λ§Œλ“  2017λ…„ 09μ›” 02일  Β·  4μ½”λ©˜νŠΈ  Β·  좜처: MIT-LCP/mimic-code

μ•ˆλ…•ν•˜μ„Έμš”, μ €λŠ” MIMIC-3κ³Ό postgeSQL/pgAdmin 4λ₯Ό 처음 μ‚¬μš©ν•©λ‹ˆλ‹€.

μ €λŠ” Cohort selection tutorial notebook 을 톡해 μž‘μ—…ν•΄ μ™”μœΌλ©° 이제 κΈ°λ³Έ 사항을 μ΄ν•΄ν–ˆλ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€.

μ €λŠ” 두 개의 SQL 쿼리 "λΈ”λ‘­"을 λ°›μ•˜μŠ΅λ‹ˆλ‹€. ν•˜λ‚˜λŠ” 집단 μ •μ˜ 에 μ‚¬μš©λ˜κ³  λ‹€λ₯Έ ν•˜λ‚˜λŠ” 이전 ν”„λ‘œμ νŠΈμ—μ„œ 후속 데이터 μΆ”μΆœμ— μ‚¬μš©λ©λ‹ˆλ‹€. λ‚˜λŠ” pgAdmin4의 두 "blobs"μ—μ„œ λ³„λ„μ˜ 쿼리 블둝을 μ‹€ν–‰ν•˜λ €κ³  μ‹œλ„ν–ˆμœΌλ©° κ·Έ 쀑 일뢀λ₯Ό μ΄ν•΄ν•œλ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€.

ICUμ—μ„œ ν™˜μžλ₯Ό λ§Œλ‚  λ•Œλ§ˆλ‹€ csv ν˜•μ‹μ˜ ν…Œμ΄λΈ”μ„ 좜λ ₯ν•˜κΈ° μœ„ν•΄ μ–΄λ–»κ²Œ λͺ¨λ“  것을 μ‹€ν–‰ν•  수 μžˆλŠ”μ§€ κΆκΈˆν–ˆμŠ΅λ‹ˆλ‹€.

λ‚΄ μ΅œμ’… μž‘μ—…μ€ 각 csv 파일(및 일뢀 기타 μ „μ²˜λ¦¬)μ—μ„œ 47개의 미리 μ •μ˜λœ κΈ°λŠ₯을 μΆ”μΆœν•œ λ‹€μŒ, νŒλ‹€λ₯Ό μ‚¬μš©ν•˜μ—¬ Matlab λ˜λŠ” Pythonμ—μ„œ μˆ˜ν–‰ν•  수 μžˆμ–΄μ•Ό ν•˜λŠ” λ‹€λ³€μˆ˜ μ‹œκ³„μ—΄μ— κ²°ν•©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

μž¬ν˜„ν•˜λ €λŠ” μ—°κ΅¬μ˜ 데이터 μ„ΈνŠΈλŠ” 이 λ°±μ„œ 의 μ„Ήμ…˜ 8.1 및 8.2에 μžμ„Ένžˆ μ„€λͺ…λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

이런 쑰언을 κ΅¬ν•˜λŠ” 곳은 μ•„λ§ˆ μ—¬κΈ°κ°€ μ μ ˆν•˜μ§€ μ•Šμ„κΉŒμš”? λ”°λΌμ„œ λ‹€λ₯Έ ν”„λ‘œμ νŠΈ/μ—°κ΅¬μ—μ„œ μƒμ†λœ SQL 슀크립트λ₯Ό μ‹€ν–‰ν•˜λŠ” 방법을 λ°°μš°λ €λŠ” μ΄ˆλ³΄μžμ—κ²Œ μΆ”μ²œν•  수 μžˆλŠ” λ‹€λ₯Έ 곳이 μžˆμŠ΅λ‹ˆκΉŒ? 이것은 맀우 일반적인 질문/μž‘μ—…μ΄μ§€λ§Œ 도움이 λ˜λŠ” 곳을 찾을 수 μ—†μ—ˆμŠ΅λ‹ˆκΉŒ?

도움을 μ£Όμ…”μ„œ λŒ€λ‹¨νžˆ κ°μ‚¬ν•©λ‹ˆλ‹€!

κ°€μž₯ μœ μš©ν•œ λŒ“κΈ€

μ—„μ²­λ‚œ! ν–‰μš΄μ„ λΉ•λ‹ˆλ‹€!

λͺ¨λ“  4 λŒ“κΈ€

κΈ€μŽ„, 여기에 같은 λ¬Έμ œκ°€ μžˆμ„ 수 μžˆλŠ” μ™„μ „νžˆ 뉴비λ₯Ό μœ„ν•œ λͺ‡ 가지 팁이 μžˆμŠ΅λ‹ˆλ‹€.

  • μ—¬λŸ¬ 쿼리 블둝을 μ‹€ν–‰ν•˜λ €λ©΄ pgAdmin4μ—μ„œ query tool λ₯Ό μ‚¬μš©ν•˜μ—¬ 각 블둝을 μ„Έλ―Έμ½œλ‘ μœΌλ‘œ λ§ˆλ¬΄λ¦¬ν•˜μ‹­μ‹œμ˜€.

λ¬Έμ œλŠ” Data Output Panel μ—μ„œ λ§ˆμ§€λ§‰ 쿼리만 μ‹€μ œλ‘œ μ‹€ν–‰λœ 것 κ°™μŠ΅λ‹ˆλ‹€. UNION λ˜λŠ” JOIN μ ˆμ„ μ‚¬μš©ν•˜μ—¬ μ–΄λ–»κ²Œλ“  병합해야 ν•©λ‹ˆκΉŒ?

cohort_definition

  • μ΅œμ’… ν…Œμ΄λΈ”μ„ μ €μž₯ν•˜λ €λ©΄, 즉 Postgresμ—μ„œ CSV둜 내보내렀면 COPY 문을 μ‚¬μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€(#214 μ°Έμ‘°).

μ œκ°€ 일반적인 해결책을 μ œμ‹œν•  μˆ˜λŠ” μ—†μ§€λ§Œ μ˜¬λ°”λ₯Έ λ°©ν–₯으둜 μ•ˆλ‚΄ν•΄ λ“œλ¦΄ 수 μžˆμ„ 것 κ°™μŠ΅λ‹ˆλ‹€. λ‚΄κ°€ κ°€μž₯ μ’‹μ•„ν•˜λŠ” μž‘μ—… 방식은 νŠΉμ • κ°œλ…(예: ν™˜κΈ°)에 λŒ€ν•œ λ°μ΄ν„°μ˜ κ΅¬μ²΄ν™”λœ 보기λ₯Ό μƒμ„±ν•˜λŠ” λͺ¨λ“ˆμ‹ SQL 슀크립트λ₯Ό μž‘μ„±ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 그런 λ‹€μŒ λ§ˆμ§€λ§‰μ— μ΄λŸ¬ν•œ λͺ¨λ“  보기λ₯Ό ν•¨κ»˜ κ²°ν•©ν•˜μ—¬ ν•˜λ‚˜μ˜ 큰 ν…Œμ΄λΈ”μ„ λ§Œλ“€κ³  이λ₯Ό CSV둜 좜λ ₯ν•˜κ±°λ‚˜ Python으둜 직접 μ½μŠ΅λ‹ˆλ‹€. SQL을 λ°°μš°λ €λŠ” 경우 도움이 λ˜λŠ” 온라인 μžμŠ΅μ„œκ°€ 많이 μžˆμŠ΅λ‹ˆλ‹€. 특히 κ΅¬μ²΄ν™”λœ λ·°λŠ” λ‚˜μ€‘μ— μ‚¬μš©ν•  수 μžˆλŠ” 쀑간 ν…Œμ΄λΈ”μ„ μƒμ„±ν•˜λŠ” 데 맀우 μœ μš©ν•˜κΈ° λ•Œλ¬Έμ— 읽어볼 κ²ƒμž…λ‹ˆλ‹€(이것이 λ§ˆμ§€λ§‰ μ§ˆλ¬Έμ—μ„œ ν•„μš”ν•œ 것이라고 μƒκ°ν•©λ‹ˆλ‹€).

aline ν•˜μœ„ 폴더(https://github.com/MIT-LCP/mimic-code/tree/master/notebooks/aline)λ₯Ό 보면 μ™„μ „νžˆ μž¬ν˜„ κ°€λŠ₯ν•œ μž„μƒ μ—°κ΅¬μ˜ 예λ₯Ό λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€. ν•΄λ‹Ή ν΄λ”μ—μ„œ μˆ˜ν–‰ν•œ μž‘μ—…κ³Ό 같은 μž‘μ—…μ„ μˆ˜ν–‰ν•˜λŠ” 것이 μ’‹μŠ΅λ‹ˆλ‹€. 당신은 λ‚΄κ°€ λ¨Όμ € "집단"ν…Œμ΄λΈ” 생성 것을 λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€ - κΈ°λ³Έ ν…Œμ΄λΈ”μ„ 생성 λͺ¨λ“ˆ ν˜• SQL 파일의 무리가 μžˆμŠ΅λ‹ˆλ‹€ aline_cohort.sql - λ§ν•œλ‹€ "μ΄κ°€μžˆλŠ” icustay_id λ‚˜λŠ”μ— 관심이 μžˆμ–΄μš” S". 그런 λ‹€μŒ μ΄λŸ¬ν•œ icustay_id λŒ€ν•œ κ°œλ…μ„ μƒμ„±ν•˜κΈ° μœ„ν•΄ μ—¬λŸ¬ λ‹€λ₯Έ 슀크립트λ₯Ό μ‹€ν–‰ν•©λ‹ˆλ‹€. λ§ˆμ§€λ§‰μœΌλ‘œ λ…ΈνŠΈλΆμ€ 이 ν…Œμ΄λΈ”μ—μ„œ λͺ¨λ“  데이터λ₯Ό μΆ”μΆœν•©λ‹ˆλ‹€(aline.ipynb @ [7]). λ…ΈνŠΈλΆμ€ ν•œ 단계 더 λ‚˜μ•„κ°€ μ‹€μ œλ‘œ μœ„μ˜ λͺ¨λ“  쿼리λ₯Ό Pythonμ—μ„œ 직접 μ‹€ν–‰ν•©λ‹ˆλ‹€. μ΅œμ†Œν•œ μ—¬λŸ¬ SQL μΏΌλ¦¬μ—μ„œ 집단/데이터 μ„ΈνŠΈλ₯Ό κ΅¬μΆ•ν•˜λŠ” 방법에 λŒ€ν•œ 아이디어λ₯Ό μ œκ³΅ν•΄μ•Ό ν•©λ‹ˆλ‹€. 도움이 되기λ₯Ό λ°”λžλ‹ˆλ‹€.

μ•ˆλ…•ν•˜μ„Έμš” Alistair @alistairewj , 이 큰 도움을 μ£Όμ…”μ„œ λŒ€λ‹¨νžˆ κ°μ‚¬ν•©λ‹ˆλ‹€. κ°μ‚¬ν•©λ‹ˆλ‹€ :+1:

λ‚˜λŠ” 유치 동λ§₯ μΉ΄ν…Œν„° 연ꡬ(aline study)와 패혈증 3-λͺ¨λ°© λ…ΈνŠΈλΆμ„ 톡해 μ‹œκ°„μ„ νˆ¬μžν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€.

ν•™μŠ΅ 곑선이 쑰금 κ°€νŒŒλ₯΄μ§€λ§Œ 이해가 되기 μ‹œμž‘ν–ˆμŠ΅λ‹ˆλ‹€ :) μ „μž 건강 기둝 의

μ—„μ²­λ‚œ! ν–‰μš΄μ„ λΉ•λ‹ˆλ‹€!

이 νŽ˜μ΄μ§€κ°€ 도움이 λ˜μ—ˆλ‚˜μš”?
0 / 5 - 0 λ“±κΈ‰