Mimic-code: Saran tentang cara menjalankan skrip SQL rumit yang diteruskan dari proyek/studi lain?

Dibuat pada 2 Sep 2017  ·  4Komentar  ·  Sumber: MIT-LCP/mimic-code

Hai, saya baru mengenal MIMIC-3 dan postgeSQL/pgAdmin 4.

Saya telah mengerjakan buku catatan tutorial pemilihan kelompok , dan saya pikir saya mengerti dasar-dasarnya sekarang.

Saya telah diberi dua "gumpalan" kueri SQL, satu digunakan untuk definisi kelompok , dan gumpalan lain digunakan untuk ekstraksi data berikutnya dari proyek sebelumnya. Saya sudah mencoba menjalankan blok kueri terpisah dari kedua "gumpalan" di pgAdmin4, dan saya pikir saya mengerti sedikit dari mereka.

Saya hanya bertanya-tanya bagaimana saya bisa menjalankan semuanya ke tabel output dalam format csv untuk setiap pertemuan ICU dengan seorang pasien?

Tugas akhir saya adalah mengekstrak 47 fitur yang telah ditentukan sebelumnya dari masing-masing file csv tersebut, (dan beberapa pemrosesan awal lainnya), dan kemudian menggabungkannya ke dalam rangkaian waktu multivarian, yang seharusnya dapat saya lakukan di Matlab atau Python menggunakan pandas.

Kumpulan data untuk studi yang saya coba ulangi dirinci di bagian 8.1 dan 8.2 dari makalah ini

Saya kira ini mungkin bukan tempat yang tepat untuk meminta saran seperti ini? Jadi, apakah ada tempat lain yang dapat Anda rekomendasikan untuk pemula yang ingin mempelajari cara menjalankan skrip SQL yang diwarisi dari proyek/studi lain? Saya berharap ini adalah pertanyaan/tugas yang cukup umum tetapi saya tidak dapat menemukan tempat yang membantu?

Terima kasih banyak atas bantuan Anda!

Komentar yang paling membantu

Besar! Semoga berhasil!

Semua 4 komentar

Nah, inilah beberapa tips untuk pemula yang mungkin memiliki masalah yang sama,

  • Untuk menjalankan beberapa blok kueri, gunakan query tool di pgAdmin4, coba selesaikan setiap blok dengan titik koma;

Masalahnya adalah sepertinya hanya kueri terakhir yang sebenarnya dieksekusi di Data Output Panel - Saya kira Anda perlu menggunakan klausa UNION atau JOIN untuk menggabungkannya entah bagaimana?

cohort_definition

  • Untuk menyimpan tabel final Anda, yaitu untuk mengekspor dari Postgres ke CSV, Anda dapat menggunakan pernyataan COPY , lihat #214

Saya tidak berpikir saya dapat memberikan solusi umum tetapi mungkin saya dapat mengarahkan Anda ke arah yang benar. Cara kerja favorit saya adalah menulis skrip SQL modular yang membuat tampilan data yang terwujud untuk konsep tertentu (mis. ventilasi). Saya kemudian menggabungkan semua tampilan ini bersama di akhir untuk membuat satu tabel besar, dan saya menampilkannya ke CSV atau membacanya langsung ke Python. Jika Anda ingin belajar SQL maka saya yakin ada banyak tutorial online untuk membantu itu. Khususnya saya akan membaca tentang tampilan terwujud karena sangat berguna untuk membuat tabel perantara yang kemudian dapat Anda gunakan nanti (saya pikir itulah yang Anda butuhkan dalam pertanyaan terakhir Anda).

Jika Anda melihat subfolder aline (https://github.com/MIT-LCP/mimic-code/tree/master/notebooks/aline), Anda dapat melihat contoh studi klinis yang sepenuhnya dapat direproduksi. Saya akan merekomendasikan melakukan sesuatu seperti apa yang dilakukan di folder itu. Ada banyak file SQL modular yang menghasilkan tabel yang mendasarinya - Anda dapat melihat bahwa saya pertama kali membuat tabel "kohort" aline_cohort.sql - yang mengatakan "ini adalah icustay_id yang saya minati". Kemudian saya menjalankan sejumlah skrip lain untuk menghasilkan konsep untuk icustay_id . Terakhir, notebook mengekstrak semua data dari tabel ini (di aline.ipynb @ [7]). Notebook telah melangkah lebih jauh dan benar-benar menjalankan semua kueri di atas langsung dari Python. Setidaknya itu akan memberi Anda gambaran tentang bagaimana Anda dapat membangun kohort/set data dari beberapa kueri SQL. Saya harap itu membantu!

Hai Alistair @alistairewj , terima kasih banyak atas bantuan luar biasa ini, sangat dihargai :+1:

Saya menginvestasikan beberapa waktu untuk menjalani studi kateter arteri yang menetap (studi aline), dan

Sedikit kurva pembelajaran yang curam, tetapi mulai masuk akal :) Analisis Sekunder Catatan Kesehatan Elektronik juga terbukti sangat membantu :)

Besar! Semoga berhasil!

Apakah halaman ini membantu?
0 / 5 - 0 peringkat