Mimic-code: نصيحة حول كيفية تشغيل نصوص SQL المعقدة المنقولة من مشاريع / دراسات أخرى؟

تم إنشاؤها على ٢ سبتمبر ٢٠١٧  ·  4تعليقات  ·  مصدر: MIT-LCP/mimic-code

مرحبًا ، أنا جديد على كل من MIMIC-3 و postgeSQL / pgAdmin 4.

لقد كنت أعمل من خلال دفتر الملاحظات التعليمي لاختيار المجموعة النموذجية ، وأعتقد أنني أفهم الأساسيات الآن.

لقد تلقيت "نقطتين" من استعلامات SQL ، أحدهما يستخدم لتعريف المجموعة ، والآخر يستخدم لاستخراج البيانات اللاحقة من مشروع سابق. لقد حاولت تشغيل مجموعات منفصلة من الاستعلامات من كلتا "blobs" في pgAdmin4 ، وأعتقد أنني أفهم أجزاءً منها.

كنت أتساءل ببساطة كيف يمكنني تشغيل كل ذلك لإخراج الجداول بتنسيق csv لكل لقاء في وحدة العناية المركزة للمريض؟

ستكون مهمتي النهائية بعد ذلك استخراج 47 ميزة محددة مسبقًا من كل ملف من ملفات csv (وبعض المعالجة المسبقة الأخرى) ، ثم ضمها في سلسلة زمنية متعددة المتغيرات ، والتي يجب أن أكون قادرًا على القيام بها في Matlab أو Python باستخدام الباندا.

تم تفصيل مجموعة البيانات الخاصة بالدراسة التي أحاول إعادة إنتاجها في القسمين 8.1 و 8.2 من هذه الورقة

أعتقد أن هذا ربما لا يكون المكان المناسب لطلب مشورة كهذه؟ وبالتالي ، هل هناك أي مكان آخر يمكن أن توصي به للمبتدئين الراغبين في تعلم كيفية تشغيل نصوص SQL الموروثة من مشاريع / دراسات أخرى؟ أتوقع أن يكون هذا سؤالًا / مهمة شائعة جدًا ولكني لم أجد أي مكان يساعدني؟

شكرا جزيلا على مساعدتك!

التعليق الأكثر فائدة

باهر! حظا طيبا وفقك الله!

ال 4 كومينتر

حسنًا ، إليك بعض النصائح للمبتدئين تمامًا الذين قد يواجهون نفس المشكلة ،

  • لتشغيل كتل متعددة من الاستعلامات ، باستخدام query tool في pgAdmin4 ، حاول إنهاء كل كتلة بفاصلة منقوطة ؛

المشكلة هي أنه يبدو أن الاستعلام الأخير فقط تم تنفيذه فعليًا في Data Output Panel - أعتقد أنك بحاجة إلى استخدام عبارة UNION أو JOIN لدمجهم بطريقة ما؟

cohort_definition

  • لحفظ جدولك النهائي ، أي للتصدير من Postgres إلى CSV ، يمكنك استخدام كشف COPY ، انظر # 214

لا أعتقد أنه يمكنني تقديم حل عام ولكن ربما يمكنني توجيهك في الاتجاه الصحيح. إن طريقي المفضل في العمل هو كتابة نصوص SQL معيارية تخلق وجهات نظر واقعية للبيانات لمفاهيم معينة (مثل التهوية). ثم أقوم بدمج كل هذه العروض معًا في النهاية لإنشاء جدول واحد كبير ، وأخرجته إلى CSV أو قرأته مباشرةً في Python. إذا كنت تتطلع إلى تعلم SQL ، فأنا متأكد من وجود العديد من البرامج التعليمية عبر الإنترنت للمساعدة في ذلك. على وجه الخصوص ، سأقرأ عن وجهات النظر الفعلية لأنها مفيدة جدًا لإنشاء جداول وسيطة يمكنك استخدامها لاحقًا (أعتقد أن هذا ما تحتاجه في سؤالك الأخير).

إذا نظرت إلى المجلد الفرعي aline (https://github.com/MIT-LCP/mimic-code/tree/master/notebooks/aline) يمكنك رؤية مثال لدراسة إكلينيكية قابلة للتكرار بالكامل. أوصي بعمل شيء مثل ما تم القيام به في هذا المجلد. هناك مجموعة من ملفات SQL المعيارية التي تُنشئ جداول أساسية - يمكنك أن ترى أنني أقوم أولاً بإنشاء جدول "مجموعة نموذجية" aline_cohort.sql - والذي يقول "هذه هي icustay_id s التي أهتم بها". ثم قمت بتشغيل عدد من البرامج النصية الأخرى لإنشاء مفاهيم لهذه icustay_id s. أخيرًا ، يستخرج دفتر الملاحظات جميع البيانات من هذه الجداول (في aline.ipynb @ [7]). لقد قطع الكمبيوتر الدفتري خطوة إلى الأمام ويقوم بالفعل بتشغيل جميع الاستعلامات المذكورة أعلاه مباشرة من Python. يجب أن يمنحك على الأقل فكرة عن كيفية تكوين مجموعة / مجموعة بيانات من استعلامات SQL متعددة. أتمنى أن يساعد ذلك!

مرحبا اليستيرalistairewj، شكرا جزيلا لهذه مساعدة كبيرة انها محل تقدير كبير: +1:

أستثمر بعض الوقت في إجراء دراسة القسطرة الشريانية الساكنة (دراسة ألين) ، بالإنتان .

منحنى تعليمي شديد الانحدار ، لكنه بدأ منطقيًا :) أثبت التحليل الثانوي لسجلات الصحة الإلكترونية أنه مفيد حقًا أيضًا :)

باهر! حظا طيبا وفقك الله!

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات