Mimic-code: رسم خرائط المفاهيم / الأسماء المستعارة

تم إنشاؤها على ١٠ يوليو ٢٠١٦  ·  30تعليقات  ·  مصدر: MIT-LCP/mimic-code

كنت أتساءل عما إذا كان للناس آراء حول مساهمة البيانات التكميلية. لقد بدأت في محاولة تحليل أحداث المخطط ومن المحبط بعض الشيء معرفة أن PaO2 و PaCO2 لهما حوالي 5 أو 6 أسماء عناصر مختلفة لكل منهما. سيكون مفيدًا بشكل خاص إذا تمكنا من التوصل إلى طريقة لتعيين أسماء مستعارة لهم.

من الواضح أنني أفضل عدم تلويث مخطط mimiciii والاحتفاظ بذلك فقط لبيانات MIMIC الأصلية ، ولكن ربما يمكننا إضافة مخطط مساهمة لبيانات مثل هذه؟ (ربما يساهم في توضيح أنه يتوافق مع mimiciii؟)

المساهمات
معرّف_الاسم المستعار
الاسم المستعار

المساهمات. d_items_aliases
row_id
alias_id (المراجع Contrib.aliases.alias_id)
itemid (المراجع d_items.itemid)

يقدم هذا مجموعة كاملة من المشكلات المحتملة ، مرة أخرى فيما يتعلق بإصدار قاعدة البيانات: آمل أن أقوم بتمرير أول معقول لمقاييس مختلفة (PaO2 ، PaCO2 ، pH وما إلى ذلك) ، ولكن قد تأتي نقطة حيث قد يستدير مكثف آخر ونقول أن "SpO2 XYZ" في الواقع ليست هي نفسها "SpO2 ABC" و "SpO2".

هل يتمثل الحل المحتمل في هذه الحالة في إضافة نوع من عمود الإصدار إلى الأسماء المستعارة؟ لذلك إذا قرر شخص ما إجراء تحليله باستخدام إصداراتي المعيبة بشكل لا يصدق من الأسماء المستعارة ، فلا يزال بإمكانه نسخ بياناته أو (نأمل) اختيار الإصدار الأحدث.

هناك مشكلة أخرى يجب مراعاتها مع هذا النوع من المخطط وهي ما إذا كان يجب أن يكون هناك تعيين فريد للعناصر للأسماء المستعارة ، أي هل يمكن لأي شخص نظريًا إنشاء عرض يقوم بتحديد * من مخطط الأحداث والمسامير على عمود يمثل الاسم المستعار؟ أنا أميل إلى المجادلة ضد هذا لأنه من المحتمل أن يمنع الإصدار / تفسيرات الأسماء المستعارة الأخرى وما إلى ذلك.

أفكار؟

التعليق الأكثر فائدة

rustyBilges @ Saqibm128 لقد اتخذنا زمام المبادرة في هذا الأمر ، مما أدى إلى مجموعة البيانات المعيارية الموضحة في هذه المخطوطة والتي يتم استضافة رمزها هنا والمحافظة عليه بواسطة مختبر YerevaNN .

نحن مهتمون جدًا بمساهمة أشخاص آخرين من خلال مساعدتنا في توسيع وإثراء المعيار. إذا كنت ترغب في المشاركة ، توجه إلى مستودع قياس الأداء وابدأ سلسلة رسائل أو أرسل لنا العلاقات العامة. على وجه الخصوص ، فيما يلي مجالات الحاجة:

  • توسيع التعيين لتغطية المتغيرات الإضافية
  • إضافة العلاجات والأدوية والمدخلات لمجموعة البيانات
  • إضافة مهام تنبؤ جديدة
  • أضف الملاحظات السريرية

ال 30 كومينتر

شكرا لبدء هذه المحادثة جيم.

توحيد المفاهيم هو أمر ناقشناه بقدر لا بأس به ، لكننا لم نتطرق إليه بعد. لقد تركنا بالفعل عمودًا فارغًا "conceptid" في جدول d_items ليكون بمثابة عنصر نائب لعناصر العناصر المدمجة.

سوف يبحث parisni في ترسيخ المفاهيم كجزء من رسالة الدكتوراه وأعتقد أن mghassem يعرف من يعمل على ذلك أيضًا.

إذا كنت ترغب في البدء في دمج المفاهيم على الفور ، فسيكون أحد الخيارات هو إنشاء مجلد جديد في MIMIC Code Repository يسمى شيئًا مثل "conceptmaps" ، ثم إضافة برنامج نصي SQL لإنشاء جدول مع تعيين عناصر العناصر إلى مجموعة من المعرفات الموحدة.

يعد تعيين الإصدار مشكلة نحتاج إلى معالجتها عبر الريبو ، ولكن أعتقد أن إضافة عمود "آخر تحديث" إلى خريطة المفهوم سيكون بداية جيدة.

jeblundelltompollard وفقا تبادل البريد الإلكتروني لدينا، لقد بدأت أيضا هذا الجهد، وكذلك مع مساعدة من بلدي متعاون زاك ليبتون من جامعة كاليفورنيا سان دييغو وبعض الناس في كل من مستشفى الأطفال في لوس انجليس وستانفورد. TL ؛ ملخص DR لتعليقاتي:

  • أنا وزاك بصدد إنشاء ونشر بعض مهام السلاسل الزمنية السريرية متعددة المتغيرات ومجموعات البيانات المعيارية - "MNIST" السريرية كما كانت. الأول سيكون متعلقًا بالتصنيف (أي النمط الظاهري). أعرف بعض الأشخاص الآخرين الذين يرغبون في المساهمة في هذا الجهد واستخدام البيانات لأغراض أخرى.
  • هدفنا هو عدم مشاركة مجموعة بيانات محولة فعلية - أو تعديل بيانات MIMIC3 نفسها - ولكن بدلاً من ذلك نشر كود (نصوص بايثون + تكوينات YAML) يمكن لأي شخص لديه تنزيل MIMIC3 استخدامه لإنشاء مجموعة بيانات معيارية. بهذه الطريقة يمكننا تتبع المراجعات المعيارية وإصدارها بشكل صحيح.
  • لقد قمت بالفعل بتعيين ~ 250 معمل ورسمت عناصر للمتغيرات المفاهيمية. لقد قمت بمشاركة ورقة Google التوضيحية معكم يا رفاق ، ولكن إذا كان الآخرون مهتمين ، فيرجى إبلاغي بذلك. تم إجراء التعيين يدويًا وبدون تدخلات كثيرة من الأطباء ، لكنني تعاملت في الغالب مع الحالات الواضحة ، لذلك من المحتمل أن تكون صحيحة في الغالب.
  • لدي خط أنابيب بيثون (مكتوب على عجل) يقوم بإجراء التعيين ، ويتعامل مع تحويلات الوحدات ، ويتعامل مع حالات الحافة (على سبيل المثال ، درجات الحرارة التي تم تمييزها بوضوح F على أنها C) ، إلخ.

ديف

jeblundelltompollard بشأن تلوث المخطط الإصدارات، وما إلى ذلك: أنا كان يميل نحو الحفاظ جهدي منفصلة من مخزن MIMIC3 الأساسية. أرغب في أن يتمكن مجتمع من الباحثين من الاتفاق على معيار معياري واستخدامه دون فرضه على أي شخص آخر. ومع ذلك ، ربما توجد طريقة للحصول على كعكتنا وتناولها أيضًا. ربما يمكن للجهود "الخارجية" لإنشاء تعيينات خاصة بالمهام المضي قدمًا على النحو الذي تراه مناسبًا ، ولكن بعد ذلك يمكن للجهد "الداخلي" المصادق عليه (والذي قد يشمل بعض الأشخاص أنفسهم) تجميع التعليقات من هذه الجهود وإنشاء رسم خرائط أساسي يستمر في متجر MIMIC3 نفسه.

يمكن لنفسي و nickopotamus المساعدة بالتأكيد من وجهة نظر الطبيب وبعض الأعمال

كنت أخطط لتقديم طلب سحب بنهج مؤقت وبعض المدخلات من nickopotamus التي يمكن أن يبنى عليها الفريق / يرفضها ، فهل يمكنني القيام بذلك ومعرفة إلى أين نذهب؟

jeblundell سعيد

بعض الأفكار الإضافية:

  • يجب أن يتمتع إطار عمل الخرائط التعاوني الخاص بنا بعبء منخفض ويجب ألا يفرض سلسلة أدوات معينة (Python ، SQL ، إلخ). على وجه الخصوص ، يجب تخزين "التعيين" (أو تصديره) في تنسيق ملف بسيط يمكن قراءته بواسطة أدوات موجودة في كل مكان ، بدلاً من التشفير الثابت في Python أو SQL. على المدى القصير ، ربما يمكننا البدء بشيء مثل ورقة Google (انتشار) التي قمت بإنشائها.
  • نحن بحاجة إلى التأكد من أن التعاون لا يخلق حواجز للمشاريع الفردية. مثال: تعيين الأشياء للتسميات والأنطولوجيا المعروفة. يعد هذا أمرًا ذا قيمة كبيرة على المدى الطويل ولكنه ليس ضروريًا تمامًا ، على سبيل المثال ، لبناء مجموعات بيانات معيارية لمجتمع ML. سنكون سعداء بأفضل الجهود التي يبذلها خبير إكلينيكي (أو طالب خريج متحمس مسلح بـ Wikipedia) في تحديد المتغيرات ورسم خرائط ITEMs.

شكرًا لجدول البيانات - يبدو أنه قدر كبير من العمل الذي أنجزته ، أحسنت صنعًا!

أتفق تمامًا مع أفكارك بشأن: التنسيق البسيط وحيادية سلسلة الأدوات. يبدو أننا ننجذب نحو CSV بشكل مباشر مثل عمودين من اسم المفهوم و itemid. ما الذي لديك كمخطط عام في الوقت الحالي لتوليد البيانات خلف جدول البيانات هذا؟

تمريرةنا الأولى هي مع alias_id ، ولكن يمكنني دائمًا تكييف نصوص SQL الخاصة بنا بحيث تظل مفيدة لملف CSV ، على سبيل المثال ، سنحاول جعل اسمنا المستعار يتطابق مع أي أسماء لديك في جدول البيانات الخاص بك. ليس عليك القيام بعمل غير ضروري (وسوف نعلمك إذا كنا بحاجة إلى إجراء تغييرات).

قليل من الأشياء من الطب POV:

  • يمكننا - على الأرجح - تجميع الأس الهيدروجيني من ABG و VBG ​​معًا بأمان ، على الرغم من وجود اختلاف منتظم بينهما ، إلا أنه صغير بما يكفي لعدم القلق بشأن أغراضنا. على الرغم من أن هذا مجرد وجهة نظري :)
  • على الرغم من أنك لم تفعل pO2 حتى الآن: بالتأكيد لا يمكن تجميع O2 الشرياني والوريدي معًا.
  • سيكون تجميع ضغط الدم الغازي وغير الغازي معًا مشكلة إلى حد ما ، على الرغم من أنهما مترابطان ، غير جراحي على وجه الخصوص محفوف إلى حد ما بالمشكلات (حجم ضغط الدم ، والوضع ، والآلي مقابل اليدوي ، ووجود الرجفان الأذيني). يثير شيئًا آخر لإضافته إلى كومة القضايا للتعيينات المعقولة: في حالة عدم وجود خط فني ، فإن عدم التدخل هو أفضل من لا شيء. ومع ذلك ، في وجود خط فني (يعمل بشكل كامل) ، من الأفضل على الأرجح تجاهل غير الغازية. لذا فعليًا أن تكون هناك ، في مرحلة ما ، طريقة لتقرير ما إذا كان الخط الفني يعطي قراءات معقولة ، وفي هذه الحالة تخلص من NIBP ، واستخدم ABP فقط ، وإلا استخدم NIBP لأنها قراءة من نوع ما. في الوقت الحالي ، من الأفضل فصلها إلى ABP و NIBP.
  • وبالمثل ، إذا كان لدى المريض وزن لحساب الأدوية فقط ، فهذا تقدير أفضل من لا شيء ، ولكنك ترغب تمامًا في التخلص منه إذا كان هناك وزن فعلي: السبب هو أن بعض جرعات الأدوية ستكون على الوزن المثالي للجسم ، والذي سيكون عادةً أقل بكثير للأشخاص الذين لديهم مؤشر كتلة جسم مرتفع.
  • بشكل أساسي في مرحلة ما (من المؤكد تقريبًا أنه ليس في مسارنا الأول نظرًا لأنه مجموعة كاملة من المشاكل) نحتاج إلى طريقة لكي يكون للأشياء علامة أولوية: شيء يشير إلى "إذا لم يكن هناك شيء مثل هذا اليوم / هذه الدقيقة / هذه الساعة / أيا كان ، عندئذٍ يمكنك استخدام هذا إذا كان يجب أن يكون هو نفسه في الأساس "
  • من الملائم أن بعض الأشياء التي يبدو أنك مفقودة كانت بعض تلك التي بدأت بها (FIO2 ، etCO2 ، pO2 ، pCO2 وما إلى ذلك) ، لذلك نأمل أن تملأ الفراغات. لقد واجهت أيضًا مشكلة مثل مشكلة فهرنهايت مقابل سيليسيوس ، حيث يكون FIO2 أحيانًا 0-100 وأحيانًا 0-1.

سأعمل مع nickopotamus على الانتهاء من مجموعة التعيينات الخاصة بنا ويمكننا بعد ذلك محاولة دمجها مع أولية نهائية (ثم فرز التناقضات المختلفة بيننا). من الجيد أننا قمنا بشكل فعال بمقياس أكثر من شخص واحد للمراجعة المنهجية للتأكد من أننا نغطي جميع القواعد بشكل صحيح!

راجع للشغل ، ما الذي يتوافق مع المتوسط ​​/ stdev؟ بالتأكيد من المعقول جدًا التحقق من القيم المتطرفة المجنونة (وحدات سوء التصرف!) ، على الرغم من أنني قلق قليلاً من وجود مريض واحد بدرجة حموضة <1!

شكرًا jeblundell على

أنا شخصياً سأتعامل مع القيم الوريدية والشريانية بشكل مستقل ؛ هناك اختلافات دقيقة وغير دقيقة بين الغازات الوريدية والشعيرية المركزية والمختلطة والغازات الشريانية. بمجرد تحديدها على هذا النحو ، سيكون الأمر واضحًا لأي تطبيق إكلينيكي يعاملها على أنها مكافئة لتجريد قيمة الرقم الهيدروجيني من الغازات المتاحة.

الأمر نفسه ينطبق على قياسات ضغط الدم: يسمح وضع علامة على NIBP و IBP كمتغيرات مستقلة بإجراء مقارنات بين الاثنين ، الأمر الذي قد يكون مثيرًا للاهتمام بحد ذاته ، وسيكون من التافه استخلاص "ضغط الدم" إذا كانت جميع الأسماء المستعارة المحتملة لـ IBP و NIBP معروف.

تضمين التغريدة

أهلا بكم! هذا يبدو مشابهًا جدًا لشيء كنت أبحث عنه للبدء فيه. ويبدو أنك قد بذلت بالفعل الكثير من العمل الجيد. :) ما نوع المساعدة التي يمكنك استخدامها؟

يبدو "العمل الشاق" مثل ما سأكون مفيدًا له في هذه المرحلة. لدي حق الوصول إلى ويكيبيديا ، وربما أيضًا Google ...

هتافات،

aruberutounickopotamus إذا كنت تفضل حسابات Google Drive ، إلي ويمكنني أن أمنحك حق الوصول إلى جدول البيانات الخاص بي.

turambar شكرا! لقد قمت للتو بإرسال بريد إلكتروني إلى حسابك المدرج. هتافات،

turambarnickopotamusaruberutou سأكون بقوة لصالح تعيين أول يجري عمليات البحث متغير بسيطة، وأنا سعيد أن يكون مراجع إضافية على المتغيرات / ITEM_ID تعيينات. ملاحظة جانبية - هناك مؤلفات غنية حول تعيين الإشارات إلى الأنطولوجيا الموجودة ، ويمكنني التفكير في العديد من الأشخاص الذين سيكونون مهتمين جدًا بالمساهمة بمجرد أن يتحرك المشروع في هذا الاتجاه.

سأقوم بالرد عبر البريد الإلكتروني لقطة. دعنا ننتقل إلى تحرير ملف
جدول. أضفت nickopotamus و aruberutou كمحررين. أي واحد
آخر من يريد الوصول للتعديل ، يرجى إعلامي.

إذا كنتم تريدون "تفكيك" المتغيرات (الغازية وغير الغازية BP ، ودرجة الحموضة ،
O2 جلس ، وما إلى ذلك) ، انطلق وافعل ذلك في العمود "LEVEL1." سوف نحافظ
تجميعي (وربما تجميع المتغيرات الأخرى) في عمود "LEVEL2". إذا
أنت بحاجة إلى تصحيح الأشياء التي قمت بها ، المضي قدمًا.

سأحاول إضافة الأدوية والمدخلات وما إلى ذلك إلى هذا في اليوم أو اليومين المقبلين.

يرجى البدء في تحديد المتغيرات الجديدة! أتمنى أن تساعدوني يا رفاق
تحديد المتغيرات ذات الأهمية وتحديد أولوياتها - أي شيء تضيفه إلى
سيكون المشروع موضع اهتمام بالنسبة لي. إذا كنت بحاجة إلى مكان لتبدأ منه ، فأنا سأفعل ذلك
تشير إلى ثاني أكسيد الكربون في نهاية المد والجزر وإخراج البول ، وهو ما لم أتمكن من القيام به
كشف في MIMIC. ربما أيضًا أي شيء متعلق بالتهوية.

يميل مسار العمل الخاص بي إلى استخدام البحث عن النص (إما متصفح أو أكثر
ورقة قوية "بحث" تسمح بالتعبيرات العادية) للعثور على الأرجح
مرشحين. بالنسبة لمتغير معين ("HR") ، أبحث عن جميع الأسماء ("heart
المعدل ") ، المتغيرات (" معدل النبض ") ، الاختصارات (" HR ") ، الأخطاء الإملائية (" الحرارة
rate ") ، إلخ. أقوم بتمييز جميع المرشحين (ضع" HR "في العمود LEVEL1)
توقف بمجرد انخفاض العد إلى ما دون العتبة (من عشرات إلى مئات ، اعتمادًا على
العدد الإجمالي). بالنسبة لأولئك المرشحين الذين أشعر بالثقة تجاههم ، أضع علامة "X" في
عمود "الاستخدام". في هذه المرحلة ، عادةً ما أسحب جميع القيم للجميع
العناصر المرشحة وانظر إلى التوزيعات (النسب المئوية) لمحاولة التعرف عليها
القضايا المحتملة: القيم المتطرفة ، والوحدات المختلفة ، وما إلى ذلك
غالبًا ما أسلح نفسي ببعض المعلومات السابقة باستخدام ، على سبيل المثال ، ويكيبيديا. :-P

خطوتان أخريان:

1) تحديد النطاقات و "العادي" لكل متغير معين. لدي آخر
جدول بيانات لذلك ، والذي سأشاركه معك. ما أفعله هو تعريف:

  • dropBelow، dropAbove: قيمة أدنى (أعلى) يكون القياس
    من الواضح أنها غير صالحة ويجب إلقائها
  • minValue ، maxValue: القيم الدنيا (القصوى) المسموح بها. أشياء
    أقل من minValue (لكن ليس dropBelow) يتم استبدالها بـ minValue. الشيء نفسه بالنسبة ل
    maxValue و dropAbove.
  • عادي: يستخدم لبعض مخططات التضمين

لاحظ أنه بالنسبة لعملي ، أستخدم أيضًا minValue و maxValue لإعادة قياس الكل
القيم إلى [0 ، 1].

لمعلوماتك ، الائتمان حيث يستحق الائتمان: المصطلحات وهيكل جدول البيانات هذا يرجع إلى David Ledbetter والناس في VPICU في Children's Hospital LA.

2) إذا وجدت متغيرًا يتطلب معالجة خاصة ، مثل الوحدة
التحويل (خاصة إذا كانت الوحدات غامضة أو تم تمييزها بشكل خاطئ) ،
فقط قم بتدوين ملاحظة. في الوقت الحالي ، أتعامل مع هؤلاء على أنه أمر واحد ، ولكن ربما يمكننا ذلك
نظم. سأضيف مستند Google لهذا وأضيف ملاحظات حول الخاص
الحالات التي وجدتها بالفعل ، ثم مشاركتها.

ديف

هتاف ديف. لقد بدأت للتو في البحث في العمل الذي أنجزته بالفعل - مهمة ضخمة!

لقد توصلت إلى عدد من المشكلات التي تبحث في البيليروبين والتي قد يكون من المفيد توضيحها من أجل الاستمرارية وسهولة الرجوع إليها:

  • توجد قياسات لكل من إجمالي البيليروبين في المصل ، والكسور المختلفة (مرتبطة بالبروتين وغير مرتبطة ، مترافقة / مباشرة وغير مقترنة / غير مباشرة). لا يمكن معاملتها على أنها مكافئة لتحليل البيانات.
  • هل لدينا تسمية معيارية للتمييز بين هؤلاء؟ إذا لم يكن الأمر كذلك ، فهل نتفق على واحدة قبل إجراء الكثير من المعالجة؟ لقد بدأت في الاتصال بهم على سبيل المثال إجمالي البيليروبين ولكن هذا ليس أنيقًا للغاية. يمكننا القيام بتعريف نظام لتحطيم الأنواع الفرعية للقياسات.
  • وبالمثل ، هناك أيضًا قياسات مستمرة وقطعية (مثل غمس البول) للبيليروبين في السوائل الأخرى (البول ، السائل النخاعي ، السائل الجنبي) والتي ستحتاج إلى معيار تسمية للتعامل معها
  • أخيرًا ، هناك الكثير من عناصر مخطط الأحداث التي تسجل بحتة ما إذا كان قد تم إرسال البيليروبين ، في الغالب من وحدة حديثي الولادة. هل يجب أن يكون لدينا علم يشير إلى أن أحدنا قد نظر إلى هذه الأشياء وقرر أنها ليست ذات صلة؟

تضمين التغريدة بالمناسبة ، لقد علمتني شيئًا جديدًا لجداول بيانات Google (على سبيل المثال ، استخدام البرامج النصية والمرشحات).

إعادة: البيليروبين ، من الجيد معرفة. أنا متأكد من أنني ارتكبت أخطاء مماثلة في مختبرات أخرى ، على سبيل المثال ، WBC. هل نحب أن نفهم الأنواع المختلفة وخياراتنا للتعامل معها بشكل أفضل (على سبيل المثال ، هل يمكننا دمج الأجزاء المكونة في المجموع؟). أعتقد أنه في ظل وجود بيانات كافية ، فإن نموذجي المفضل (الشبكات العصبية) يمكن أن يتعلم وظائف لدمجها أو ، على سبيل المثال ، تقدير إجمالي البيليروبين حتى مع فقدان بعض المكونات. وبالمثل بالنسبة لتقدير "الرقم الهيدروجيني الحقيقي" الكامن من الأس الهيدروجيني الوريدي أو الشرياني ، على سبيل المثال.

في ملاحظة ذات صلة ، أود أن أفهم الفروق الدقيقة في مختبرات القياس من سوائل الجسم المختلفة. على سبيل المثال ، ما هو الفرق بين الدم ، المصل ، الجنبي ، الاستسقاء ، البول ، سائل المفاصل ، سوائل الجسم الأخرى ، إلخ.

إعادة: التسمية ، افعل ما تعتقد أنه الأفضل في الوقت الحالي. يمكننا التكرار من هناك. سأخطئ في جانب أن أكون وصفيًا. أعلم أنني استخدمت بعض الاختصارات (اصطلاح اعتمدته مجموعة بيانات Physionet Challenge 2012 ، والتي استخدمتها كقائمة مستهدفة من المتغيرات) ، لكنني سأغيرها مرة أخرى إلى الأسماء الكاملة ، على ما أعتقد.

إعادة: تعليم الأشياء على أنها "لا تستخدم" أقترح وضع "n" في عمود الاستخدام. لقد قمت أيضًا بتغيير "x" إلى "y". لم يتم تحديد الإدخالات الفارغة بعد.

أضفت أيضًا عمود ملاحظة في النهاية لإضافة التفسيرات.

turambar يسعدني

سأبدأ في استعراض الأشياء التي قمت بتعيينها بالفعل في إرنست الأسبوع المقبل قبل البدء في المتغيرات الجديدة. هل يستحق الأمر أيضًا ملء علامة FLUID لمعرفات ITEMID حيث لم يتم ملؤها بالفعل؟ هذا من شأنه أن يمنع وجود أسماء مثل bilirubin-serum و bilirubin-CSF ، أو يمكن قياس جميع السوائل المختلفة للصوديوم؟ قد يعني هذا أنه سيتعين عليك تحديد "السائل البيولوجي ذي الأهمية" عند الرغبة في استخراج المتغيرات ؛ أنا شخصياً أعتقد أن هذا يجعل الأمر أكثر وضوحًا للتلاعب ، لكنني سأكون مهتمًا بأفكارك حول كيفية عمل هذا مع التعليمات البرمجية الخاصة بك؟

يجب أن تفرق بين المصل الصفراوي و bili-CSF. لا يمكن خلطها!
آر مارك

إطلاقاrgmark ؛ أفترض أن السؤال الذي أطرحه هو ما هي أفضل طريقة للقيام بذلك. هل نعطي كل اسم مستعار اسمًا وصفيًا يتضمن القياس والسوائل (على سبيل المثال ، "البيليروبين - إجمالي مصل الدم" و "البيليروبين - csf") أم أننا نقدم علمًا سائلًا لكل اسم مستعار (على سبيل المثال ، الاسم = البيليروبين ، السائل = الدم والاسم = البيليروبين ، السائل = csf)؟

استخدم رموز LOINC لجميع المعامل

rgmark هذا هو بالضبط نوع المخطط الذي كنت أبحث عنه - شكرًا!
turambar ربما يمكننا ترميز الأسماء المستعارة باستخدام رموز LOINC ، ثم استخدام البرنامج النصي الخاص بك (+/- جوانب حزم LOINC القابلة للتنزيل) للعثور على المتغيرات المقابلة من الإصدارات التي يمكن للبشر قراءتها؟

مرحبًا بالجميع ، آسف لمجيئي متأخرًا إلى هذه اللعبة ولكني كنت أفكر في المشكلة لفترة من الوقت الآن. أفضل ما يمكن أن أتوصل إليه هو بنية الشجرة التي من شأنها أن تساعد في التعرّف.

يجب أن تكون المشكلات الموضحة أعلاه فيما يتعلق بـ PaO2 و NIBP / BP و Bilirubin ... إلخ قابلة للحل إذا قمنا بتداخل الأسماء المستعارة.

على سبيل المثال ، المستوى الأعلى لـ PaO2 يمكن تقسيمه إلى PaO2 الوريدي ، PaO2 الشرياني ، PaO2 المركزي ، Pulmonary PaO2 أو إذا كان الباحث يرغب في تجاهل الاختلافات تمامًا ، يمكنه فقط استخدام رمز المستوى الأعلى مع الأسماء المستعارة "بالارض".

أفكار حول هذا النهج؟

إن استخدام ngageorange يبدو منطقيًا ، ولكن استخدام الشجرة يثير بعض الالتباس فيما يتعلق بأي نقطة تقوم بالتفرع (باستخدام مثال البيليروبين ، هل تتفرع بشكل كلي / مباشر / غير مباشر ، أو أي سائل؟). أعتقد أن أفضل طريقة هي استخدام أكواد LOINC كما اقترح سكربتاتturambar . راجع https://search.loinc.org/ للحصول على أمثلة.

rgmarknickopotamusngageorange أي اعتراض على استخدام رموز LOINC للمختبرات. لا يوجد سبب لإعادة اختراع الأنطولوجيا حيث يوجد بالفعل - على افتراض أنه سهل الاستخدام. بالطبع ، من المحتمل أن يعمل تعلم مثل هذه البنية من البيانات بشكل أفضل (انظر https://arxiv.org/abs/1602.05568) ، ولكن هذا للعمل في المستقبل!

بجدية ، من وجهة نظري ، أحاول ألا أترك الكمال هو عدو الخير هنا. يريد المتعاونون معي إصدار مجموعة بيانات مرجعية للمهمة في أسرع وقت ممكن ، لذلك سأقوم بأخذ ما لدينا حتى الآن وتقنينه في إصدار أولي. لكنني سأقبل أي تحديثات يمكن أن تجريها يا رفاق في المستقبل القريب!

إذا رغب أي شخص في هذا الموضوع في الحصول على دعوة إلى مستودعي الخاص حيث أقوم بتطوير كود Python لإنشاء مجموعات بيانات معيارية ، فأعلمني بذلك.

نعم من فضلكturambar! كنت أنوي متابعة هذه المحادثة ...

نعم من فضلك turambar - يسعدني تقديم المساعدة أيضًا إذا كنت لا تزال تعمل على هذا!

هل ما زالت هذه منطقة نشطة؟ أو هل ماتت جهود تعيين عنصر تعريف العنصر إلى حد ما؟

rustyBilges @ Saqibm128 لقد اتخذنا زمام المبادرة في هذا الأمر ، مما أدى إلى مجموعة البيانات المعيارية الموضحة في هذه المخطوطة والتي يتم استضافة رمزها هنا والمحافظة عليه بواسطة مختبر YerevaNN .

نحن مهتمون جدًا بمساهمة أشخاص آخرين من خلال مساعدتنا في توسيع وإثراء المعيار. إذا كنت ترغب في المشاركة ، توجه إلى مستودع قياس الأداء وابدأ سلسلة رسائل أو أرسل لنا العلاقات العامة. على وجه الخصوص ، فيما يلي مجالات الحاجة:

  • توسيع التعيين لتغطية المتغيرات الإضافية
  • إضافة العلاجات والأدوية والمدخلات لمجموعة البيانات
  • إضافة مهام تنبؤ جديدة
  • أضف الملاحظات السريرية

تضمين التغريدة لقد تصفحت ما يقرب من الرموز والورق الذي ذكرته من قبل. ولقد كنت أركز على حل ارتباك جدول ID_ITEMS الذي يعد بالتأكيد عملًا شاقًا وهامًا. لذلك يبدو أنه قدر كبير من العمل الذي أنجزته وعمل جيد!
لدي سؤال حول ملف itemid_to_variable_map.csv في https://github.com/YerevaNN/mimic3benchmarks/tree/master/mimic3benchmark/resources ، هناك فقط حوالي 370 ITEMID تم تعيينها بقدر ما أعرف ، لذلك إذا كان هذا العمل لا يزال مستمر ، أود أن أساهم بقوتي.
أطيب التمنيات!

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات