Mimic-code: 模拟波形

创建于 2016-03-10  ·  13评论  ·  资料来源: MIT-LCP/mimic-code

在 MIMIC-II 查询生成器上有几个与 MIMIC 波形数据库相关的表。 这会在 MIMIC-III 中实现吗?

另外,有没有计划用更多匹配的患者和新的波形更新波形数据库?

最有用的评论

只是一个快速更新:我们很高兴地说,现在正在将一批新的匹配波形上传到 PhysioNet(总共约 1 万名患者)。 上传并检查波形后,即可进行分析。

所有13条评论

有计划更新匹配的数据库。 匹配过程仍在进行中。

关于波形表,我不相信这是分配匹配的最简单方法。 虽然我们会发布某种形式的地图,但它可能不是相对数据库表的形式。

我将暂时保留这个问题,并在有关于波形的更新时重新解决它。

我在这里附上了 MIMIC-III 患者的匹配标题样本:如果您有时间,您能否评论一下这是否是一种有用的格式,以及您是否认为其他信息( HADM_IDICUSTAY_ID ) 会让事情变得更容易。 请参阅此处了解如何使用匹配的波形头:http: //physionet.org/physiobank/database/mimic2wdb/matched/

我们目前不打算将表格添加到 MIMIC-III 临床数据库以匹配波形,但我们确实计划发布标题,例如上述文件中的标题。

感谢 Alistair,我认为标题中最重要的是 ICUSTAY_ID,因为它表示患者何时入院。 标题中列出的当前日期是实际记录开始的时间,而不是入住 ICU 的日期。 因此,如果我们有 ICUSTAY_ID,我应该能够从那里链接其余的患者数据。

有没有录音但没有与之关联的ICUSTAY_ID的情况?

是的,有。 ICUSTAY_ID 和波形记录是独立收集的。 我们必须将它们映射回来,这并不总是微不足道的。 可能会发生许多问题(不同的时钟、带有错误医疗记录编号的波形记录、对齐问题……)。 另外,小的更正,ICUSTAY_ID 在患者进入 ICU 时开始,而不是在医院。 HADM_ID 与医院相关联。

根据我的计算,大约 73% 的记录具有 ICUSTAY_ID,87% 具有 HADM_ID。

这是上述标头到 ICUSTAY_ID/HADM_ID 的映射: mimic-iii-matched-waveforms-sample.xlsx

你好,

我在 APHP 与@parisni合作研究 MIMIC3 数据。
我刚刚找到了这个 csv 文件: https ://physionet.org/physiobank/database/mimic3wdb/matched/matched_waveform_info.csv 我想知道它是否是波形和 HADM_ID/ICUSTAY_ID 之间匹配的最终版本? 另外,你能解释一下“hadm_overlap”、“icusstay_overlap”、“rih”和“rii”列是什么吗?

页面https://mimic.physionet.org/mimicdata/waveforms/表示工作尚未完成,但似乎完成了。

在第 166 期中, @tompollard指出“MIMIC-III 的波形数据库尚未发布,但我们正在努力。”然而,它似乎可以在 /mimic3wdb 获得。

谢谢! :)

感谢您强调此@Dubrzr。 本质上,@alistairewj创建了一个头文件,以将先前发布的波形与 MIMIC-III 临床数据相匹配,但尚未发布其他波形。 我们将更新文档等以澄清这一点。

感谢您的回答,也感谢您的工作! :D

我正在努力获取 .hea 头文件中的所有数据以将其放入数据库中,我想知道将这项工作合并到这个存储库中是否会很有趣。

它是这样工作的:

  1. 从 Physionet 下载所有 .hea 文件到本地目录:
mimic3wdb/
  s00020/
    3544749_0001.hea
    3544749_0002.hea
    3544749_0003.hea
    3544749_0004.hea
    3544749_0005.hea
    3544749_0006.hea
    3544749_0007.hea
    3544749_0008.hea
    3544749_layout.hea
    s00020-2183-04-28-17-47.hea
    s00020-2183-04-28-17-47n.hea
  s00033/
    ....
  ....

  1. 下载matched_waveform_info.csv 以获取有关每条记录的信息
  2. 从所有 .hea 文件中提取所有信息(每个 sxxxxx-yyyy-mm-dd-hh-mm{n}.hea 文件对应一条记录,此标头中列出的每个文件对应一个条目)
  3. 将 csv 文件和 .hea 文件中的元数据写入两个单独的新 csv 文件:

    • wfr.csv 包含一行记录

    • wfe.csv 包含一行的条目

> wfr.csv: record_id, subject_id, starttime, endtime, starting_hadm, ending_hadm, starting_icustay, ending_icustay, hadmmatch, icumatch, rih, rii, hadm_overlap, icustay_overlap, comments
> wfe.csv: record_id, type, segment_index, start_datedatetime, end_datedatetime, nsamp, nsig, fs, fmt, sampsperframe, skew, byteoffset, gain, units, baseline, initvalue, signame, comments

我的脚本可以在这里找到: https ://github.com/Dubrzr/mimic3-scripts

如果您对生成的文件感兴趣,请询问我。

你好,

在探索使用我的脚本收集的数据时,我在头文件中发现了错误的日期。

只有数字的标题(s*n.hea)有这个问题,例如在以下文件中https://physionet.org/physiobank/database/mimic3wdb/matched/s00052/s00052-2191-01-10-02- 21n.hea ,日期是 14/03/3036,而文件名表明日期是 10/01/2191。

有 888 个数字标题存在此问题。
对于相关文件,我可以假设文件名中的日期是正确的吗? 它似乎与录取表一致。

还有完全错误的头文件:

您可以在此处查看所有存在这些问题的文件: https ://gist.github.com/Dubrzr/6a22ae48980a549cc5883f3750ec0578

生成此输出的脚本在这里: https ://github.com/Dubrzr/mimic3-scripts/blob/master/headers_checker.py

谢谢!

感谢您的错误报告。 我将在今天晚些时候修复数据 - 这是一个草率的正则表达式! 文件名中的日期是正确的。 当 PhysioNet 上的数据更新时,我会再次发布。

关于疯狂的岁月,据我所知有四个:

  • s27446/s27446-8838-01-26-18-03
  • s27446/s27446-8838-01-26-18-03n
  • s29799/s29799-8921-03-11-17-16
  • s29799/s29799-8921-03-11-17-16n

不知道为什么这些年是荒谬的。 可能是显示器上的错误设置。 我会像你一样排除它们。

应更新 PhysioNet 上匹配的头文件。 具体来说,您应该只需要重新下载 s#####*.hea 文件。 让我知道您是否成功完成了脚本的下一次迭代!

关于您的脚本,我确实认为它们会引起社区的兴趣,但我们必须考虑将它们放在哪里最好。 现在我会用mimic-iiiphysionet标记您的存储库,这应该会有所帮助。

只是一个快速更新:我们很高兴地说,现在正在将一批新的匹配波形上传到 PhysioNet(总共约 1 万名患者)。 上传并检查波形后,即可进行分析。

这是一个超级激动人心的公告! 非常感谢您的工作!

@bemoody@cx1111是要感谢的人 - 我们会转达你的赞美!

此页面是否有帮助?
0 / 5 - 0 等级