Mimic-code: 关于如何运行从其他项目/研究传递过来的复杂 SQL 脚本的建议?

创建于 2017-09-02  ·  4评论  ·  资料来源: MIT-LCP/mimic-code

嗨,我是 MIMIC-3 和 postgeSQL/pgAdmin 4 的新手。

我一直在研究同类群组选择教程笔记本,并且认为我现在了解了基础知识。

我得到了两个 SQL 查询“blob”,一个用于队列定义,另一个用于从以前的项目中提取后续

我只是想知道如何运行它来为患者的每个 ICU 遭遇以csv格式输出表格?

我的最终任务是从每个 csv 文件中提取 47 个预定义的特征(以及其他一些预处理),然后将它们连接到一个多元时间序列中,我应该能够在 Matlab 或 Python 中使用 Pandas 来完成。

为研究对象,我试图重现该数据集的部分8.1,这8.2详述

我想这可能不是寻求这种建议的正确地方? 因此,对于想要学习如何运行从其他项目/研究继承的 SQL 脚本的新手,您是否可以推荐其他任何地方? 我希望这是一个很常见的问题/任务,但我找不到任何有帮助的地方?

非常感谢您的帮助!

最有用的评论

伟大的! 祝你好运!

所有4条评论

好吧,这里有一些提示,适用于可能有同样问题的新手,

  • 要运行多个查询块,使用 pgAdmin4 中的query tool ,尝试用分号结束每个块;

问题是似乎只有最后一个查询在Data Output Panel实际执行 - 我猜您需要使用UNIONJOIN子句以某种方式合并它们?

cohort_definition

  • 要保存最终表格,即从 Postgres 导出到 CSV,您可以使用COPY语句,请参阅 #214

我不认为我可以提供通用的解决方案,但也许我可以为您指明正确的方向。 我最喜欢的工作方式是编写模块化 SQL 脚本,这些脚本为特定概念(例如通风)创建数据的物化视图。 然后我在最后将所有这些视图组合在一起形成一个大表,然后将其输出到 CSV 或直接读取到 Python 中。 如果您想学习 SQL,那么我相信网上有很多教程可以帮助您解决这个问题。 特别是我会阅读物化视图,因为它们对于创建中间表非常有用,您可以稍后使用这些表(我认为这就是您在上一个问题中所需要的)。

如果您查看aline子文件夹 (https://github.com/MIT-LCP/mimic-code/tree/master/notebooks/aline),您可以看到一个完全可重复的临床研究示例。 我建议做一些类似于该文件夹中所做的事情。 有一堆生成底层表的模块化 SQL 文件——你可以看到我首先生成了一个“队列”表aline_cohort.sql——它说“这些是我感兴趣的icustay_id s”。 然后我运行许多其他脚本来为这些icustay_id生成概念。 最后,笔记本从这些表中提取所有数据(在 aline.ipynb@[7] 中)。 Notebook 更进一步,实际上直接从 Python 运行上述所有查询。 至少它应该让您了解如何从多个 SQL 查询构建群组/数据集。 我希望这有帮助!

嗨,Alistair @alistairewj ,非常感谢您的大力帮助,非常感谢:+1:

我正在花一些时间进行留置动脉导管研究( aline研究)和您的

有点陡峭的学习曲线,但它开始变得有意义:)电子健康记录

伟大的! 祝你好运!

此页面是否有帮助?
0 / 5 - 0 等级