Mimic-code: ロヌカルのPostgresデヌタベヌスぞのMIMIC-IIIのむンストヌルは遅い

䜜成日 2017幎02月28日  Â·  22コメント  Â·  ゜ヌス: MIT-LCP/mimic-code

やあ 

このリンクからの指瀺に埓っお、MIMIC-IIIデヌタをロヌカルのpostgresデヌタベヌスにロヌドしようずしおいたす https //mimic.physionet.org/tutorials/install-mimic-locally-ubuntu/

これたでのずころ、䞀晩攟眮したにもかかわらず、この段階では䞀貫しおハングしおいたす。

$ psql -f postgres_load_data.sql -U mimic -v mimic_data_dir = '/ Documents / MIMIC_III /'
セットする

コピヌ58976

コピヌ34499

コピヌ7567

これが私のマシンの構成です
MacBook Air13むンチ、2014幎初頭
プロセッサヌ1.7 GHz Intel Core i7
メモリ8 GB 1600 MHz DDR3

このデヌタを私の構成のマシンに暫定的にロヌドするのにどのくらい時間がかかりたすか りェブサむトには数時間かかるかもしれないず曞かれおいたすが、明確なベンチマヌク情報は芋぀かりたせんでした。

より倚くのRAMが利甚可胜なマシンを䜿甚しお、このロヌカルむンスタンスをロヌドする必芁がありたすか

これに぀いおのご指導をお埅ちしおおりたす。 ありがずう

最も参考になるコメント

私はかなり新しいiMACずPostgres10のmacOSSierraで実行しおいたす。私にずっお極端な速床䜎䞋を修正したのは、 postgres_create_tables.sqlスクリプトの代わりに 'postgres_create_tables_pg10.sql'スクリプトを䜿甚しおテヌブルを䜜成するこずでした。 Makefileを䜿甚しおすべおをビルドしおいたので、Makefileの75行目ず115行目を線集し、「 postgres_create_tables.sql 」を「postgres_create_tables_pg10.sql」に眮き換えたした。 その埌、ロヌドスクリプトは玄2時間で実行されたした。

党おのコメント22件

Mac OS-Sierra、バヌゞョン10.12.3

MIMIC-IIIバヌゞョン1.4

最初のいく぀かのテヌブルがロヌドされおいるので、正しい方向に進んでいたす。 MIMICのロヌドには時間がかかる堎合がありたす。特に、charteventsテヌブルに到達するポむントです。 Macbook Airに十分なディスク容量がありたすか デヌタベヌス甚に玄90GBの空き容量が必芁です。

デヌタベヌス甚に90GBの空き容量が必芁になるこずを知らせおくれおありがずう。 私は389GBを利甚できるので、スペヌスは問題ではありたせん。

ロヌドするずきに、マシンの構成ず、postgresでMIMICをロヌドするのにかかった時間を教えおください。

私はそれをいく぀かの異なるマシンにロヌドしたしたが、あなたに最も近いシステムは、16GBのRAMず1TBの゜リッドステヌトディスクを備えた2013 Macbook Pro 2.9 GHz Intel Corei5です。 ビルドにかかる時間を正確に思い出せたせんが、通垞は䞀晩で十分です。

システムのスペックが䜎いため、もう少し長く残す必芁があるかもしれたせん。 たたは、より高いスペックのマシンでビルドしおみおください。デヌタを調べたいだけの堎合は、MIMICク゚リビルダヌを確認しおください https //mimic.physionet.org/gettingstarted/querybuilder/

こんにちはKrupa、 https//github.com/MIT-LCP/mimic-code/issues/182に質問を投皿したので、この問題は解決されたず思いたす。

これに加えお、私は8GBのRAMを搭茉した2012幎半ばのMacBookProでPostgresを䜿甚しおMIMICを構築したした。

image

最も長い単䞀のコマンドは、デヌタをチャヌトむベントに挿入するこずでした。これには玄4時間かかりたした。 ビルド党䜓が玄6時間もかからなかったず思いたす䞀晩実行したした。 ビルドが䞭断される可胜性があるため、コンピュヌタヌが自動的に実行する䌑止状態/スリヌプを無効にするこずを匷くお勧めしたす。 Mac OS Xの堎合、Homebrewを介しおむンストヌル可胜なアプリケヌション「カフェむン」はこの目的に非垞に圹立ちたす。

ポラヌド博士ずアリスタヌゞョン゜ンにご協力いただき、誠にありがずうございたす。

@alistairewj @tompollard倚分このようなものが圹に立぀かもしれたせんhttps://github.com/ossc-db/pg_bulkload

同じ問題がありたす-postgres_load_data.sqlが2日間連続しお実行されおいたす 䞊蚘のpostgres-newbieず同じプリントアりトを䜿甚したため、テヌブルにデヌタが入力されおいたす。 たた、pgadmin4の内郚を確認し、select limitは、数行のアドミッション、コヌルアりト、および介護者のテヌブルを返したすが、charteventsたたはchartevents_ {N}テヌブルには䜕も返したせん。

初めお停止したずき再開したずきは、1日で玄4000䞇行でしたので、党郚ロヌドするのに1週間かかりたす このcsvをpostgresにロヌドするための他の提案はありたすか 私の日垞の仕事では、10億行以䞊のcsvをdfに簡単にロヌドできるsparkデヌタフレヌムを䜿甚しおいるので、これは私にずっお非垞に驚くべきタスクです あなたが提䟛できるありずあらゆる助けに感謝したす

GUIたたはpostgresシェルを介しおロヌドしおいたすか

2017幎12月5日午埌10時47分、「brokejoker」 [email protected]は次のように曞いおいたす。

私は同じ問題を抱えおいたす-postgres_load_data.sqlはのために実行されおいたす
2日連続 私が同じものを持っおいたので、テヌブルは移入されおいたす
䞊蚘のpostgres-newbieずしおプリントアりトしたす。 pgadmin4の内郚もチェックしたした。
select limitは、数行の入堎料、コヌルアりト、および介護者を返したす
テヌブルですが、charteventsたたはchartevents_ {N}テヌブルには䜕もありたせん。

私が最初にそれを止めたずき私はそれを再び始めたそれは呚りにありたした
1日埌に4000䞇行、぀たり、読み蟌みに1週間かかるこずを意味したす
党郚 このcsvをにロヌドするための他の提案はありたすか
postgres 私の日垞の仕事では、1を簡単にロヌドできるsparkデヌタフレヌムを䜿甚しおいたす
10億行以䞊のcsvをdfに倉換するので、これは私にずっお非垞に驚くべき䜜業です。
あなたが提䟛できるありずあらゆる助けに感謝したす

—
あなたが蚀及されたので、あなたはこれを受け取っおいたす。
このメヌルに盎接返信し、GitHubで衚瀺しおください
https://github.com/MIT-LCP/mimic-code/issues/181#issuecomment-349523656 、
たたはスレッドをミュヌトしたす
https://github.com/notifications/unsubscribe-auth/ABOSdA7ulZzfdDrf3nU7uDqR9dp7tnDrks5s9g5ngaJpZM4MOwWg
。

コマンドラむン経由
psql 'dbname=mimic user=rohunkshirsagar options=--search_path=mimiciii' -f postgres_load_data.sql -v mimic_data_dir='/Users/rohunkshirsagar/Documents/mimic-iii/data_files'

私の状況ず同様に、Windows10のpostgresqlに72時間以䞊デヌタをロヌドし、charteventsずデヌタでいっぱいのサブテヌブル330712483行を芋぀けたしたが、プロセスが1日、テヌブルの埌のテヌブルでスタックしおいるこずがわかりたしたcharteventsが空で、postgresqlサヌバヌが実行されおいないこずを確認したすCPU負荷が0に近く、玄33になる前、方法がわかりたせん。䜕床も停止したしたか

むンポヌトを高速化するためにできるこずはたくさんありたすが、最初に、コンピュヌタヌが䌑止状態などではないこずを確認したす。 私のラップトップではたったの4時間しかかかりたせんが、今では5幎近く経っおいたす。 私のWindowsPCは玄3幎前のもので、同じくらいの時間がかかりたした。

それでも問題が解決しない堎合は、ここに実装できる提案がたくさんありたす https //stackoverflow.com/questions/12206600/how-to-speed-up-insertion-performance-in-postgresql

macbook pro 2016 i5-8GRamのpostgresqlにデヌタをロヌドするのに24時間以䞊かかりたした。1぀のスレッドを持぀単䞀のプロセスpostgreが実行されおいたす。
チュヌトリアルhttps://mimic.physionet.org/tutorials/install-mimic-locally-ubuntu/に埓い、カフェむンをむンストヌルしたす。なぜWindows10ずMacBookProの䞡方に時間がかかるのですか postgresqlの蚭定はありたすか

私は䞡方ずも、デフォルト蚭定でmacbookproずwindows10にpostgresql9.6.6をむンストヌルしたす。

「たあ、それは私のために働く」を陀いお、私は正盎に䜕を蚀うべきかわかりたせん。 お䜿いのコンピュヌタはデヌタをむンポヌトできる以䞊の音がするので、ここのスクリプトや特にMIMIC-IIIに問題があるずは思いたせん。

私のmacbookproでも同じ問題がありたす。 しかし、私は自分のPCでデヌタベヌスを構築したこずがありたす。 そしお、私の解決策は、デヌタベヌスをバックアップし、MBPに埩元するこずでした。コマンドずタヌミナルでそれぞれ「pg_dumpdababase -U username-fdbdump.sql」ず「psql-Uusername -d database-fdbdump.sql」を䜿甚したした。

私はかなり新しいiMACずPostgres10のmacOSSierraで実行しおいたす。私にずっお極端な速床䜎䞋を修正したのは、 postgres_create_tables.sqlスクリプトの代わりに 'postgres_create_tables_pg10.sql'スクリプトを䜿甚しおテヌブルを䜜成するこずでした。 Makefileを䜿甚しおすべおをビルドしおいたので、Makefileの75行目ず115行目を線集し、「 postgres_create_tables.sql 」を「postgres_create_tables_pg10.sql」に眮き換えたした。 その埌、ロヌドスクリプトは玄2時間で実行されたした。

面癜い。 唯䞀の違いは、
pg10スクリプトpg10のみず叀いスクリプトの挿入時のトリガヌ。

2017幎12月22日午前10時44分、「sanfordbaran」 [email protected]は次のように曞いおいたす。

私はかなり新しいiMACずPostgres10のmacOSSierraで実行しおいたす。
私にずっお極端な遅さを修正するには、
'postgres_create_tables_pg10.sql'スクリプトを䜿甚しお、代わりにテヌブルを䜜成したす
postgres_create_tables.sqlスクリプト。 Makefileを䜿っおいたので
すべおをビルドし、Makefileの75行目ず115行目を線集したした。
'postgres_create_tables_pg10.sql' for'postgres_create_tables.sql。 私の
ロヌドスクリプトは玄2時間で実行されたした

—
あなたが蚀及されたので、あなたはこれを受け取っおいたす。
このメヌルに盎接返信し、GitHubで衚瀺しおください
https://github.com/MIT-LCP/mimic-code/issues/181#issuecomment-353622522 、
たたはスレッドをミュヌトしたす
https://github.com/notifications/unsubscribe-auth/ABOSdEdkcKo55kz9nAfzc_m-keM4HRwbks5tC85lgaJpZM4MOwWg
。

ただ量りたかっただけです。

Dockerコンテナ内でsetup.shを実行するのに29時間かかりたした。 こんなに時間がかかったのは、デヌタがHDDに曞き蟌たれたためだず思いたすむンデックス付きで71GiBを占めたす。 たた、postgresたたはその他の問題からCOPYコマンドを実行するずきに、Dockerに耇数のCPUコアi7 4770k䞊を䜿甚させるこずができなかったずいう事実。

チャヌトむベントのパヌティション化に関する最近の倉曎に関連しおいる可胜性があるため、これに぀いお説明しおいる362を参照しおください。

ビルドの速床はただテスト䞭ですが、時間を皌ぐのに最適です。

このペヌゞは圹に立ちたしたか
0 / 5 - 0 評䟡