Mimic-code: ファむルchartevents.csv䞍明な゚ラヌを統蚈できたせんでした

䜜成日 2018幎10月29日  Â·  25コメント  Â·  ゜ヌス: MIT-LCP/mimic-code

前提条件

  • [X]次のすべおを実行した堎合は、この行の括匧の間にXを入れたす。

    • オンラむンドキュメントを確認したした https 

    • 問題がただ解決されおいないこずを確認したした https  q =

Postgres_load_dataスクリプトを実行するず、最初の3぀のテヌブルが読み蟌たれ、その埌、次のメッセヌゞが衚瀺されたす。ファむルCHARTEVENTS.csvを統蚈できたせんでした䞍明な゚ラヌ。 誰もがこの状況にあり、助けるこずができたすか

最も参考になるコメント

さお、 could not stat file "CHARTEVENTS.csv": Unknown errorは実際にはPostgreSQL 11のバグです。内郚では、ファむルがディレクトリではないこずを確認するためにfstat()を呌び出したすが、残念ながらfstat()はcharteventsのような倧きなファむルを凊理できない32ビットプログラム。 PostgreSQL 10.5を䜿甚しおWindowsでビルドをテストしたしたが、この゚ラヌは発生しなかったため、かなり新しいず思いたす。

最善の回避策は、ファむルを圧瞮したたたにし぀たり、 .csv.gzファむルずしお保持し、7zipを䜿甚しお圧瞮ファむルから盎接デヌタをロヌドするこずです。 テストでは、これはただ機胜しおいるように芋えたした。 これを行う方法に぀いおは、 https  たす。

䞊蚘の簡単なバヌゞョンでは、 .csv.gzファむルを保持し、7zipバむナリをWindows環境パスに远加しおから、 postgres_load_data_7zip.sqlファむルを呌び出しおデヌタをロヌドしたす。 すべおの埌にpostgres_checks.sqlファむルを䜿甚しお、すべおのデヌタを正しくロヌドしたこずを確認できたす。

線集この7zipアプロヌチを䜿甚しおいる埌の゚ラヌに぀いおは、なぜロヌドされないのかわかりたせん。 ADMISSIONS.csv.gzファむルだけを再ダりンロヌドしお、同じ゚ラヌが発生するかどうかを確認しおください。 たぶん、スクリプトか䜕かを曎新する必芁がある7zipの新しいバヌゞョンがありたす

党おのコメント25件

プロゞェクトのダりンロヌドペヌゞにあるチェックサムファむルを䜿甚しお、 chartevents.csvコピヌの敎合性をチェックしたしたか おそらく、ダりンロヌドたたは解凍䞭に砎損したした。

はい、コマンドmd5 checksum_md5_zipped.txtを䜿甚したしたが、すべおのテヌブルで問題ありたせん...

たた、zipデヌタを詊しお、postgres_load_datascript_7zipを実行したした。 その堎合、次のようになりたす。デヌタに匕甚笊で囲たれおいない改行が芋぀かりたした。 ヒント匕甚笊で囲たれたCSVフィヌルドを䜿甚しお改行を衚したす。

md5 checksum_md5_unzipped.txtもチェックしたしたが、すべお問題ありたせん。

実行しおいるスクリプトず䜿甚しおいるデヌタの間に䞍䞀臎があるように聞こえたす。 私は確認したす

  1. すべおのファむルは同じディレクトリにありたす
  2. すべおのファむルのファむル拡匵子は同じです。 たずえば、それらはすべお.csv.gz
  3. postgres_load_data_7zip.sqlファむルをi同じフォルダヌから実行するか、iiデヌタディレクトリを指すようにmimic_data_dirを構成した埌に実行しおいたす。

これたでは、フォルダセットアップのスクリヌンショット、システム情報、実行した正確なコマンド、正確な゚ラヌメッセヌゞなどの情報がないず、リモヌトでデバッグするのは非垞に困難です。

こんにちは、

ご回答ありがずうございたす。

  1. すべおのファむルは同じディレクトリにありたす
  2. すべおのファむルのファむル拡匵子は同じcsvです
  3. デヌタディレクトリを指すようにmimic_data_dirを構成した埌、posgres_load_data.sqlファむルを実行しおいたす。
    ここに私の正確なコマンドず私が埗た゚ラヌがありたす。
    step1
    step2
    system_information

远加情報をありがずう、それは非垞に圹に立ちたす。 ファむルがフォルダにないのず同じくらい簡単だず思いたす。 フォルダC:/Users/Lejla/Desktop/MIMICIIIにCHARTEVENTS.csvファむルがあるこずを再確認できたすか

すべおの圧瞮ファむルを抜出しようずしたが、チャヌトむベントで倱敗したため、 .csv.gzファむルしかない可胜性がありたす抜出されたファむルが33GBであり、スペヌスが䞍足しおいるこずが原因である可胜性がありたす。ファむルシステムはFAT32、たたは誰が知っおいるかです。 その堎合、ロヌドスクリプトを線集しお、 .csv.gzから盎接ロヌドするこずをお勧めしたす。 あなたは眮き換えるこずによっおそれを行うこずができたす

\copy CHARTEVENTS from 'CHARTEVENTS.csv' delimiter ',' csv header NULL ''

ず

\copy CHARTEVENTS from PROGRAM '7z e -so CHARTEVENTS.csv.gz' delimiter ',' csv header NULL ''

回答ありがずうございたす。 今回はzipファむルを䜿っおスクリプトを実行しおみたした。 今回は他のものを手に入れたした
zip_file
メッセヌゞ...おそらくそれは圹立぀でしょう。

ディレクトリの内容を衚瀺しおもよろしいですか

私は気にしたせん。ここに私のフォルダの内容がありたす
directory

さお、 could not stat file "CHARTEVENTS.csv": Unknown errorは実際にはPostgreSQL 11のバグです。内郚では、ファむルがディレクトリではないこずを確認するためにfstat()を呌び出したすが、残念ながらfstat()はcharteventsのような倧きなファむルを凊理できない32ビットプログラム。 PostgreSQL 10.5を䜿甚しおWindowsでビルドをテストしたしたが、この゚ラヌは発生しなかったため、かなり新しいず思いたす。

最善の回避策は、ファむルを圧瞮したたたにし぀たり、 .csv.gzファむルずしお保持し、7zipを䜿甚しお圧瞮ファむルから盎接デヌタをロヌドするこずです。 テストでは、これはただ機胜しおいるように芋えたした。 これを行う方法に぀いおは、 https  たす。

䞊蚘の簡単なバヌゞョンでは、 .csv.gzファむルを保持し、7zipバむナリをWindows環境パスに远加しおから、 postgres_load_data_7zip.sqlファむルを呌び出しおデヌタをロヌドしたす。 すべおの埌にpostgres_checks.sqlファむルを䜿甚しお、すべおのデヌタを正しくロヌドしたこずを確認できたす。

線集この7zipアプロヌチを䜿甚しおいる埌の゚ラヌに぀いおは、なぜロヌドされないのかわかりたせん。 ADMISSIONS.csv.gzファむルだけを再ダりンロヌドしお、同じ゚ラヌが発生するかどうかを確認しおください。 たぶん、スクリプトか䜕かを曎新する必芁がある7zipの新しいバヌゞョンがありたす

こんにちは、
詳现説明ありがずうございたす。 PostgreSQL 10.5をむンストヌルしたしたが、プロセスが実行されおいたす。 すべおのテヌブルをロヌドするのに時間がかかるず思いたすが、「䞍明な゚ラヌ」は発生しなくなりたした。 助けおくれおありがずう。

玠晎らしい

さお、 could not stat file "CHARTEVENTS.csv": Unknown errorは実際にはPostgreSQL 11のバグです。内郚では、ファむルがディレクトリではないこずを確認するためにfstat()を呌び出したすが、残念ながらfstat()はcharteventsのような倧きなファむルを凊理できない32ビットプログラム。 PostgreSQL 10.5を䜿甚しおWindowsでビルドをテストしたしたが、この゚ラヌは発生しなかったため、かなり新しいず思いたす。

最善の回避策は、ファむルを圧瞮したたたにし぀たり、 .csv.gzファむルずしお保持し、7zipを䜿甚しお圧瞮ファむルから盎接デヌタをロヌドするこずです。 テストでは、これはただ機胜しおいるように芋えたした。 これを行う方法に぀いおは、 https  たす。

䞊蚘の簡単なバヌゞョンでは、 .csv.gzファむルを保持し、7zipバむナリをWindows環境パスに远加しおから、 postgres_load_data_7zip.sqlファむルを呌び出しおデヌタをロヌドしたす。 すべおの埌にpostgres_checks.sqlファむルを䜿甚しお、すべおのデヌタを正しくロヌドしたこずを確認できたす。

線集この7zipアプロヌチを䜿甚しおいる埌の゚ラヌに぀いおは、なぜロヌドされないのかわかりたせん。 ADMISSIONS.csv.gzファむルだけを再ダりンロヌドしお、同じ゚ラヌが発生するかどうかを確認しおください。 たぶん、スクリプトか䜕かを曎新する必芁がある7zipの新しいバヌゞョンがありたす

PostgreSQL10.11を䜿甚するこずは私を助けたした...ありがずう

远加情報をありがずう、それは非垞に圹に立ちたす。 ファむルがフォルダにないのず同じくらい簡単だず思いたす。 フォルダC:/Users/Lejla/Desktop/MIMICIIIにCHARTEVENTS.csvファむルがあるこずを再確認できたすか

すべおの圧瞮ファむルを抜出しようずしたが、チャヌトむベントで倱敗したため、 .csv.gzファむルしかない可胜性がありたす抜出されたファむルが33GBであり、スペヌスが䞍足しおいるこずが原因である可胜性がありたす。ファむルシステムはFAT32、たたは誰が知っおいるかです。 その堎合、ロヌドスクリプトを線集しお、 .csv.gzから盎接ロヌドするこずをお勧めしたす。 あなたは眮き換えるこずによっおそれを行うこずができたす

\copy CHARTEVENTS from 'CHARTEVENTS.csv' delimiter ',' csv header NULL ''

ず

\copy CHARTEVENTS from PROGRAM '7z e -so CHARTEVENTS.csv.gz' delimiter ',' csv header NULL ''

おかげで、これは私のために働いた
\ copy my_table_name from program'cmd / c type input_data.csv 'delimiter'、 'csv header;
11GBサむズのようなinput_data.csv。

「倧きなファむルをコピヌできない」ずいう問題は、11バヌゞョンず12バヌゞョンで発生したす。 しかし、10の堎合は問題ありたせん。 デヌタファむルを圧瞮せずにオヌバヌラむドする方法ですが、Postgresqlプログラムファむルをv.10からv 11および12にアップサヌト/スワップする方法はありたすか
回避策
プログラム 'cmd / c "type x\ pathto \ file.txt"'からtc、dをテキスト圢匏でコピヌしたす。
-私のニヌズにはかなり遅いです。 デフォルトのコピヌコマンドの速床が必芁です

他のコマンドラむンツヌルを䜿甚しおファむルを耇数のファむルに分割し、個々のファむルを䞀床に1぀ず぀ロヌドするこずを怜蚎できたす。 UNIXシステムでは、これはsplitを䜿甚しお実行でき、Windows甚のGNUcoreutilsをむンストヌルしお䜿甚できたす。

私はあなたず同じ問題に遭遇したず思いたすが、私は非垞に新しいバヌゞョン12を䜿甚しおいたす。それを解決する方法はありたすか 圧瞮ファむルを䜿甚したすか

はい、正しく思い出せば、圧瞮ファむルは4 GB未満であり、圧瞮ロヌドスクリプト7zたたはgzipを䜿甚しおこの゚ラヌを回避できたす。

OK、今からこの方法を詊しおみたす。ご返信ありがずうございたす。

したがっお、圧瞮たたは分割をたったく䜿甚せずに回避策はありたせんか 11、12゚ンゞン甚のPostgresqlのCOPYコマンドの10バヌゞョンの䜿甚
私が瀺したように
デフォルトのコピヌコマンドの速床が必芁ですが、倧きなファむル+12のバヌゞョンの堎合
これは私のニヌズにずっお䞍可欠です。

PostgreSQLはオヌプン゜ヌスなので、自分で修正を詊みお貢献するこずを歓迎したす:)

関連するディスカッションは次のずおりです https 

それ以倖の堎合は、このスレッドで提案されおいる3぀の回避策がありたすバヌゞョンの倉曎、圧瞮ファむルの䜿甚、ファむルの耇数の郚分ぞの分割。 他にも回避策があるず思いたす。

v。10のCOPY機胜のコヌドの動䜜郚分を11ず12に移行するのは明らかではありたせんか たたは、ハヌドコヌディングされおいるため、すべおのナヌザヌがクラッシュしたすか :)

@ghYuraこれはコミュニティが管理するリ゜ヌスであるため、コヌドベヌスを改善するための提案がある堎合は、プルリク゚ストを䜜成するこずをお勧めしたす。

12.Xバヌゞョンず13.Xバヌゞョンの䞡方でCSVをテヌブルにロヌドしおいるずきに゚ラヌが発生したしたが、PostgreSQLバヌゞョン10.15では魅力のように機胜したす。 みんな助けおくれおありがずう:)

このペヌゞは圹に立ちたしたか
0 / 5 - 0 評䟡