ストリーミングHDF5(コア外の状況で必要)がTensorflowに実装されると便利です。
この機能のリクエストは非常に広範囲にわたるため、当面は対応しない可能性があります。 課題追跡システムに焦点を合わせ続けるために、この課題を閉じます。
さて、私が実際に求めているのは、ストリーミング/ランダムアクセスの両方をサポートするtf.TextLineReader
沿ったものです。 リクエストは、たとえば#2089の前に出されました。 これらの機能リクエストを常に閉じることの問題は、簡単で新しい投稿を探している人は、TFコードベースへの良い第一歩かもしれませんが、それらを見ることができないかもしれないということです。
+1。 参考までに、 https: //www.tensorflow.org/api_guides/python/reading_dataでは、サポートされているファイル形式はcsv、binary、tfrecordのみです。 しかし、hdf5はかなり一般的な形式です。 大きなデータセットの場合、この例のように、データセット全体を.hdf5形式でロードすることはできません。 https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/learn/hdf5_classification.py。 代わりに、サンプルごとに小さなhdf5ファイルを使用します。
これに対処する唯一の実行可能な方法は、最初にhdf5ファイルをtfrecordまたはバイナリファイルに転送することです。
最も参考になるコメント
さて、私が実際に求めているのは、ストリーミング/ランダムアクセスの両方をサポートする
tf.TextLineReader
沿ったものです。 リクエストは、たとえば#2089の前に出されました。 これらの機能リクエストを常に閉じることの問題は、簡単で新しい投稿を探している人は、TFコードベースへの良い第一歩かもしれませんが、それらを見ることができないかもしれないということです。