سيكون من الجيد أن يتم تنفيذ بث HDF5 (وهو أمر مطلوب في المواقف الخارجة عن المركز) في Tensorflow.
طلب الميزة هذا واسع جدًا ، ومن المحتمل ألا نعمل عليه في المستقبل المنظور. للحفاظ على تركيز أداة تعقب المشكلة ، سأغلق هذه المشكلة.
حسنًا ، ما أطلبه حقًا هو شيء على غرار tf.TextLineReader
يدعم كلا من البث المباشر / الوصول العشوائي. جاء الطلب قبل على سبيل المثال في # 2089. تكمن مشكلة إغلاق طلبات الميزات هذه دائمًا في أن الأشخاص الذين يبحثون عن مساهمات سهلة وجديدة قد لا يروها ، على الرغم من أنها قد تكون خطوة أولى جيدة في قاعدة رمز TF.
+1. كمرجع ، في https://www.tensorflow.org/api_guides/python/reading_data ، تنسيق الملف المدعوم هو csv و binary و tfrecord فقط. لكن hdf5 هو تنسيق شائع جدًا. بالنسبة لمجموعات البيانات الكبيرة ، لا يمكن تحميل مجموعة بيانات كاملة بتنسيق .hdf5 مرة واحدة مثل هذا المثال. https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/learn/hdf5_classification.py. بدلاً من ذلك ، نستخدم ملفات hdf5 صغيرة لكل عينة.
الطريقة الوحيدة الممكنة للتعامل مع هذا هي نقل ملف hdf5 إلى tfrecord أو ملف ثنائي أولاً.
التعليق الأكثر فائدة
حسنًا ، ما أطلبه حقًا هو شيء على غرار
tf.TextLineReader
يدعم كلا من البث المباشر / الوصول العشوائي. جاء الطلب قبل على سبيل المثال في # 2089. تكمن مشكلة إغلاق طلبات الميزات هذه دائمًا في أن الأشخاص الذين يبحثون عن مساهمات سهلة وجديدة قد لا يروها ، على الرغم من أنها قد تكون خطوة أولى جيدة في قاعدة رمز TF.