أحاول القيام بالتعلم الموزع من البرنامج التعليمي Inception في TensorFlow
بيئة
_Parameter Server_
نظام التشغيل: Ubuntu 16.04 LTS
Tensorflow: ص 0.12
بيثون: 2.7.12
_عامل_
نظام التشغيل: CentOS 7
Tensorflow: ص 0.12
بيثون: 2.7.5
بطاقة وحدة معالجة الرسومات: 2 * GTX NVIDIA 1080
لكنني حصلت على هذا الخطأ:
Traceback (most recent call last):
File "/home/paslab/tensorflow-models/inception/bazel-bin/inception/imagenet_distributed_train.runfiles/inception/inception/imagenet_distributed_train.py", line 66, in <module> tf.app.run()
File "/usr/lib/python2.7/site-packages/tensorflow/python/platform/app.py", line 44, in run _sys.exit(main(_sys.argv[:1] + flags_passthrough)) File "/home/paslab/tensorflow-models/inception/bazel-bin/inception/imagenet_distributed_train.runfiles/inception/inception/imagenet_distributed_train.py", line 62, in main inception_distributed_train.train(server.target, dataset, cluster_spec)
File "/home/paslab/tensorflow-models/inception/bazel-bin/inception/imagenet_distributed_train.runfiles/inception/inception/inception_distributed_train.py", line 120, in train global_step = slim.variables.global_step()
File "/home/paslab/tensorflow-models/inception/bazel-bin/inception/imagenet_distributed_train.runfiles/inception/inception/slim/scopes.py", line 155, in func_with_args return func(*args, **current_args)
File "/home/paslab/tensorflow-models/inception/bazel-bin/inception/imagenet_distributed_train.runfiles/inception/inception/slim/variables.py", line 244, in global_step trainable=False, collections=collections)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 987, in get_variable custom_getter=custom_getter)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 889, in get_variable custom_getter=custom_getter)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 347, in get_variable validate_shape=validate_shape)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 332, in _true_getter caching_device=caching_device, validate_shape=validate_shape)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 683, in _get_single_variable validate_shape=validate_shape)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variables.py", line 226, in __init__ expected_shape=expected_shape)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variables.py", line 303, in _init_from_args initial_value(), name="initial_value", dtype=dtype)
File "/usr/lib/python2.7/site-packages/tensorflow/python/ops/variable_scope.py", line 672, in <lambda> shape.as_list(), dtype=dtype, partition_info=partition_info)
TypeError: zeros_initializer() got multiple values for keyword argument 'dtype'
لقد راجعت المشكلة التالية من قبل
لكن يبدو أنها لا تعمل بشكل جيد
اي فكرة؟ شكرا!
الحل: https://github.com/tensorflow/tensorflow/issues/6202#issuecomment -267445372 (تم العثور عليه من خلال البحث في عنوان مشكلتك على github)
مرحبًا yaroslavvb ،
معلومات بيئتي
_Parameter Server_
نظام التشغيل: Ubuntu 16.04 LTS
Tensorflow: ص 0.12
بايثون: 2.7.12
_عامل_
نظام التشغيل: CentOS 7
Tensorflow: ص 0.12
بايثون: 2.7.5
بطاقة وحدة معالجة الرسومات: 2 * GTX NVIDIA 1080
لقد تحققت بالفعل من ملف ops.py ، والرمز الخاص بي هنا هو
initializer=tf.ones_initializer()
لذلك يبدو أن المشكلة ليست المُهيئ ()
هذا هو سبب طلب المساعدة: P.
هل يجب علي استخدام initializer=tf.constant_initializer()
؟
تحرير: سوف أتحقق من جدار الحماية الخاص بي للعامل ، وأرى ما إذا حدث أي شيء
تم تحديث هذا البرنامج التعليمي إلى واجهة برمجة تطبيقات TF1.0 الجديدة في 20 يناير https://github.com/tensorflow/models/commit/e5079c839058ff40dcbd15515a9cfb462fabbc2a
ستحتاج إلى الترقية إلى إصدار أحدث من TensorFlow لاستخدام هذا الرمز دون تعديل.
يرجى إعادة الفتح إذا لم يؤد ذلك إلى حل مشكلتك.
التعليق الأكثر فائدة
الحل: https://github.com/tensorflow/tensorflow/issues/6202#issuecomment -267445372 (تم العثور عليه من خلال البحث في عنوان مشكلتك على github)