Doccano: لم يتم ملء حقول البيانات الوصفية عند التصدير

تم إنشاؤها على ١٧ يونيو ٢٠١٩  ·  4تعليقات  ·  مصدر: doccano/doccano


معلومات النظام

  • Windows 10 ، يعمل بأحدث صورة Docker (تم سحبها بتاريخ 06/17/2019)
  • إصدار Python : n / a ، باستخدام إصدار عامل ميناء

صف المشكلة

تنص الوثائق:

يتم الاحتفاظ بأي أعمدة أخرى (لـ csv) أو مفاتيح (لـ json) وسيتم تصديرها في عمود البيانات الوصفية أو المفتاح كما هو.

لكن هذا ليس السلوك الذي أواجهه. أنا أستخدم إصدار صورة Docker من Doccano الذي يعمل على مضيف Windows 10. بالنسبة لمشروع وضع العلامات على التسلسل ، أقوم باستيراد البيانات بتنسيق خطوط JSON:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

بعد تسمية البيانات ، أذهب إلى _Edit Data_> _Export Data_ وقم بالتصدير إما بتنسيقات _JSONL_ أو _JSON (Text-Labels) _ (تظهر المشكلة في كلتا الحالتين). هذا هو الإخراج الذي أحصل عليه مع إخراج _JSON (تسميات النص) _:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

لا يوجد حقل "بيانات وصفية" كما هو موضح في الوثائق ، ولا يحتوي حقل "meta" على أي من البيانات الوصفية المطلوبة لضم الأمثلة المشروحة مرة أخرى إلى البيانات الأخرى ذات الصلة المطلوبة لحالة الاستخدام الخاصة بي.

كود المصدر / السجلات

غير متوفر

bug

التعليق الأكثر فائدة

بقدر ما أفهم ، تحتاج إلى استخدام مفتاح "meta" بشكل صريح عند الاستيراد والتصدير. مثل في https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

لذلك سيبدو الاستيراد الخاص بك

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

وبعد ذلك سيحتوي التصدير أيضًا على نفس الحقل. هذا يناسبني. لكن أعتقد أنه يجب تحديث الوثائق بشأن ذلك.

ال 4 كومينتر

لقد اختبرت هذا مرة أخرى اليوم مع أحدث إصدار من Doccano من Docker ، ما زلت أرى نفس المشكلة. أعتقد أنه من الأفضل تصنيف هذا على أنه خطأ وليس سؤالًا لأنه سلوك غير متوافق مع الوثائق.

بقدر ما أفهم ، تحتاج إلى استخدام مفتاح "meta" بشكل صريح عند الاستيراد والتصدير. مثل في https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

لذلك سيبدو الاستيراد الخاص بك

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

وبعد ذلك سيحتوي التصدير أيضًا على نفس الحقل. هذا يناسبني. لكن أعتقد أنه يجب تحديث الوثائق بشأن ذلك.

الرجاء إضافة هذا إلى الوثائق. لقد واجهت هذه المشكلة اليوم.

حسنًا - فتحت العلاقات العامة هنا: https://github.com/chakki-works/doccano/pull/315

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات