Doccano: Поля метаданных не заполняются при экспорте

Созданный на 17 июн. 2019  ·  4Комментарии  ·  Источник: doccano/doccano


Системная информация

  • Windows 10 с последней версией Docker-образа (снято 17.06.2019)
  • Версия Python : нет данных, используется версия докера

Опишите проблему

В документации указано:

Любые другие столбцы (для csv) или ключи (для json) сохраняются и будут экспортированы в столбец или ключ метаданных как есть.

Но это не то поведение, которое я испытываю. Я использую версию образа Docker для Doccano, работающую на хосте Windows 10. Для проекта маркировки последовательностей я импортирую данные в этом формате строк JSON:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

После маркировки данных я перехожу к _Edit Data_> _Export Data_ и экспортирую в форматах _JSONL_ или _JSON (Text-Labels) _ (проблема возникает в любом случае). Вот результат, который я получаю с выводом _JSON (Text-Labels) _:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

Нет поля «метаданные», как описано в документации, а поле «мета» не содержит никаких моих метаданных, необходимых для соединения аннотированных примеров с другими соответствующими данными, необходимыми для моего варианта использования.

Исходный код / ​​логи

н / д

Самый полезный комментарий

Насколько я понимаю, вам нужно явно использовать "мета" ключ как при импорте, так и при экспорте. Как в https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Итак, ваш импорт будет выглядеть так

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

И тогда ваш экспорт также будет содержать то же поле. Это подходит для меня. Но я полагаю, что документация по этому поводу должна быть обновлена.

Все 4 Комментарий

Сегодня я снова протестировал это с последней версией Doccano от Docker, я все еще вижу ту же проблему. Я считаю, что это лучше классифицировать как ошибку, чем как вопрос, поскольку такое поведение несовместимо с документацией.

Насколько я понимаю, вам нужно явно использовать "мета" ключ как при импорте, так и при экспорте. Как в https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Итак, ваш импорт будет выглядеть так

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

И тогда ваш экспорт также будет содержать то же поле. Это подходит для меня. Но я полагаю, что документация по этому поводу должна быть обновлена.

Пожалуйста, добавьте это в документацию. Я столкнулся с этой проблемой только сегодня.

Хорошо - я открыл PR здесь: https://github.com/chakki-works/doccano/pull/315

Была ли эта страница полезной?
0 / 5 - 0 рейтинги