В документации указано:
Любые другие столбцы (для csv) или ключи (для json) сохраняются и будут экспортированы в столбец или ключ метаданных как есть.
Но это не то поведение, которое я испытываю. Я использую версию образа Docker для Doccano, работающую на хосте Windows 10. Для проекта маркировки последовательностей я импортирую данные в этом формате строк JSON:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
После маркировки данных я перехожу к _Edit Data_> _Export Data_ и экспортирую в форматах _JSONL_ или _JSON (Text-Labels) _ (проблема возникает в любом случае). Вот результат, который я получаю с выводом _JSON (Text-Labels) _:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
Нет поля «метаданные», как описано в документации, а поле «мета» не содержит никаких моих метаданных, необходимых для соединения аннотированных примеров с другими соответствующими данными, необходимыми для моего варианта использования.
н / д
Сегодня я снова протестировал это с последней версией Doccano от Docker, я все еще вижу ту же проблему. Я считаю, что это лучше классифицировать как ошибку, чем как вопрос, поскольку такое поведение несовместимо с документацией.
Насколько я понимаю, вам нужно явно использовать "мета" ключ как при импорте, так и при экспорте. Как в https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Итак, ваш импорт будет выглядеть так
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
И тогда ваш экспорт также будет содержать то же поле. Это подходит для меня. Но я полагаю, что документация по этому поводу должна быть обновлена.
Пожалуйста, добавьте это в документацию. Я столкнулся с этой проблемой только сегодня.
Хорошо - я открыл PR здесь: https://github.com/chakki-works/doccano/pull/315
Самый полезный комментарий
Насколько я понимаю, вам нужно явно использовать "мета" ключ как при импорте, так и при экспорте. Как в https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Итак, ваш импорт будет выглядеть так
И тогда ваш экспорт также будет содержать то же поле. Это подходит для меня. Но я полагаю, что документация по этому поводу должна быть обновлена.