A documentação afirma:
Quaisquer outras colunas (para csv) ou chaves (para json) são preservadas e serão exportadas na coluna de metadados ou chave como estão.
Mas esse não é o comportamento que estou experimentando. Estou usando a versão de imagem Docker do Doccano em execução em um host do Windows 10. Para um projeto de rotulagem de sequência, eu importo dados neste formato de linhas JSON:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
Depois de rotular os dados, vou para _Editar Dados_> _Exportar Dados_ e exporto nos formatos _JSONL_ ou _JSON (Text-Labels) _ (o problema aparece de qualquer maneira). Aqui está a saída que obtenho com a saída _JSON (Text-Labels) _:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
Não há campo "metadados" conforme descrito na documentação, e o campo "meta" não contém nenhum dos meus metadados necessários para juntar os exemplos anotados de volta aos outros dados relevantes necessários para o meu caso de uso.
n / D
Eu testei isso novamente hoje com a última versão do Doccano do Docker, ainda estou vendo o mesmo problema. Acredito que isso seria melhor classificado como um bug do que uma pergunta, pois é um comportamento inconsistente com a documentação.
Pelo que entendi, você precisa usar explicitamente a chave "meta" na importação e na exportação. Como em https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Portanto, sua importação pareceria
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
E então sua exportação também conteria o mesmo campo. Isso funciona para mim. Mas eu acho que a documentação deve ser atualizada sobre isso.
Por favor, adicione isso à documentação. Acabei de encontrar esse problema hoje.
Ok - eu abri um PR aqui: https://github.com/chakki-works/doccano/pull/315
Comentários muito úteis
Pelo que entendi, você precisa usar explicitamente a chave "meta" na importação e na exportação. Como em https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
Portanto, sua importação pareceria
E então sua exportação também conteria o mesmo campo. Isso funciona para mim. Mas eu acho que a documentação deve ser atualizada sobre isso.