Doccano: Campos de metadados não preenchidos na exportação

Criado em 17 jun. 2019  ·  4Comentários  ·  Fonte: doccano/doccano


Informação do sistema

  • Windows 10, executando a imagem do Docker mais recente (extraída em 17/06/2019)
  • Versão Python : n / a, usando a versão docker

Descreva o problema

A documentação afirma:

Quaisquer outras colunas (para csv) ou chaves (para json) são preservadas e serão exportadas na coluna de metadados ou chave como estão.

Mas esse não é o comportamento que estou experimentando. Estou usando a versão de imagem Docker do Doccano em execução em um host do Windows 10. Para um projeto de rotulagem de sequência, eu importo dados neste formato de linhas JSON:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

Depois de rotular os dados, vou para _Editar Dados_> _Exportar Dados_ e exporto nos formatos _JSONL_ ou _JSON (Text-Labels) _ (o problema aparece de qualquer maneira). Aqui está a saída que obtenho com a saída _JSON (Text-Labels) _:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

Não há campo "metadados" conforme descrito na documentação, e o campo "meta" não contém nenhum dos meus metadados necessários para juntar os exemplos anotados de volta aos outros dados relevantes necessários para o meu caso de uso.

Código-fonte / logs

n / D

bug

Comentários muito úteis

Pelo que entendi, você precisa usar explicitamente a chave "meta" na importação e na exportação. Como em https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Portanto, sua importação pareceria

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

E então sua exportação também conteria o mesmo campo. Isso funciona para mim. Mas eu acho que a documentação deve ser atualizada sobre isso.

Todos 4 comentários

Eu testei isso novamente hoje com a última versão do Doccano do Docker, ainda estou vendo o mesmo problema. Acredito que isso seria melhor classificado como um bug do que uma pergunta, pois é um comportamento inconsistente com a documentação.

Pelo que entendi, você precisa usar explicitamente a chave "meta" na importação e na exportação. Como em https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

Portanto, sua importação pareceria

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

E então sua exportação também conteria o mesmo campo. Isso funciona para mim. Mas eu acho que a documentação deve ser atualizada sobre isso.

Por favor, adicione isso à documentação. Acabei de encontrar esse problema hoje.

Esta página foi útil?
0 / 5 - 0 avaliações

Questões relacionadas

mathrb picture mathrb  ·  3Comentários

JordanSimba picture JordanSimba  ·  4Comentários

aribornstein picture aribornstein  ·  3Comentários

rebby123 picture rebby123  ·  3Comentários

callmeashish picture callmeashish  ·  3Comentários