Doccano: 导出时未填充元数据字段

创建于 2019-06-17  ·  4评论  ·  资料来源: doccano/doccano


系统信息

  • Windows 10,运行最新(于 2019 年 6 月 17 日拉取)Docker 映像
  • Python 版本:不适用,使用 docker 版本

描述问题

该文件指出:

任何其他列(对于 csv)或键(对于 json)都被保留,并将按原样导出到元数据列或键中。

但这不是我正在经历的行为。 我正在使用在 Windows 10 主机上运行的 Docker 映像版本的 Doccano。 对于序列标记项目,我以这种 JSON 行格式导入数据:

{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}

标记数据后,我转到 _Edit Data_ > _Export Data_ 并以 _JSONL_ 或 _JSON(Text-Labels)_ 格式导出(无论哪种方式都会出现问题)。 这是我使用 _JSON (Text-Labels)_ 输出得到的输出:

{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}

没有文档中描述的“元数据”字段,并且“元”字段不包含将带注释的示例连接回我的用例所需的其他相关数据所需的任何元数据。

源代码/日志

不适用

最有用的评论

据我了解,您需要在导入和导出时明确使用“元”键。 就像在https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

所以你的导入看起来像

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

然后您的导出也将包含相同的字段。 这对我行得通。 但我想文档应该更新。

所有4条评论

我今天用 Docker 的最新版本的 Doccano 再次测试了这个,我仍然看到同样的问题。 我相信这将被归类为错误而不是问题,因为它是与文档不一致的行为。

据我了解,您需要在导入和导出时明确使用“元”键。 就像在https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats

所以你的导入看起来像

{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}

然后您的导出也将包含相同的字段。 这对我行得通。 但我想文档应该更新。

请将此添加到文档中。 我今天刚遇到这个问题。

好的 - 我在这里开了一个 PR: https :

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

cohen-ori picture cohen-ori  ·  4评论

atakanokan picture atakanokan  ·  4评论

rebby123 picture rebby123  ·  3评论

BrambleXu picture BrambleXu  ·  4评论

JordanSimba picture JordanSimba  ·  4评论