该文件指出:
任何其他列(对于 csv)或键(对于 json)都被保留,并将按原样导出到元数据列或键中。
但这不是我正在经历的行为。 我正在使用在 Windows 10 主机上运行的 Docker 映像版本的 Doccano。 对于序列标记项目,我以这种 JSON 行格式导入数据:
{"external_id": "abc12345", "other_field": 5, "text": "hello world"}
{"external_id": "abc12346", "other_field": 2, "text": "this is a test"}
标记数据后,我转到 _Edit Data_ > _Export Data_ 并以 _JSONL_ 或 _JSON(Text-Labels)_ 格式导出(无论哪种方式都会出现问题)。 这是我使用 _JSON (Text-Labels)_ 输出得到的输出:
{"id": 101, "text": "hello world", "meta": {}, "labels": [[0, 6, "Something"]]}
{"id": 102, "text": "this is a test", "meta": {}, "labels": []}
没有文档中描述的“元数据”字段,并且“元”字段不包含将带注释的示例连接回我的用例所需的其他相关数据所需的任何元数据。
不适用
我今天用 Docker 的最新版本的 Doccano 再次测试了这个,我仍然看到同样的问题。 我相信这将被归类为错误而不是问题,因为它是与文档不一致的行为。
据我了解,您需要在导入和导出时明确使用“元”键。 就像在https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
所以你的导入看起来像
{"text": "hello world", "meta": {"external_id": "abc12345", "other_field": 5}}
然后您的导出也将包含相同的字段。 这对我行得通。 但我想文档应该更新。
请将此添加到文档中。 我今天刚遇到这个问题。
好的 - 我在这里开了一个 PR: https :
最有用的评论
据我了解,您需要在导入和导出时明确使用“元”键。 就像在https://github.com/chakki-works/doccano/wiki/Import-and-Export-File-Formats
所以你的导入看起来像
然后您的导出也将包含相同的字段。 这对我行得通。 但我想文档应该更新。