Okuna-api: 多语言帖子

创建于 2019-04-02  ·  10评论  ·  资料来源: OkunaOrg/okuna-api

来自 Ronald on Slack

也许在我们公开之前能够设置首选语言是个好主意。 如果趋势时间线充满了用中文写的帖子,那将是一个问题。

可能的解决方案是.. 在入职时让人们选择首选语言,预选当前设备语言。

当一个人发帖时,我们可以尝试检测语言并始终在某处显示它。

如果错误,此人可以轻按此选项以覆盖它。 我们可以先显示首选语言列表。

这两件事设置好后,我们可以过滤语言/s 的时间线。

编辑:最新建议见底部。

medium feature

最有用的评论

我不确定这是否直接适用于这个问题。 但是应该可以更改语言属性。 尤其是带有多个外来词的混合帖子,可能会存储错误的语言。 根据我的经验,即使是 MS Word 也会产生定期错误。

所有10条评论

另一种选择是有一个翻译按钮。

我们可以研究开源的、预训练的翻译模型,也许从那里开始?

http://opennmt.net/Models/

有人在 OB 的评论中提到: https :

我们可以使用https://github.com/Mimino666/langdetect在本地发布时检测语言的内容

所以......我们正在优先考虑这个问题,我们会在报告流程完成后立即进行处理。

到目前为止它的样子是:

  1. 使用 langdetect 库在服务器上本地检测语言并将其存储为 post 属性。
  2. 当有人检索帖子时,请检查帖子语言是否与设备语言匹配。 *1
  3. 如果是,则什么都不做,如果不是,则显示翻译按钮。
  4. 当按下 translate 时,使用所需的语言调用 /postUuid/translate/ api。
  5. 服务端调用外部翻译API并返回结果*2

*1 虽然设备语言可能适用于第一次迭代,但这应该成为可以引导到设备语言的首选语言。

*2 目前有 2 个选项,deepl.com 和 AWS 翻译 API。

Deepl 看起来是一个不错的选择,总部设在德国并声称拥有强大的隐私原则,但......它是另一个第三方。 使用亚马逊的翻译可以将其全部保留在 AWS 生态系统中,但他们确实表示他们“可能”使用这些内容来改进他们的翻译模型。

就个人而言,我宁愿和 Deepl 一起去。

想法像往常一样受欢迎。

关于第 3 点,还应该有一个选项,从不显示某种语言的翻译链接。 我的设备设置为荷兰语,但我不希望为英文帖子显示翻译按钮。 谷歌在 Chrome 中的翻译功能引起了多语种人士的强烈反对后,添加了一个类似的选项。

语言检测并非完美无缺,会出错或根本不支持语言。 这些案件应该如何处理? 如果需要,海报是否应该能够覆盖它?

deepl(可能还有 AWS)的缺点是它们只支持有限的语言选择(到目前为止)。 当然,大多数用户群将只使用英语、德语、法语和西班牙语,但剩下的少数用户体验会较差。

不过,考虑到隐私问题,Bing 和 Google 并不是真正的选择。

DeepL 结果的质量很好,但我同意可用语言的有限范围可能会成为一个问题。
另一件事是成本。 我不知道 AWS,但 DeepL 向开发人员收费 4.99 欧元/月,加上每 500 个字符 0.01ct。

感谢@oliverzet提供的信息!

目前,Amazon Translate 支持以下 21 种语言之间的翻译:阿拉伯语、中文(简体)、中文(繁体)、捷克语、丹麦语、荷兰语、英语、芬兰语、法语、德语、希伯来语、印度尼西亚语、意大利语、日语、韩语、波兰语、葡萄牙语、俄语、西班牙语、瑞典语和土耳其语。 在这些语言之间,该服务支持 417 种翻译组合

和定价

image

不确定它可能会变得多么昂贵,但肯定支持更多语言。

@schmitzel76当然,我们将为“从不翻译语言帖子”添加一个选项。

不知道我们应该如何处理错误的翻译🤔。

至于 deepl 与 AWS,我们可以将其设计为可替换的,所以问题只是先尝试​​哪个。

此外,这很可能仅适用于公共帖子。

我不确定这是否直接适用于这个问题。 但是应该可以更改语言属性。 尤其是带有多个外来词的混合帖子,可能会存储错误的语言。 根据我的经验,即使是 MS Word 也会产生定期错误。

@lifenautjoe好吧,AWS 似乎更便宜,并且支持更多的语言。 DeepL 的翻译本身可能会更好。 另一方面,通常足以了解要点。 所以看起来亚马逊是更好的选择。 我不知道这会如何影响隐私。

此页面是否有帮助?
0 / 5 - 0 等级

相关问题

amirali-asvadi picture amirali-asvadi  ·  3评论

joenepraat picture joenepraat  ·  3评论

lifenautjoe picture lifenautjoe  ·  7评论

lifenautjoe picture lifenautjoe  ·  4评论

mitsuhiko picture mitsuhiko  ·  3评论