Okuna-api: 多言語の投稿

作成日 2019年04月02日  ·  10コメント  ·  ソース: OkunaOrg/okuna-api

Ronald onSlackから

公開する前に、優先言語を設定できるようにすることをお勧めします。 トレンドのタイムラインが中国語で書かれた投稿でいっぱいの場合、それは問題になるでしょう。

考えられる解決策は、オンボーディングで、現在のデバイス言語を事前に選択して、ユーザーが優先言語を選択できるようにすることです。

人が投稿しているとき、私たちは言語を検出し、これをいつでもどこかに表示しようとすることができます。

次に、これをタップして、間違っている場合は上書きできます。 最初に優先言語リストを表示できます。

これら2つの設定が完了したら、言語でタイムラインをフィルタリングできます。

編集:最新の提案については下を参照してください。

medium feature

最も参考になるコメント

それがこの問題に直接当てはまるかどうかはわかりません。 ただし、言語属性を変更することは可能です。 特に、いくつかの外国語が含まれる非常に混合された投稿では、間違った言語が保存される可能性があります。 MS Wordでさえ、私の経験から定期的にエラーが発生します。

全てのコメント10件

別のオプションは、翻訳ボタンを持つことです。

オープンソースの事前トレーニング済みの翻訳モデルを調べて、そこから始めることができますか?

http://opennmt.net/Models/

OBに関するコメントの誰かが言及しました: https

https://github.com/Mimino666/langdetectを使用して、ローカルに投稿することで言語のコンテンツを検出でき

だから...私たちはこれをprioでぶつけており、レポートフローが完了した直後にそれを拾います。

これまでのところ、次のようになります。

  1. langdetectライブラリを使用してサーバー上でローカルに言語を検出し、post属性として保存します。
  2. 誰かが投稿を取得したら、投稿の言語がデバイスの言語と一致するかどうかを確認します。 * 1
  3. 表示される場合は何もせず、表示されない場合は[翻訳]ボタンを表示します。
  4. 翻訳が押されたら、目的の言語で/ postUuid / translate / apiを呼び出します。
  5. サーバーは外部翻訳APIを呼び出し、結果を返します* 2

* 1デバイス言語は最初の反復で機能する可能性がありますが、これはデバイス言語にブートストラップできる優先言語のようなものになるはずです。

* 2これまでのところ、deepl.comとAWS翻訳APIの2つのオプションがあります。

Deeplは、ドイツに拠点を置き、強力なプライバシー原則を持っていると主張する優れたオプションのように見えますが、それは別のサードパーティです。 アマゾンの翻訳を使用すると、すべてがAWSエコシステム内に保持されますが、翻訳モデルを改善するためにコンテンツを「使用する可能性がある」と彼らは言います。

個人的には、Deeplを使いたいと思います。

いつものように思いを歓迎しました。

ポイント3に関しては、特定の言語の翻訳リンクを表示しないオプションもあるはずです。 デバイスがオランダ語に設定されていますが、英語の投稿に翻訳ボタンを表示したくありません。 Googleは、Chromeの翻訳機能が多言語の人々から多くの反発を生み出した後、同様のオプションを追加しました。

言語検出は完璧ではなく、間違っているか、言語をまったくサポートしていません。 それらのケースはどのように処理する必要がありますか? ポスターは必要に応じてそれを上書きできるべきですか?

deepl(そしておそらくAWS)の欠点は、(これまでのところ)限られた言語の選択しかサポートしていないことです。 もちろん、ユーザーベースの大部分は英語、ドイツ語、フランス語、スペイン語だけでカバーされますが、残りの数パーセントは経験が少なくなります。

ただし、プライバシーの懸念から、BingとGoogleは実際には選択肢ではありません。

DeepLの結果の品質は素晴らしいですが、利用可能な言語の範囲が限られていることが問題になる可能性があることに同意します。
もう一つはコストです。 AWSについてはわかりませんが、DeepLの料金は開発者に月額4.99ユーロ、さらに500文字あたり0.01カラットです。

情報をありがとう@oliverzet

現時点では、Amazon Translateは、アラビア語、中国語(簡易)、中国語(従来)、チェコ語、デンマーク語、オランダ語、英語、フィンランド語、フランス語、ドイツ語、ヘブライ語、インドネシア語、イタリア語、日本語、韓国語、ポーランド語、ポルトガル語、ロシア語、スペイン語、スウェーデン語、トルコ語。 これらの言語間で、サービスは417の翻訳の組み合わせをサポートします

そして価格設定のために

image

それがどれほど高価になるかはわかりませんが、間違いなくより多くの言語をサポートしています。

@ schmitzel76間違いなく、「言語の投稿を翻訳しない」オプションを追加します。

間違った翻訳にどのように対処すべきかわからない🤔。

deeplとAWSについては、交換可能になるように設計できるため、どちらを最初に試すかが問題になります。

また、これはおそらく公開投稿でのみ利用可能になります。

それがこの問題に直接当てはまるかどうかはわかりません。 ただし、言語属性を変更することは可能です。 特に、いくつかの外国語が含まれる非常に混合された投稿では、間違った言語が保存される可能性があります。 MS Wordでさえ、私の経験から定期的にエラーが発生します。

@lifenautjoeええと、AWSは安価で、はるかに多くの言語をサポートしているようです。 翻訳自体はおそらくDeepLの方が優れているでしょう。 一方、要点を理解するには通常は十分です。 したがって、Amazonがより良い選択であるように見えます。 しかし、これがプライバシーにどのように影響するかはわかりません。

このページは役に立ちましたか?
0 / 5 - 0 評価

関連する問題

amirali-asvadi picture amirali-asvadi  ·  3コメント

lifenautjoe picture lifenautjoe  ·  7コメント

joenepraat picture joenepraat  ·  3コメント

lifenautjoe picture lifenautjoe  ·  4コメント

ipython picture ipython  ·  3コメント