Okuna-api: Messages multilingues

Créé le 2 avr. 2019  ·  10Commentaires  ·  Source: OkunaOrg/okuna-api

De Ronald sur Slack

C'est peut-être une bonne idée de pouvoir définir les langues préférées avant de devenir public. Si la chronologie des tendances est pleine de messages écrits en chinois, cela posera problème.

La solution possible est... lors de l'intégration, laissez la personne sélectionner les langues préférées, en présélectionnant la langue actuelle de l'appareil.

Lorsqu'une personne poste, nous pouvons essayer de détecter la langue et la montrer quelque part à tout moment.

La personne peut ensuite appuyer dessus pour l'ignorer si elle est erronée. Nous pouvons d'abord afficher la liste des langues préférées.

Une fois ces deux éléments définis, nous pouvons filtrer les chronologies en fonction de la ou des langues.

EDIT: Voir en bas pour la dernière suggestion.

medium feature

Commentaire le plus utile

Je ne suis pas sûr que cela s'applique directement à ce problème. Mais il devrait être possible de changer l'attribut de langue. Surtout avec des messages très mélangés avec plusieurs mots étrangers, il peut arriver que la mauvaise langue soit stockée. Même MS Word produit des erreurs régulières d'après mon expérience.

Tous les 10 commentaires

Une autre option est d'avoir un bouton de traduction.

Nous pouvons examiner des modèles de traductions open source et pré-entraînés et peut-être commencer à partir de là ?

http://opennmt.net/Models/

Quelqu'un dans les commentaires sur OB a mentionné : https://www.deepl.com/pro.html#pricing

On peut détecter le contenu d'une langue en postant localement avec https://github.com/Mimino666/langdetect

Donc... Nous remontons cela en priorité et nous le reprendrons juste après que les flux de rapports soient terminés.

À quoi cela ressemble jusqu'à présent :

  1. Détectez la langue localement sur le serveur avec la bibliothèque langdetect et stockez-la en tant qu'attribut post.
  2. Lorsque quelqu'un récupère la publication, vérifiez si la langue de la publication correspond à la langue de l'appareil. *1
  3. Si c'est le cas, ne faites rien, si ce n'est pas le cas, affichez un bouton Traduire.
  4. Lorsque translate est enfoncé, appelez un /postUuid/translate/ api avec la langue souhaitée.
  5. Le serveur appelle une API de traduction externe et renvoie le résultat *2

*1 Bien que la langue de l'appareil puisse fonctionner pour les premières itérations, cela devrait devenir quelque chose comme la langue préférée qui peut être amorcée à la langue de l'appareil.

*2 Il existe 2 options jusqu'à présent, deepl.com et l'API de traduction AWS.

Deepl semble être une excellente option étant basée en Allemagne et prétendant avoir de solides principes de confidentialité, mais… c'est un autre tiers. L'utilisation de la traduction d'Amazon garderait tout dans l'écosystème AWS, mais ils disent qu'ils "pourraient" utiliser le contenu pour améliorer leurs modèles de traduction.

Personnellement, je préfère aller avec Deepl.

Pensées bienvenues comme d'habitude.

En ce qui concerne le point 3, il devrait également y avoir une option pour ne jamais afficher un lien de traduction pour une certaine langue. Mon appareil est configuré en néerlandais, mais je ne souhaite pas que le bouton de traduction apparaisse pour les publications en anglais. Google a ajouté une option similaire après que sa fonction de traduction dans Chrome ait généré beaucoup de réactions de la part des personnes multilingues.

La détection de la langue n'est pas parfaite et se trompera ou ne prend pas du tout en charge une langue. Comment ces cas doivent-ils être traités ? L'affiche devrait-elle pouvoir la remplacer si nécessaire ?

L'inconvénient de deepl (et peut-être d'AWS) est qu'ils ne prennent en charge qu'une sélection limitée de langues (jusqu'à présent). Bien sûr, une majorité de la base d'utilisateurs sera couverte uniquement par l'anglais, l'allemand, le français et l'espagnol, mais les quelques pour cent restants auront une expérience moindre.

Bing et Google ne sont pas vraiment des options, étant donné les problèmes de confidentialité.

La qualité des résultats de DeepL est excellente, mais je suis d'accord que la gamme limitée de langues disponibles pourrait devenir un problème.
Une autre chose est les coûts. Je ne sais pas pour AWS mais DeepL facture 4,99 € / mois pour les développeurs plus 0,01 ct par 500 caractères.

Merci pour l'info @oliverzet !

À l'heure actuelle, Amazon Translate prend en charge la traduction entre les 21 langues suivantes : arabe, chinois (simplifié), chinois (traditionnel), tchèque, danois, néerlandais, anglais, finnois, français, allemand, hébreu, indonésien, italien, japonais, coréen, polonais, portugais, russe, espagnol, suédois et turc. Entre ces langues, le service prend en charge 417 combinaisons de traduction

Et pour les tarifs

image

Je ne sais pas à quel point cela pourrait coûter cher, mais prend certainement en charge plus de langues.

@ schmitzel76 Certainement, nous ajouterons une option pour "Ne jamais traduire les messages en LANGUE".

Je ne sais pas comment gérer les mauvaises traductions 🤔 .

Quant à deepl vs AWS, nous pouvons le concevoir pour qu'il soit remplaçable, donc la question est de savoir lequel essayer en premier.

De plus, cela ne sera probablement disponible que pour les publications publiques.

Je ne suis pas sûr que cela s'applique directement à ce problème. Mais il devrait être possible de changer l'attribut de langue. Surtout avec des messages très mélangés avec plusieurs mots étrangers, il peut arriver que la mauvaise langue soit stockée. Même MS Word produit des erreurs régulières d'après mon expérience.

@lifenautjoe Eh bien, AWS semble être moins cher et prend en charge beaucoup plus de langues. La traduction elle-même sera probablement meilleure avec DeepL. D'un autre côté, il suffit généralement de comprendre l'essentiel. Il semble donc qu'Amazon soit le meilleur choix. Je ne sais pas comment cela pourrait affecter la vie privée cependant.

Cette page vous a été utile?
0 / 5 - 0 notes

Questions connexes

amirali-asvadi picture amirali-asvadi  ·  3Commentaires

joenepraat picture joenepraat  ·  3Commentaires

lifenautjoe picture lifenautjoe  ·  4Commentaires

lifenautjoe picture lifenautjoe  ·  7Commentaires

maanbsat picture maanbsat  ·  3Commentaires