Okuna-api: Publicaciones en varios idiomas

Creado en 2 abr. 2019  ·  10Comentarios  ·  Fuente: OkunaOrg/okuna-api

De Ronald en Slack

Quizás sea una buena idea poder establecer los idiomas preferidos antes de que se publiquen. Si la línea de tiempo de tendencias está llena de publicaciones escritas en chino, eso será un problema.

Una posible solución es ... en la incorporación, dejar que la persona seleccione los idiomas preferidos, preseleccionando el idioma actual del dispositivo.

Cuando una persona está publicando, podemos intentar detectar el idioma y mostrarlo en algún lugar en todo momento.

La persona puede tocar esto para anularlo si está mal. Primero podemos mostrar la lista de idiomas preferidos.

Una vez configuradas estas dos cosas, podemos filtrar las líneas de tiempo por idioma / s.

EDITAR: Consulte la parte inferior para ver la última sugerencia.

medium feature

Comentario más útil

No estoy seguro de que se aplique directamente a este problema. Pero debería ser posible cambiar el atributo de idioma. Especialmente con publicaciones muy mezcladas con varias palabras extranjeras, puede suceder que se almacene el idioma incorrecto. Incluso MS Word produce errores regulares por mi experiencia.

Todos 10 comentarios

Otra opción es tener un botón de traducción.

¿Podemos buscar modelos de traducción de código abierto previamente capacitados y quizás comenzar desde allí?

http://opennmt.net/Models/

Alguien en los comentarios sobre OB mencionó: https://www.deepl.com/pro.html#pricing

Podemos detectar el contenido de un idioma al publicar localmente con https://github.com/Mimino666/langdetect

Entonces ... Estamos mejorando esto a priori y lo recuperaremos justo después de que se hayan realizado los flujos de informes.

Cómo se ve hasta ahora es:

  1. Detecte el idioma localmente en el servidor con la biblioteca langdetect y guárdelo como un atributo de publicación.
  2. Cuando alguien recupere la publicación, verifique si el idioma de la publicación coincide con el idioma del dispositivo. * 1
  3. Si es así, no haga nada; si no es así, muestre un botón Traducir.
  4. Cuando se presiona traducir, llame a / postUuid / translate / api con el idioma deseado.
  5. El servidor llama a una API de traducción externa y devuelve el resultado * 2

* 1 Aunque el lenguaje del dispositivo puede funcionar para las primeras iteraciones, esto debería convertirse en algo así como el lenguaje preferido que se puede iniciar con el lenguaje del dispositivo.

* 2 Hasta ahora, hay 2 opciones, deepl.com y API de traducción de AWS.

Deepl parece una gran opción, ya que tiene su sede en Alemania y afirma tener principios de privacidad sólidos, pero ... es otro tercero. Usar el traductor de Amazon lo mantendría todo dentro del ecosistema de AWS, pero dicen que "pueden" usar el contenido para mejorar sus modelos de traducción.

Personalmente, prefiero ir con Deepl.

Los pensamientos son bienvenidos como de costumbre.

Con respecto al punto 3, también debería haber una opción para no mostrar nunca un enlace de traducción para un idioma determinado. Mi dispositivo está configurado en holandés, pero no quiero que aparezca el botón de traducción para las publicaciones en inglés. Google agregó una opción similar después de que su función de traducción en Chrome generó una gran cantidad de reacciones negativas por parte de personas multilingües.

La detección de idioma no es perfecta y se equivocará o no es compatible con un idioma en absoluto. ¿Cómo deben manejarse esos casos? ¿Debería el póster poder anularlo si es necesario?

La desventaja de deepl (y tal vez AWS) es que solo admiten una selección limitada de idiomas (hasta ahora). Por supuesto, la mayoría de la base de usuarios se cubrirá solo con inglés, alemán, francés y español, pero el pequeño porcentaje restante tendrá una experiencia menor.

Sin embargo, Bing y Google no son realmente opciones, dadas las preocupaciones sobre la privacidad.

La calidad de los resultados de DeepL es excelente, pero estoy de acuerdo en que la gama limitada de idiomas disponibles podría convertirse en un problema.
Otra cosa son los costos. No sé sobre AWS, pero DeepL cobra 4,99 € / mes para los desarrolladores más 0,01 ct por 500 caracteres.

¡Gracias por la información @oliverzet !

En este momento, Amazon Translate admite la traducción entre los siguientes 21 idiomas: árabe, chino (simplificado), chino (tradicional), checo, danés, holandés, inglés, finlandés, francés, alemán, hebreo, indonesio, italiano, japonés, coreano, Polaco, portugués, ruso, español, sueco y turco. Entre estos idiomas, el servicio admite 417 combinaciones de traducción.

Y por precio

image

No estoy seguro de lo caro que podría resultar, pero definitivamente admite más idiomas.

@ schmitzel76 Definitivamente, agregaremos una opción para "Nunca traducir publicaciones en IDIOMAS".

No estoy seguro de cómo debemos lidiar con las traducciones incorrectas 🤔.

En cuanto a deepl vs AWS, podemos diseñarlo para que sea reemplazable, por lo que la pregunta es cuál probar primero.

Además, lo más probable es que solo esté disponible para publicaciones públicas.

No estoy seguro de que se aplique directamente a este problema. Pero debería ser posible cambiar el atributo de idioma. Especialmente con publicaciones muy mezcladas con varias palabras extranjeras, puede suceder que se almacene el idioma incorrecto. Incluso MS Word produce errores regulares por mi experiencia.

@lifenautjoe Bueno, AWS parece ser menos costoso y admite muchos más idiomas. La traducción en sí probablemente sea mejor con DeepL. Por otro lado, suele ser suficiente para comprender la esencia. Entonces parece que Amazon es la mejor opción. Sin embargo, no sé cómo esto podría afectar la privacidad.

¿Fue útil esta página
0 / 5 - 0 calificaciones

Temas relacionados

lifenautjoe picture lifenautjoe  ·  4Comentarios

amirali-asvadi picture amirali-asvadi  ·  3Comentarios

lifenautjoe picture lifenautjoe  ·  7Comentarios

joenepraat picture joenepraat  ·  3Comentarios

dwt picture dwt  ·  3Comentarios