Okuna-api: Postingan multi-bahasa

Dibuat pada 2 Apr 2019  ·  10Komentar  ·  Sumber: OkunaOrg/okuna-api

Dari Ronald di Slack

Mungkin ide yang baik untuk dapat mengatur bahasa pilihan sebelum kita go public. Jika timeline trending penuh dengan posting yang ditulis dalam bahasa Cina itu akan menjadi masalah.

Solusi yang mungkin adalah .. saat on-boarding biarkan orang tersebut memilih bahasa yang disukai, memilih bahasa perangkat saat ini.

Saat seseorang memposting, kami dapat mencoba mendeteksi bahasa dan menampilkannya di suatu tempat setiap saat.

Orang tersebut kemudian dapat mengetuk ini untuk menimpanya jika salah. Kami dapat menampilkan daftar bahasa pilihan terlebih dahulu.

Setelah dua hal ini diatur, kita dapat memfilter garis waktu pada bahasa.

EDIT: Lihat bagian bawah untuk saran terbaru.

medium feature

Komentar yang paling membantu

Saya tidak yakin itu berlaku langsung dengan masalah ini. Tetapi harus dimungkinkan untuk mengubah atribut bahasa. Apalagi dengan postingan yang sangat campur aduk dengan beberapa kata asing, bisa saja terjadi kesalahan bahasa yang disimpan. Bahkan MS Word menghasilkan kesalahan biasa dari pengalaman saya.

Semua 10 komentar

Pilihan lain adalah memiliki tombol terjemahkan.

Kita dapat melihat model terjemahan open-source yang telah dilatih sebelumnya dan mungkin mulai dari sana?

http://opennmt.net/Models/

Seseorang di komentar di OB menyebutkan: https://www.deepl.com/pro.html#pricing

Kami dapat mendeteksi konten bahasa saat memposting secara lokal dengan https://github.com/Mimino666/langdetect

Jadi... Kami akan melakukan ini sebelumnya dan kami akan mengambilnya segera setelah alur pelaporan selesai.

Bagaimana tampilannya sejauh ini adalah:

  1. Deteksi bahasa secara lokal di server dengan pustaka langdetect dan simpan sebagai atribut post.
  2. Saat seseorang mengambil kiriman, periksa apakah bahasa kiriman cocok dengan bahasa perangkat. *1
  3. Jika ya, jangan lakukan apa pun, jika tidak, tampilkan tombol Terjemahkan.
  4. Saat translate ditekan, panggil /postUuid/translate/ api dengan bahasa yang diinginkan.
  5. Server memanggil API terjemahan eksternal dan mengembalikan hasilnya *2

*1 Meskipun bahasa perangkat mungkin berfungsi untuk iterasi pertama, ini harus menjadi sesuatu seperti bahasa pilihan yang dapat di-bootstrap ke bahasa perangkat.

*2 Sejauh ini ada 2 opsi, deepl.com dan API terjemahan AWS.

Deepl terlihat seperti opsi bagus yang berbasis di Jerman dan mengklaim memiliki prinsip privasi yang kuat, tetapi.. itu adalah pihak ketiga lainnya. Menggunakan terjemahan amazon akan menyimpan semuanya dalam ekosistem AWS tetapi mereka mengatakan mereka "dapat" menggunakan konten untuk meningkatkan model terjemahan mereka.

Secara pribadi, saya lebih suka pergi dengan Deepl.

Pikiran disambut seperti biasa.

Berkenaan dengan poin 3, juga harus ada opsi untuk tidak pernah menampilkan tautan terjemahan untuk bahasa tertentu. Perangkat saya disetel ke bahasa Belanda, tetapi saya tidak ingin tombol terjemahkan muncul untuk kiriman bahasa Inggris. Google menambahkan opsi serupa setelah fungsi terjemahan mereka di Chrome menghasilkan banyak reaksi dari orang multibahasa.

Deteksi bahasa tidak sempurna dan akan salah atau tidak mendukung bahasa sama sekali. Bagaimana seharusnya kasus-kasus itu ditangani? Haruskah poster dapat menimpanya jika diperlukan?

Kelemahan dengan deepl (dan mungkin AWS) adalah mereka hanya mendukung pilihan bahasa yang terbatas (sejauh ini). Tentu saja, sebagian besar basis pengguna hanya akan tercakup dalam bahasa Inggris, Jerman, Prancis, dan Spanyol, tetapi beberapa persen sisanya akan memiliki pengalaman yang lebih sedikit.

Bing dan Google sebenarnya bukan pilihan, mengingat masalah privasi.

Kualitas hasil DeepL sangat bagus, tetapi saya setuju bahwa keterbatasan bahasa yang tersedia mungkin menjadi masalah.
Hal lain adalah biaya. Saya tidak tahu tentang AWS tetapi DeepL mengenakan biaya € 4,99 / bulan untuk pengembang ditambah 0,01 ct per 500 karakter.

Terima kasih infonya @oliverzet !

Saat ini, Amazon Translate mendukung terjemahan antara 21 bahasa berikut: Arab, Cina (Sederhana), Cina (Tradisional), Ceko, Denmark, Belanda, Inggris, Finlandia, Prancis, Jerman, Ibrani, Indonesia, Italia, Jepang, Korea, Polandia, Portugis, Rusia, Spanyol, Swedia, dan Turki. Di antara bahasa-bahasa ini, layanan ini mendukung 417 kombinasi terjemahan

Dan untuk harga

image

Tidak yakin seberapa mahal hasilnya, tetapi pasti mendukung lebih banyak bahasa.

@schmitzel76 Pasti, kami akan menambahkan opsi untuk "Jangan pernah menerjemahkan posting BAHASA".

Tidak yakin bagaimana kita harus menangani terjemahan yang salah .

Adapun deepl vs AWS, kami dapat mendesainnya agar dapat diganti sehingga pertanyaannya adalah mana yang harus dicoba terlebih dahulu.

Juga, ini kemungkinan besar hanya akan tersedia untuk posting publik.

Saya tidak yakin itu berlaku langsung dengan masalah ini. Tetapi harus dimungkinkan untuk mengubah atribut bahasa. Apalagi dengan postingan yang sangat campur aduk dengan beberapa kata asing, bisa saja terjadi kesalahan bahasa yang disimpan. Bahkan MS Word menghasilkan kesalahan biasa dari pengalaman saya.

@lifenautjoe Yah, AWS tampaknya lebih murah dan mendukung lebih banyak bahasa. Terjemahan itu sendiri mungkin akan lebih baik dengan DeepL. Di sisi lain biasanya cukup untuk mendapatkan intinya. Jadi sepertinya Amazon adalah pilihan yang lebih baik. Saya tidak tahu bagaimana ini dapat memengaruhi privasi.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat

Masalah terkait

joenepraat picture joenepraat  ·  3Komentar

amirali-asvadi picture amirali-asvadi  ·  3Komentar

lifenautjoe picture lifenautjoe  ·  4Komentar

lifenautjoe picture lifenautjoe  ·  7Komentar

jakoch picture jakoch  ·  3Komentar