Mycroft-core: kesalahan STT

Dibuat pada 24 Jul 2019  ·  18Komentar  ·  Sumber: MycroftAI/mycroft-core

14:02:31.289 - __main__:handle_record_begin:36 - INFO - Begin Recording...
14:02:32.524 - mycroft.client.speech.listener:transcribe:231 - ERROR - list index out of range
14:02:32.524 - mycroft.client.speech.listener:transcribe:232 - ERROR - Speech Recognition could not understand audio

Frekuensi kemunculannya sering.

Komentar yang paling membantu

jika saya mengerti benar Anda secara manual membuat sinyal mendengarkan yang digunakan oleh pendengar pidato, mengapa Anda melakukannya dengan cara ini? jika Anda sering melakukannya (transkripsi langsung tampaknya demikian), Anda akan mengalaminya sepanjang waktu

1 - ketika audio tidak dipahami, ini akan menjadi sebagian besar waktu jika mendengarkan 24/7
2 - ketika permintaan dibatasi tarifnya

jika Anda melakukan ini tolong hentikan, itu bukan penggunaan yang dimaksudkan dan merugikan seluruh komunitas

Anda harus melihat opsi streaming STT, tetapi berhati-hatilah karena dibayar per menit, Anda juga ingin melihat deteksi VAD untuk menghindari pengiriman "diam" ke STT dan membuang kredit

sesuatu seperti Kaldi atau deepspeech mungkin lebih cocok untuk mendengarkan 24/7 jika Anda memiliki sumber daya untuk menjalankannya

Semua 18 komentar

Apakah itu sengaja dipicu atau itu positif palsu?

Apakah itu sengaja dipicu atau itu positif palsu?

Maaf saya kurang mengerti maksud anda. Saya hanya melakukan operasi biasa.
Omong-omong, saya tidak memiliki koneksi internet yang baik di Cina.

Apakah Anda mengatakan "Hei mycroft, lakukan sesuatu" dan itu merespons dengan pesan log di atas? Atau apakah Anda tidak mengatakan apa-apa dan itu diaktifkan secara acak?

Apakah Anda mengatakan "Hei mycroft, lakukan sesuatu" dan itu merespons dengan pesan log di atas? Atau apakah Anda tidak mengatakan apa-apa dan itu diaktifkan secara acak?

Kasus pertama. Jika saya membangunkannya dan tidak mengatakan apa-apa, hampir pasti akan terjadi.

Apakah Anda menggunakan kata bangun khusus atau hanya "hei mycroft"?

Apakah Anda menggunakan kata bangun khusus atau hanya "hei mycroft"?

Saya mengirim sinyal bangun langsung dengan "sentuh startListening"

Tidak tahu apa artinya?

@el-tocino Sepertinya tidak ada hubungannya dengan bangun.

Apakah itu mendengar Anda dengan benar?

Pesan kesalahan yang Anda lihat adalah bahwa audio yang direkam tidak berisi ucapan apa pun yang dapat ditranskripsikan oleh STT.

Ini biasanya terjadi (seperti yang ditunjukkan oleh @el-tocino) ketika mendengarkan dipicu secara salah, yaitu pengintai kata bangun mengira ia mendengar "hey mycroft" dari beberapa musik atau sejenisnya.

Kemungkinan lain:

  • Jika Anda memicu dengan menekan file IPC dan Anda tidak berbicara secara langsung, waktu mendengarkan mungkin habis dan kehilangan kata-kata Anda.
  • Jika ada masalah mikrofon dan audionya hilang atau kualitasnya sangat buruk, ini bisa terjadi.

Pertanyaan terakhir oleh el-tocino sangat relevan dan saya juga penasaran dengan itu.

Apakah itu mendengar Anda dengan benar?

Ya, kadang-kadang berhasil. Dan saya menggunakan pencarian Google Voice untuk menguji mikrofon dan itu baik-baik saja.
@forslund

Saya baru mencoba lima kali lagi, hanya satu yang gagal. Itu terlihat tidak stabil.

Hai HippyK,

Bagaimana Anda memicu startListening dan seberapa sering?

Jika tidak demikian, abaikan saja, namun jika Anda mencoba ide mendengarkan konstan yang Anda sebutkan sebelumnya, API kami akan menolak permintaan tersebut. Menggunakan server kami sebagai layanan STT umum tidak diizinkan. Kami menyediakan layanan ini secara gratis untuk semua pengguna karena kami percaya bahwa setiap orang harus memiliki akses ke asisten suara yang menghormati privasi. Setiap upaya untuk menyalahgunakan layanan tersebut memiliki dampak yang merugikan bagi seluruh Komunitas.

Sekarang memang terlihat benar-benar karena tidak mendengar apa yang saya katakan. Mungkin tip kesalahan pertama dapat dioptimalkan.

jika saya mengerti benar Anda secara manual membuat sinyal mendengarkan yang digunakan oleh pendengar pidato, mengapa Anda melakukannya dengan cara ini? jika Anda sering melakukannya (transkripsi langsung tampaknya demikian), Anda akan mengalaminya sepanjang waktu

1 - ketika audio tidak dipahami, ini akan menjadi sebagian besar waktu jika mendengarkan 24/7
2 - ketika permintaan dibatasi tarifnya

jika Anda melakukan ini tolong hentikan, itu bukan penggunaan yang dimaksudkan dan merugikan seluruh komunitas

Anda harus melihat opsi streaming STT, tetapi berhati-hatilah karena dibayar per menit, Anda juga ingin melihat deteksi VAD untuk menghindari pengiriman "diam" ke STT dan membuang kredit

sesuatu seperti Kaldi atau deepspeech mungkin lebih cocok untuk mendengarkan 24/7 jika Anda memiliki sumber daya untuk menjalankannya

Coba dan lihat menjalankan ini secara lokal jika Anda ingin mendengarkan tanpa henti: https://discourse.mozilla.org/t/new-project-deepspeech-websocket-server-client/32554

@JarbasAI @el-tocino Terima kasih banyak atas saran Anda. Tapi masalah ini tidak ada hubungannya dengan cara Anda bangun. Bangun dengan suara adalah sama. Saya hanya menggunakan baris perintah untuk kenyamanan, dan saya tidak membangunkannya terus menerus.

Jarbas menjelaskan kesalahan secara ringkas di atas. Tanpa perincian yang lebih lengkap akan sulit untuk memberikan bantuan yang relevan.

Apakah halaman ini membantu?
0 / 5 - 0 peringkat