Comments (12)
Опцию добавлю.
Хуже распознает голос если говорить вместе с терминалом или всегда? Если всегда то наверное это из-за того что настройка energy_threshold
начинается параллельно с проигрыванием динга. Я это уберу. Если не поможет то можно вернуть опционально старый, блокирующий, режим когда распознавание начинается после произнесения фразы. У меня проблемы с распознаванием только когда вместе с терминалом говорю.
Это фишка мжд, он просто присылает tts: и фразу.
from mdmterminal2.
Я жду 1-2 секунды пока скрипт договорит привет-привет и после говорю любую фразу.
И после этого слышу "ничего не слышно повторите ваш запрос", на повторный запрос распознает чуть лучше, но все же не всегда
Судя по логам она слышит саму себя же, сразу пишет и отправляет не слушая мои команды
2018.11.10 19:56:25 Player: Играю /home/pi/mdmTerminal2/src/resources/ding.wav ...
2018.11.10 19:56:25 STT: audio devices: 8
2018.11.10 19:56:27 Player: Играю /home/pi/mdmTerminal2/src/tts_cache/yandex_4b58df8fc29194825234f34a49272b65b5552ad9.mp3 ...
2018.11.10 19:56:29 STT: Голос записан за 2.69 sec
2018.11.10 19:56:31 Player: Играю /home/pi/mdmTerminal2/src/resources/dong.wav ...
Насчет фишки надо бы попросить Сергея чтоб он и "важность" отправлял в терминал, а тут уже перехватывать и обрабатывать.
from mdmterminal2.
c no_hello = 1 распознает лучше, спасибо
from mdmterminal2.
А так, если отключить no_hello? Да, она себя слышит т.к. распознавание идет параллельно с воспроизведением. Но свой голос записывать не должна. Позже добавлю режим без параллельного воспроизведения.
Может просто не отправлять сообщения если приоритет ниже?
from mdmterminal2.
Еще проблему нашел. Скрипт слышит еще и "Сигнал перед сообщением:", записывает и отправляет его как голос и поэтому не слышит тебя.
У меня терминал стоит на той же малине где мжд. тут или не отправлять сообщение в терминал и говорить встроенным яндексом(который работает медленней чем скрипт) или использовать терминал и отключить яндекс, но тогда болтает всё.
Сейчас почему то после обновления мжд сломался синтез. говорит ошибка синтеза речи, но модуль яндекса в мжд отлично работает с этим ключом.
say '' пишет в лог. Видимо Сергей что то изменил в терминалах
там появилась новая настройка 'может принимать уведомления от системы'
from mdmterminal2.
Какая именно ошибка синтеза? И что приходит от мжд Server: Получены данные
?
from mdmterminal2.
Еще проблему нашел. Скрипт слышит еще и "Сигнал перед сообщением:", записывает и отправляет его как голос и поэтому не слышит тебя.
Его можно отключить, alarmtts = 0
. С blocking_listener
hello и сигналы не будут записываться.
там появилась новая настройка 'может принимать уведомления от системы'
У меня такого нет. Это в альфе?
from mdmterminal2.
Да, это в альфе, но я окатился на стабильную так как много чего отломалось, а тестировать пока некогда.
alarmtts сразу же поставил 1.
Малина все равно начинает слушать где то через 1-2 секунды (там опция еще стоит в коде слушать шум секунду) и пропускает фразы типа "алиса(активация) открой кран"
из этого всего она в лучшем случае успевает услышать только "кран".
Еще одна просьба.
Можно ли вытащить в настройки 'phrase_time_limit'? Очень уж долго ждет временами
Дефолтно поставить её в 10-15 сек, но дать пользователю выбирать.
В старом я еще вроде время "не ответа подкручивал", но это уже будет лишним
from mdmterminal2.
Совсем убирать adjust_for_ambient_noise
нельзя, он настраивает чувствительность микрофона.
Можно вынести energy_threshold
в конфиг и если он задан не слушать шум, тогда мб будет без разрывно. Если не задана принтить его в лог. Но адаптивности не будет.
phrase_time_limit
вынесу.
from mdmterminal2.
Я игрался раньше с energy_threshold
Если его отключить то плохо распознает голос при фоновом шуме и скорости малине не добавляет.
Может еще определиться с полезностью настроек и безопасные для пользователя вынести в php модуль мжд?
from mdmterminal2.
Тогда модуль станет не совместим с первой версией терминала (настройки есть а не работают), жаль что мжд не запрашивает идентификацию у терминалов.
Ну и кто-то должен их туда внести.
from mdmterminal2.
Насчет id можно попросить допилить мжд, я бы еще попросил бы сделать передачу "важности" терминалу.
Насчет настроек
можно подписывать что эти настройки совместимы только с V2
from mdmterminal2.
Related Issues (13)
- Передача настроек HOT 7
- Предлагаю рассмотреть проект VOSK в качестве замены snowboy HOT 2
- Задержка около 9 минут после уведомления HOT 9
- Замена snowboy HOT 1
- Подключение универсальных моделей HOT 2
- Список команд требуемых от модуля HOT 1
- Объединение
- Отправка уведомлений на majordomo HOT 13
- Добавить событие speech_recognized_success HOT 6
- Снятие с паузы mpd по колбеку: stop_talking или stop_record HOT 1
- Плавное нарастание громкости mpd после колбеков stop_talking или stop_record
- double 'ip' in config.ini HOT 8
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from mdmterminal2.