Git Product home page Git Product logo

Comments (12)

Aculeasis avatar Aculeasis commented on June 17, 2024

Опцию добавлю.

Хуже распознает голос если говорить вместе с терминалом или всегда? Если всегда то наверное это из-за того что настройка energy_threshold начинается параллельно с проигрыванием динга. Я это уберу. Если не поможет то можно вернуть опционально старый, блокирующий, режим когда распознавание начинается после произнесения фразы. У меня проблемы с распознаванием только когда вместе с терминалом говорю.

Это фишка мжд, он просто присылает tts: и фразу.

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

Я жду 1-2 секунды пока скрипт договорит привет-привет и после говорю любую фразу.
И после этого слышу "ничего не слышно повторите ваш запрос", на повторный запрос распознает чуть лучше, но все же не всегда
Судя по логам она слышит саму себя же, сразу пишет и отправляет не слушая мои команды

2018.11.10 19:56:25 Player: Играю /home/pi/mdmTerminal2/src/resources/ding.wav ...
2018.11.10 19:56:25 STT: audio devices: 8
2018.11.10 19:56:27 Player: Играю /home/pi/mdmTerminal2/src/tts_cache/yandex_4b58df8fc29194825234f34a49272b65b5552ad9.mp3 ...
2018.11.10 19:56:29 STT: Голос записан за 2.69 sec
2018.11.10 19:56:31 Player: Играю /home/pi/mdmTerminal2/src/resources/dong.wav ...

Насчет фишки надо бы попросить Сергея чтоб он и "важность" отправлял в терминал, а тут уже перехватывать и обрабатывать.

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

c no_hello = 1 распознает лучше, спасибо

from mdmterminal2.

Aculeasis avatar Aculeasis commented on June 17, 2024

А так, если отключить no_hello? Да, она себя слышит т.к. распознавание идет параллельно с воспроизведением. Но свой голос записывать не должна. Позже добавлю режим без параллельного воспроизведения.

Может просто не отправлять сообщения если приоритет ниже?

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

Еще проблему нашел. Скрипт слышит еще и "Сигнал перед сообщением:", записывает и отправляет его как голос и поэтому не слышит тебя.

У меня терминал стоит на той же малине где мжд. тут или не отправлять сообщение в терминал и говорить встроенным яндексом(который работает медленней чем скрипт) или использовать терминал и отключить яндекс, но тогда болтает всё.
Сейчас почему то после обновления мжд сломался синтез. говорит ошибка синтеза речи, но модуль яндекса в мжд отлично работает с этим ключом.
say '' пишет в лог. Видимо Сергей что то изменил в терминалах
там появилась новая настройка 'может принимать уведомления от системы'

from mdmterminal2.

Aculeasis avatar Aculeasis commented on June 17, 2024

Какая именно ошибка синтеза? И что приходит от мжд Server: Получены данные?

from mdmterminal2.

Aculeasis avatar Aculeasis commented on June 17, 2024

Еще проблему нашел. Скрипт слышит еще и "Сигнал перед сообщением:", записывает и отправляет его как голос и поэтому не слышит тебя.

Его можно отключить, alarmtts = 0. С blocking_listener hello и сигналы не будут записываться.

там появилась новая настройка 'может принимать уведомления от системы'

У меня такого нет. Это в альфе?

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

Да, это в альфе, но я окатился на стабильную так как много чего отломалось, а тестировать пока некогда.

alarmtts сразу же поставил 1.
Малина все равно начинает слушать где то через 1-2 секунды (там опция еще стоит в коде слушать шум секунду) и пропускает фразы типа "алиса(активация) открой кран"
из этого всего она в лучшем случае успевает услышать только "кран".

Еще одна просьба.
Можно ли вытащить в настройки 'phrase_time_limit'? Очень уж долго ждет временами
Дефолтно поставить её в 10-15 сек, но дать пользователю выбирать.
В старом я еще вроде время "не ответа подкручивал", но это уже будет лишним

from mdmterminal2.

Aculeasis avatar Aculeasis commented on June 17, 2024

Совсем убирать adjust_for_ambient_noise нельзя, он настраивает чувствительность микрофона.
Можно вынести energy_threshold в конфиг и если он задан не слушать шум, тогда мб будет без разрывно. Если не задана принтить его в лог. Но адаптивности не будет.

phrase_time_limit вынесу.

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

Я игрался раньше с energy_threshold
Если его отключить то плохо распознает голос при фоновом шуме и скорости малине не добавляет.
Может еще определиться с полезностью настроек и безопасные для пользователя вынести в php модуль мжд?

from mdmterminal2.

Aculeasis avatar Aculeasis commented on June 17, 2024

Тогда модуль станет не совместим с первой версией терминала (настройки есть а не работают), жаль что мжд не запрашивает идентификацию у терминалов.
Ну и кто-то должен их туда внести.

from mdmterminal2.

netman1ac avatar netman1ac commented on June 17, 2024

Насчет id можно попросить допилить мжд, я бы еще попросил бы сделать передачу "важности" терминалу.
Насчет настроек
можно подписывать что эти настройки совместимы только с V2

from mdmterminal2.

Related Issues (13)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.