zabelink / nii_lor Goto Github PK

View Code? Open in Web Editor NEW

4.0 4.0 2.0 64.25 MB

Batchfile 0.16% Python 99.84%

nii_lor's Issues

Подготовить новый релиз для x32 Windows

Необходимо подготовить новый релиз для x32 Windows, чтобы он мог быть установлен на окружении в НИИ ЛОР.

Добавить названия панелей в шапке

заменить "ин-ция" на "информация" в окне информации.
добавить дату рождения пациента календарем

Внести изменения в интерфейс регулирования уровня шума

Добавить значения "-9" и "+9" dB
Оставлять кнопку зажатой кнопкой после выбора. В этом случае пропадет необходимость в поле дублирования выбранного значения - его убрать
Поставить единицы размерность "db" и "+" перед положительными значениями

Добавить отображение выбранного уровня шума на странице результатов

Добавить дату рождения пациента календарем

Реализовать скрипт автоматизации сборки билда для x32 и x64

Автоматизировать процесс создания релизного дистрибутива

В случае недоступности сервиса выдавать сообщение об ошибке

Случается, что сервис по распознаванию речи недоступен.
Сейчас приложение реагирует на это сообщением в консоли, при этом пользовательский интерфейс не выдает адекватной информации для пользователя.
Нужно, чтобы в пользовательском интерфейсе при возникновении ошибки выдавались соответствующие сообщения:

если сервис недоступен, то - "В настоящее время сервис по распознаванию речи недоступен. Попробуйте позже. Если проблема повторяется, свяжитесь со своим системным администратором".
если сервис возвращает сообщение об ошибке распознавания, то нужно отобразить внутреннее сообщение об ошибке и обрамить словами: "В процессе распознавания речи произошла ошибка: <текст ошибки из response>
другой тип ошибки - "Произошла неизвестная ошикбка. Обратитесь к логам приложения".

Настройка уровня громкости воспроизведения

Требуется добавить возможность регулировать громкость воспроизведения аудиофайлов.
Настройка осуществляется в окне "Настройки сессии" и представляет собой "бегунок":

минимальное значение: -25 дБ
максимальное значение: +25 дБ
дополнительное поле ручного ввода значения
шаг изменения громкости - 3 дБ

Стандартными значениями громкости являются +-0/ +-3 / +-6 / +-12 дБ

Выбранная громкость должна отображатся в генерируемом отчёте

Реализовать эквалайзер в приложении

Эквалайзер должен позволять настраивать воспроизводимый звук.

Проработать постановку детальнее.

Номер воспроизводимого слова

Разместить номер воспроизводимого слова на страничке воспроизведения и на итоговой странице с результатами.

Переход на итеративный режим

Необходимо переработать алгоритм работы приложения с пословного тестирования на тестирование итерациями:

Выбор сурдологом записей слов/предложений
Проигрывание данной дорожки с конфигурируемой задержкой между словами
Сохранение результатов данной итерации
Повторение тестирования с тем же пациентом при других настройках и записях

Реализовать прогресс бар для визуализации оставшихся слов в сессии

логирование ошибок

popup dialog с деталями ошибки, где есть текст и кнопка «ок».
При этом, если падает больше одного сообщения, то остальные отображать в текстовом поле, не больше первых 10.
Обработку исключений нужно сделать отдельным модулем, чтобы во всех частях программы она была однотипная.
Генерация директории «logs”

Добавить предложения

Новый релиз дя показа 16.06

Нужно создать новый релиз для показа 16.06.2021.
Релиз нужно выложить на нашу страничку релизов Git.

Добавить проверку даты рождения пациента

Вернуть выбор голоса

Вернуть список выбора: Мужчина/Женщина
Изменять путь к записям по выбору

Изменение структуры файлового дерева

Классифицировать записи на числа, односложные, разносложные, предложения, многосложные, которые в свою очередь делятся на существительные, глаголы, наречия и так далее, хранящиеся в соответствующих директориях. Реализовать данную структуру в окне выбора записей с возможностью случайного выбора слов из одной/нескольких директорий

Настройка задержки между словами

В текущей версии приложения переход между словами в рамках одной сессии осуществляется по нажатии кнопки "Следующее слово". Требуется внести в реализацию программы задержку между произношением аудиофайла программой и концом прослушивания пациента таким образом, чтобы алгоритм работы основного окна был следующим:

Нажатие кнопки "Прослушать"
По завершении воспроизведения аудиофайла начинается задержка, в течение которой пациент может высказать свою догадку, а программа принимает на вход аудио-данные.
По завершении задержки программа включает алгоритм распознавания с теми входными данными, что успел произнести пациент.
По нажатии кнопки "Следующая запись" мы переходим к следующему аудиофайлу.

Длительность задержки определяется в окне настроек сессии. Значение по умолчанию - 3 секунды.

(Опционально) Во время шага 2 отображается прогресс-бар, с обратным отсчётом до следующего аудиофайла.

Формочки поправить и сделать пошире на Шаге 1.

Поведение программы при неработоспособности сервиса распознавания

В случае не работы сервиса по распознаванию - нужна подсказка "Введите услышанный текст" (на поэтапном режиме) - продумать.
Сделать Ping к сервису при старте приложения.

Добавить новые атрибуты

Первое окно (Информация о пациенте)

Диагноз
Дата операции (информация об оперативных вмешательствах)

Выбор записей

Свободное звуковое поле/наушники
Мужчина/женщина
Правое/левое ухо
Слуховой аппарат/Кохлеарный имплант
АД/АС/бинаурально (метод коррекции слуха)
Модель слухового аппарата + программа (комментарий)

Вылетает исключение при построении файлового дерева из функции constructAudioTree(audio_choosing_panel.py)

Выходит ошибка вида :KeyError: 'G:/Politech/NII_LOR/data_set/words\глаголы'

Обернула в try...catch, программа запускается, исключение выводится, но файловое дерево с записями не строится. С шумами, в то же время, все нормально

Что пробовала делать:

Перепроверила пути, с ними все нормально
Разные разделители путей , /, //
Если использовать \ в параметрах программы, то подобная ошибка вылетает сразу на KeyError: 'G:/Politech/NII_LOR/data_set\noises'
Переименовать файлы и директории, латиница вместо кириллицы

Проблема возникла около недели назад, до этого все нормально запускалось

И на всякий случай трейсбек:
File "G:/Polikek/NII_LOR/libs/scripts/src/application.py", line 15, in
main_frame = mf.MainFrame(patient_testing_model, recognition_service_settings, test_settings)
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/main_frame.py", line 52, in init
self.audio_choosing = self.addPanel(AudioChoosingPanel(self,
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 33, in init
self.layoutControls()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 52, in layoutControls
self.constructAudioTree()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 185, in constructAudioTree
root_tree_item = self.generic_tree_items[root]
KeyError: 'G:/Politech/NII_LOR/data_set/records\Глаголы'

Process finished with exit code 1

Добавить шумы

Белый шум
- шум многоголосья
  Шум в аудиодорожке должен начинаться с 0 секунды, т.е. сразу. Убрать шум "волны", т.к. его плохо слышно.

Сделать дерево побольше

Построить график на основе интенсивности

Параметр "Интенсивность" - регулируется на аудиометре, но в UI мы можем задать.
Тестирование пациентов, только для опции в наушниках. 65Db стандарт. Если выбрали наушники, то появляется это поле.
На основе интенсивности построить график.
Вставлять в печатную форму

Выбор режима воспроизведения

В окне настроек сессии сделать режимы воспроизведения с заглавной буквы.
Первая опция - автоматический - слева

Изменить настройку отношения шума к речи

Если "+", то громче речь, а тише шум
Если "-", то наоборот

Убрать кнопку "Начать сессию" из окна автоматического воспроизведения

Автоматическое воспроизведение должно начинаться не по нажатию кнопки "Начать сессию" в основном окне программы, а по переходе между окном выбора аудиозаписей и окном автоматического вопросизведения.

Посмотреть возможные аналоги приложения и создать презентацию

В презентации описать сильные и слабые стороны каждого варианта

Реализовать "шаг 1" по проведению тестирования пациента

На основе скриншотов, разосланных в письме, реализовать последовательность шагов в пользовательском интерфейсе с выводом конечной таблички с результатами.

Надиктовать wav файлы

Отобразить структуру директории в data_set/[man, woman] в меню выбора слов

Дополнить шаблон отчета о тестировании

Внести в отчет о результатах проведенного тестирования новую добавленную информацию:

Диагноз
Информацию об оперативном вмешательстве
Настройки проводимого тестирования:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
- Отношение шум/слово

Приложение не отвечает при автоматическом режиме распознавания

Шаги по воспроизведению ошибки:

Выбор автоматического режима воспроизведения и переход к окну тестирования
Нажатие кнопки "Нажать сессию"
Клик мышкой в любое место окна

Ожидаемое поведение:
Окно продолжает отображать изменяющиеся виджеты интерфейса и не реагирует на действия курсором

Реальное поведение:
Возникает сообщение "Приложение не отвечает", интефейс окна затемняется. По окончании сессии окно "отмирает" и взаимодействие с ним восстанавливается.

Растянуть бегунок, чтобы бегунок лучше подвинулся.
В автоматическом режиме не открывать новое окно. Сделать лейбл для обновления.
Переделать кнопочки и поведение "Начала сессии".

Настройка CI в проекте

Настроить автоматическую сборку приложения при помощи встроенных или сторонних инструментов

Вынести настройки сессии в отдельное окно

Вынести настройки с окна выбора записей, которые не имеют отношения к записям и шумам:

Свободное звуковое поле/наушники
Пол диктора записей
Слуховой аппарат/имлант
АС/АД/Бинаурально
СА/КИ
Модель аппарата

zabelink / nii_lor Goto Github PK

nii_lor's Issues

Recommend Projects

Recommend Topics

Recommend Org