zabelink / nii_lor Goto Github PK

View Code? Open in Web Editor NEW

4.0 4.0 2.0 64.25 MB

Batchfile 0.16% Python 99.84%

nii_lor's People

Contributors

Stargazers

Watchers

Forkers

compfee ane1y

nii_lor's Issues

Добавить проверку даты рождения пациента

Добавить названия панелей в шапке

заменить "ин-ция" на "информация" в окне информации.
добавить дату рождения пациента календарем

Построить график на основе интенсивности

Параметр "Интенсивность" - регулируется на аудиометре, но в UI мы можем задать.
Тестирование пациентов, только для опции в наушниках. 65Db стандарт. Если выбрали наушники, то появляется это поле.
На основе интенсивности построить график.
Вставлять в печатную форму

Разделение по голосовым звукам: мужчина и женщина - нужно сделать.

Вернуть выбор голоса

Вернуть список выбора: Мужчина/Женщина
Изменять путь к записям по выбору

Сделать дерево побольше

Внести изменения в интерфейс регулирования уровня шума

Добавить значения "-9" и "+9" dB
Оставлять кнопку зажатой кнопкой после выбора. В этом случае пропадет необходимость в поле дублирования выбранного значения - его убрать
Поставить единицы размерность "db" и "+" перед положительными значениями

Убрать кнопку "Начать сессию" из окна автоматического воспроизведения

Автоматическое воспроизведение должно начинаться не по нажатию кнопки "Начать сессию" в основном окне программы, а по переходе между окном выбора аудиозаписей и окном автоматического вопросизведения.

Подготовить новый релиз для x32 Windows

Необходимо подготовить новый релиз для x32 Windows, чтобы он мог быть установлен на окружении в НИИ ЛОР.

Настройка CI в проекте

Настроить автоматическую сборку приложения при помощи встроенных или сторонних инструментов

Добавить дату рождения пациента календарем

Добавить новые атрибуты

Первое окно (Информация о пациенте)

Диагноз
Дата операции (информация об оперативных вмешательствах)

Выбор записей

Свободное звуковое поле/наушники
Мужчина/женщина
Правое/левое ухо
Слуховой аппарат/Кохлеарный имплант
АД/АС/бинаурально (метод коррекции слуха)
Модель слухового аппарата + программа (комментарий)

Посмотреть возможные аналоги приложения и создать презентацию

В презентации описать сильные и слабые стороны каждого варианта

Переход на итеративный режим

Необходимо переработать алгоритм работы приложения с пословного тестирования на тестирование итерациями:

Выбор сурдологом записей слов/предложений
Проигрывание данной дорожки с конфигурируемой задержкой между словами
Сохранение результатов данной итерации
Повторение тестирования с тем же пациентом при других настройках и записях

Реализовать прогресс бар для визуализации оставшихся слов в сессии

Реализовать "шаг 1" по проведению тестирования пациента

На основе скриншотов, разосланных в письме, реализовать последовательность шагов в пользовательском интерфейсе с выводом конечной таблички с результатами.

Приложение не отвечает при автоматическом режиме распознавания

Шаги по воспроизведению ошибки:

Выбор автоматического режима воспроизведения и переход к окну тестирования
Нажатие кнопки "Нажать сессию"
Клик мышкой в любое место окна

Ожидаемое поведение:
Окно продолжает отображать изменяющиеся виджеты интерфейса и не реагирует на действия курсором

Реальное поведение:
Возникает сообщение "Приложение не отвечает", интефейс окна затемняется. По окончании сессии окно "отмирает" и взаимодействие с ним восстанавливается.

Добавить шумы

Белый шум
- шум многоголосья
  Шум в аудиодорожке должен начинаться с 0 секунды, т.е. сразу. Убрать шум "волны", т.к. его плохо слышно.

Вылетает исключение при построении файлового дерева из функции constructAudioTree(audio_choosing_panel.py)

Выходит ошибка вида :KeyError: 'G:/Politech/NII_LOR/data_set/words\глаголы'

Обернула в try...catch, программа запускается, исключение выводится, но файловое дерево с записями не строится. С шумами, в то же время, все нормально

Что пробовала делать:

Перепроверила пути, с ними все нормально
Разные разделители путей , /, //
Если использовать \ в параметрах программы, то подобная ошибка вылетает сразу на KeyError: 'G:/Politech/NII_LOR/data_set\noises'
Переименовать файлы и директории, латиница вместо кириллицы

Проблема возникла около недели назад, до этого все нормально запускалось

И на всякий случай трейсбек:
File "G:/Polikek/NII_LOR/libs/scripts/src/application.py", line 15, in
main_frame = mf.MainFrame(patient_testing_model, recognition_service_settings, test_settings)
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/main_frame.py", line 52, in init
self.audio_choosing = self.addPanel(AudioChoosingPanel(self,
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 33, in init
self.layoutControls()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 52, in layoutControls
self.constructAudioTree()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 185, in constructAudioTree
root_tree_item = self.generic_tree_items[root]
KeyError: 'G:/Politech/NII_LOR/data_set/records\Глаголы'

Process finished with exit code 1

Отобразить структуру директории в data_set/[man, woman] в меню выбора слов

Настройка уровня громкости воспроизведения

Требуется добавить возможность регулировать громкость воспроизведения аудиофайлов.
Настройка осуществляется в окне "Настройки сессии" и представляет собой "бегунок":

минимальное значение: -25 дБ
максимальное значение: +25 дБ
дополнительное поле ручного ввода значения
шаг изменения громкости - 3 дБ

Стандартными значениями громкости являются +-0/ +-3 / +-6 / +-12 дБ

Выбранная громкость должна отображатся в генерируемом отчёте

Изменить настройку отношения шума к речи

Если "+", то громче речь, а тише шум
Если "-", то наоборот

Формочки поправить и сделать пошире на Шаге 1.

Новый релиз дя показа 16.06

Нужно создать новый релиз для показа 16.06.2021.
Релиз нужно выложить на нашу страничку релизов Git.

В случае недоступности сервиса выдавать сообщение об ошибке

Случается, что сервис по распознаванию речи недоступен.
Сейчас приложение реагирует на это сообщением в консоли, при этом пользовательский интерфейс не выдает адекватной информации для пользователя.
Нужно, чтобы в пользовательском интерфейсе при возникновении ошибки выдавались соответствующие сообщения:

если сервис недоступен, то - "В настоящее время сервис по распознаванию речи недоступен. Попробуйте позже. Если проблема повторяется, свяжитесь со своим системным администратором".
если сервис возвращает сообщение об ошибке распознавания, то нужно отобразить внутреннее сообщение об ошибке и обрамить словами: "В процессе распознавания речи произошла ошибка: <текст ошибки из response>
другой тип ошибки - "Произошла неизвестная ошикбка. Обратитесь к логам приложения".

Реализовать скрипт автоматизации сборки билда для x32 и x64

Автоматизировать процесс создания релизного дистрибутива

Вынести настройки сессии в отдельное окно

Вынести настройки с окна выбора записей, которые не имеют отношения к записям и шумам:

Свободное звуковое поле/наушники
Пол диктора записей
Слуховой аппарат/имлант
АС/АД/Бинаурально
СА/КИ
Модель аппарата

Реализовать отображение айдиофайлов, находящихся в директории dataset

Из директории data_set на итерации 2 должны подтягиваться аудиофайлы.
Должна быть возможность задания количества "случайного" воспроизводимых наборов файлов.

Постановку нужно детализировать.

Корневой элементв дереве назовем "Записи и звуки".

Добавить предложения

логирование ошибок

popup dialog с деталями ошибки, где есть текст и кнопка «ок».
При этом, если падает больше одного сообщения, то остальные отображать в текстовом поле, не больше первых 10.
Обработку исключений нужно сделать отдельным модулем, чтобы во всех частях программы она была однотипная.
Генерация директории «logs”

Дополнить шаблон отчета о тестировании

Внести в отчет о результатах проведенного тестирования новую добавленную информацию:

Диагноз
Информацию об оперативном вмешательстве
Настройки проводимого тестирования:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
- Отношение шум/слово

Изменение структуры файлового дерева

Классифицировать записи на числа, односложные, разносложные, предложения, многосложные, которые в свою очередь делятся на существительные, глаголы, наречия и так далее, хранящиеся в соответствующих директориях. Реализовать данную структуру в окне выбора записей с возможностью случайного выбора слов из одной/нескольких директорий

Изменения интерфейса окна автоматического воспроизведения

Растянуть бегунок, чтобы бегунок лучше подвинулся.
В автоматическом режиме не открывать новое окно. Сделать лейбл для обновления.
Переделать кнопочки и поведение "Начала сессии".

Выбор режима воспроизведения

В окне настроек сессии сделать режимы воспроизведения с заглавной буквы.
Первая опция - автоматический - слева

Номер воспроизводимого слова

Разместить номер воспроизводимого слова на страничке воспроизведения и на итоговой странице с результатами.

Добавить кнопку "На предыдущий шаг"

Не хватает возможности вернуться на предыдущий шаг в настройках, при обнаружении ошибки в настройке предыдущего шага.
Нужно добавить кнопку "На предыдущий шаг" на всех страничках.

Реализовать эквалайзер в приложении

Эквалайзер должен позволять настраивать воспроизводимый звук.

Проработать постановку детальнее.

Поведение программы при неработоспособности сервиса распознавания

В случае не работы сервиса по распознаванию - нужна подсказка "Введите услышанный текст" (на поэтапном режиме) - продумать.
Сделать Ping к сервису при старте приложения.

Настройка задержки между словами

В текущей версии приложения переход между словами в рамках одной сессии осуществляется по нажатии кнопки "Следующее слово". Требуется внести в реализацию программы задержку между произношением аудиофайла программой и концом прослушивания пациента таким образом, чтобы алгоритм работы основного окна был следующим:

Нажатие кнопки "Прослушать"
По завершении воспроизведения аудиофайла начинается задержка, в течение которой пациент может высказать свою догадку, а программа принимает на вход аудио-данные.
По завершении задержки программа включает алгоритм распознавания с теми входными данными, что успел произнести пациент.
По нажатии кнопки "Следующая запись" мы переходим к следующему аудиофайлу.

Длительность задержки определяется в окне настроек сессии. Значение по умолчанию - 3 секунды.

(Опционально) Во время шага 2 отображается прогресс-бар, с обратным отсчётом до следующего аудиофайла.