nii_lor's Issues
Подготовить новый релиз для x32 Windows
Необходимо подготовить новый релиз для x32 Windows, чтобы он мог быть установлен на окружении в НИИ ЛОР.
Добавить названия панелей в шапке
- заменить "ин-ция" на "информация" в окне информации.
- добавить дату рождения пациента календарем
Внести изменения в интерфейс регулирования уровня шума
- Добавить значения "-9" и "+9" dB
- Оставлять кнопку зажатой кнопкой после выбора. В этом случае пропадет необходимость в поле дублирования выбранного значения - его убрать
- Поставить единицы размерность "db" и "+" перед положительными значениями
Добавить отображение выбранного уровня шума на странице результатов
Добавить дату рождения пациента календарем
Реализовать скрипт автоматизации сборки билда для x32 и x64
Автоматизировать процесс создания релизного дистрибутива
В случае недоступности сервиса выдавать сообщение об ошибке
Случается, что сервис по распознаванию речи недоступен.
Сейчас приложение реагирует на это сообщением в консоли, при этом пользовательский интерфейс не выдает адекватной информации для пользователя.
Нужно, чтобы в пользовательском интерфейсе при возникновении ошибки выдавались соответствующие сообщения:
- если сервис недоступен, то - "В настоящее время сервис по распознаванию речи недоступен. Попробуйте позже. Если проблема повторяется, свяжитесь со своим системным администратором".
- если сервис возвращает сообщение об ошибке распознавания, то нужно отобразить внутреннее сообщение об ошибке и обрамить словами: "В процессе распознавания речи произошла ошибка: <текст ошибки из response>
- другой тип ошибки - "Произошла неизвестная ошикбка. Обратитесь к логам приложения".
Настройка уровня громкости воспроизведения
Требуется добавить возможность регулировать громкость воспроизведения аудиофайлов.
Настройка осуществляется в окне "Настройки сессии" и представляет собой "бегунок":
- минимальное значение: -25 дБ
- максимальное значение: +25 дБ
- дополнительное поле ручного ввода значения
- шаг изменения громкости - 3 дБ
Стандартными значениями громкости являются +-0/ +-3 / +-6 / +-12 дБ
Выбранная громкость должна отображатся в генерируемом отчёте
Реализовать эквалайзер в приложении
Эквалайзер должен позволять настраивать воспроизводимый звук.
Проработать постановку детальнее.
Номер воспроизводимого слова
Разместить номер воспроизводимого слова на страничке воспроизведения и на итоговой странице с результатами.
Переход на итеративный режим
Необходимо переработать алгоритм работы приложения с пословного тестирования на тестирование итерациями:
- Выбор сурдологом записей слов/предложений
- Проигрывание данной дорожки с конфигурируемой задержкой между словами
- Сохранение результатов данной итерации
- Повторение тестирования с тем же пациентом при других настройках и записях
Реализовать прогресс бар для визуализации оставшихся слов в сессии
логирование ошибок
-
popup dialog с деталями ошибки, где есть текст и кнопка «ок».
При этом, если падает больше одного сообщения, то остальные отображать в текстовом поле, не больше первых 10. -
Обработку исключений нужно сделать отдельным модулем, чтобы во всех частях программы она была однотипная.
-
Генерация директории «logs”
Добавить предложения
Новый релиз дя показа 16.06
Нужно создать новый релиз для показа 16.06.2021.
Релиз нужно выложить на нашу страничку релизов Git.
Добавить проверку даты рождения пациента
Вернуть выбор голоса
Вернуть список выбора: Мужчина/Женщина
Изменять путь к записям по выбору
Изменение структуры файлового дерева
Классифицировать записи на числа, односложные, разносложные, предложения, многосложные, которые в свою очередь делятся на существительные, глаголы, наречия и так далее, хранящиеся в соответствующих директориях. Реализовать данную структуру в окне выбора записей с возможностью случайного выбора слов из одной/нескольких директорий
Настройка задержки между словами
В текущей версии приложения переход между словами в рамках одной сессии осуществляется по нажатии кнопки "Следующее слово". Требуется внести в реализацию программы задержку между произношением аудиофайла программой и концом прослушивания пациента таким образом, чтобы алгоритм работы основного окна был следующим:
- Нажатие кнопки "Прослушать"
- По завершении воспроизведения аудиофайла начинается задержка, в течение которой пациент может высказать свою догадку, а программа принимает на вход аудио-данные.
- По завершении задержки программа включает алгоритм распознавания с теми входными данными, что успел произнести пациент.
- По нажатии кнопки "Следующая запись" мы переходим к следующему аудиофайлу.
Длительность задержки определяется в окне настроек сессии. Значение по умолчанию - 3 секунды.
(Опционально) Во время шага 2 отображается прогресс-бар, с обратным отсчётом до следующего аудиофайла.
Формочки поправить и сделать пошире на Шаге 1.
Поведение программы при неработоспособности сервиса распознавания
В случае не работы сервиса по распознаванию - нужна подсказка "Введите услышанный текст" (на поэтапном режиме) - продумать.
Сделать Ping к сервису при старте приложения.
Добавить новые атрибуты
- Первое окно (Информация о пациенте)
- Диагноз
- Дата операции (информация об оперативных вмешательствах)
- Выбор записей
- Свободное звуковое поле/наушники
- Мужчина/женщина
- Правое/левое ухо
- Слуховой аппарат/Кохлеарный имплант
- АД/АС/бинаурально (метод коррекции слуха)
- Модель слухового аппарата + программа (комментарий)
Вылетает исключение при построении файлового дерева из функции constructAudioTree(audio_choosing_panel.py)
Выходит ошибка вида :KeyError: 'G:/Politech/NII_LOR/data_set/words\глаголы'
Обернула в try...catch, программа запускается, исключение выводится, но файловое дерево с записями не строится. С шумами, в то же время, все нормально
Что пробовала делать:
- Перепроверила пути, с ними все нормально
- Разные разделители путей , /, //
Если использовать \ в параметрах программы, то подобная ошибка вылетает сразу на KeyError: 'G:/Politech/NII_LOR/data_set\noises' - Переименовать файлы и директории, латиница вместо кириллицы
Проблема возникла около недели назад, до этого все нормально запускалось
И на всякий случай трейсбек:
File "G:/Polikek/NII_LOR/libs/scripts/src/application.py", line 15, in
main_frame = mf.MainFrame(patient_testing_model, recognition_service_settings, test_settings)
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/main_frame.py", line 52, in init
self.audio_choosing = self.addPanel(AudioChoosingPanel(self,
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 33, in init
self.layoutControls()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 52, in layoutControls
self.constructAudioTree()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 185, in constructAudioTree
root_tree_item = self.generic_tree_items[root]
KeyError: 'G:/Politech/NII_LOR/data_set/records\Глаголы'
Process finished with exit code 1
Добавить шумы
- Белый шум
- шум многоголосья
Шум в аудиодорожке должен начинаться с 0 секунды, т.е. сразу. Убрать шум "волны", т.к. его плохо слышно.
- шум многоголосья
Сделать дерево побольше
Построить график на основе интенсивности
Параметр "Интенсивность" - регулируется на аудиометре, но в UI мы можем задать.
Тестирование пациентов, только для опции в наушниках. 65Db стандарт. Если выбрали наушники, то появляется это поле.
На основе интенсивности построить график.
Вставлять в печатную форму
Выбор режима воспроизведения
В окне настроек сессии сделать режимы воспроизведения с заглавной буквы.
Первая опция - автоматический - слева
Изменить настройку отношения шума к речи
Если "+", то громче речь, а тише шум
Если "-", то наоборот
Убрать кнопку "Начать сессию" из окна автоматического воспроизведения
Автоматическое воспроизведение должно начинаться не по нажатию кнопки "Начать сессию" в основном окне программы, а по переходе между окном выбора аудиозаписей и окном автоматического вопросизведения.
Посмотреть возможные аналоги приложения и создать презентацию
В презентации описать сильные и слабые стороны каждого варианта
Реализовать "шаг 1" по проведению тестирования пациента
На основе скриншотов, разосланных в письме, реализовать последовательность шагов в пользовательском интерфейсе с выводом конечной таблички с результатами.
Надиктовать wav файлы
Отобразить структуру директории в data_set/[man, woman] в меню выбора слов
Дополнить шаблон отчета о тестировании
Внести в отчет о результатах проведенного тестирования новую добавленную информацию:
- Диагноз
- Информацию об оперативном вмешательстве
- Настройки проводимого тестирования:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
- Отношение шум/слово
Приложение не отвечает при автоматическом режиме распознавания
Шаги по воспроизведению ошибки:
- Выбор автоматического режима воспроизведения и переход к окну тестирования
- Нажатие кнопки "Нажать сессию"
- Клик мышкой в любое место окна
Ожидаемое поведение:
Окно продолжает отображать изменяющиеся виджеты интерфейса и не реагирует на действия курсором
Реальное поведение:
Возникает сообщение "Приложение не отвечает", интефейс окна затемняется. По окончании сессии окно "отмирает" и взаимодействие с ним восстанавливается.
Корневой элементв дереве назовем "Записи и звуки".
Добавить кнопку "На предыдущий шаг"
Не хватает возможности вернуться на предыдущий шаг в настройках, при обнаружении ошибки в настройке предыдущего шага.
Нужно добавить кнопку "На предыдущий шаг" на всех страничках.
Разделение по голосовым звукам: мужчина и женщина - нужно сделать.
Реализовать отображение айдиофайлов, находящихся в директории dataset
Из директории data_set на итерации 2 должны подтягиваться аудиофайлы.
Должна быть возможность задания количества "случайного" воспроизводимых наборов файлов.
Постановку нужно детализировать.
Изменения интерфейса окна автоматического воспроизведения
- Растянуть бегунок, чтобы бегунок лучше подвинулся.
- В автоматическом режиме не открывать новое окно. Сделать лейбл для обновления.
- Переделать кнопочки и поведение "Начала сессии".
Настройка CI в проекте
Настроить автоматическую сборку приложения при помощи встроенных или сторонних инструментов
Вынести настройки сессии в отдельное окно
Вынести настройки с окна выбора записей, которые не имеют отношения к записям и шумам:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.