nii_lor's People
nii_lor's Issues
Добавить проверку даты рождения пациента
Добавить названия панелей в шапке
- заменить "ин-ция" на "информация" в окне информации.
- добавить дату рождения пациента календарем
Построить график на основе интенсивности
Параметр "Интенсивность" - регулируется на аудиометре, но в UI мы можем задать.
Тестирование пациентов, только для опции в наушниках. 65Db стандарт. Если выбрали наушники, то появляется это поле.
На основе интенсивности построить график.
Вставлять в печатную форму
Разделение по голосовым звукам: мужчина и женщина - нужно сделать.
Вернуть выбор голоса
Вернуть список выбора: Мужчина/Женщина
Изменять путь к записям по выбору
Сделать дерево побольше
Внести изменения в интерфейс регулирования уровня шума
- Добавить значения "-9" и "+9" dB
- Оставлять кнопку зажатой кнопкой после выбора. В этом случае пропадет необходимость в поле дублирования выбранного значения - его убрать
- Поставить единицы размерность "db" и "+" перед положительными значениями
Убрать кнопку "Начать сессию" из окна автоматического воспроизведения
Автоматическое воспроизведение должно начинаться не по нажатию кнопки "Начать сессию" в основном окне программы, а по переходе между окном выбора аудиозаписей и окном автоматического вопросизведения.
Подготовить новый релиз для x32 Windows
Необходимо подготовить новый релиз для x32 Windows, чтобы он мог быть установлен на окружении в НИИ ЛОР.
Настройка CI в проекте
Настроить автоматическую сборку приложения при помощи встроенных или сторонних инструментов
Добавить дату рождения пациента календарем
Добавить новые атрибуты
- Первое окно (Информация о пациенте)
- Диагноз
- Дата операции (информация об оперативных вмешательствах)
- Выбор записей
- Свободное звуковое поле/наушники
- Мужчина/женщина
- Правое/левое ухо
- Слуховой аппарат/Кохлеарный имплант
- АД/АС/бинаурально (метод коррекции слуха)
- Модель слухового аппарата + программа (комментарий)
Посмотреть возможные аналоги приложения и создать презентацию
В презентации описать сильные и слабые стороны каждого варианта
Переход на итеративный режим
Необходимо переработать алгоритм работы приложения с пословного тестирования на тестирование итерациями:
- Выбор сурдологом записей слов/предложений
- Проигрывание данной дорожки с конфигурируемой задержкой между словами
- Сохранение результатов данной итерации
- Повторение тестирования с тем же пациентом при других настройках и записях
Реализовать прогресс бар для визуализации оставшихся слов в сессии
Реализовать "шаг 1" по проведению тестирования пациента
На основе скриншотов, разосланных в письме, реализовать последовательность шагов в пользовательском интерфейсе с выводом конечной таблички с результатами.
Приложение не отвечает при автоматическом режиме распознавания
Шаги по воспроизведению ошибки:
- Выбор автоматического режима воспроизведения и переход к окну тестирования
- Нажатие кнопки "Нажать сессию"
- Клик мышкой в любое место окна
Ожидаемое поведение:
Окно продолжает отображать изменяющиеся виджеты интерфейса и не реагирует на действия курсором
Реальное поведение:
Возникает сообщение "Приложение не отвечает", интефейс окна затемняется. По окончании сессии окно "отмирает" и взаимодействие с ним восстанавливается.
Добавить шумы
- Белый шум
- шум многоголосья
Шум в аудиодорожке должен начинаться с 0 секунды, т.е. сразу. Убрать шум "волны", т.к. его плохо слышно.
- шум многоголосья
Вылетает исключение при построении файлового дерева из функции constructAudioTree(audio_choosing_panel.py)
Выходит ошибка вида :KeyError: 'G:/Politech/NII_LOR/data_set/words\глаголы'
Обернула в try...catch, программа запускается, исключение выводится, но файловое дерево с записями не строится. С шумами, в то же время, все нормально
Что пробовала делать:
- Перепроверила пути, с ними все нормально
- Разные разделители путей , /, //
Если использовать \ в параметрах программы, то подобная ошибка вылетает сразу на KeyError: 'G:/Politech/NII_LOR/data_set\noises' - Переименовать файлы и директории, латиница вместо кириллицы
Проблема возникла около недели назад, до этого все нормально запускалось
И на всякий случай трейсбек:
File "G:/Polikek/NII_LOR/libs/scripts/src/application.py", line 15, in
main_frame = mf.MainFrame(patient_testing_model, recognition_service_settings, test_settings)
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/main_frame.py", line 52, in init
self.audio_choosing = self.addPanel(AudioChoosingPanel(self,
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 33, in init
self.layoutControls()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 52, in layoutControls
self.constructAudioTree()
File "G:/Politech/NII_LOR/libs/scripts/src/main_panels/audio_choosing_panel.py", line 185, in constructAudioTree
root_tree_item = self.generic_tree_items[root]
KeyError: 'G:/Politech/NII_LOR/data_set/records\Глаголы'
Process finished with exit code 1
Отобразить структуру директории в data_set/[man, woman] в меню выбора слов
Настройка уровня громкости воспроизведения
Требуется добавить возможность регулировать громкость воспроизведения аудиофайлов.
Настройка осуществляется в окне "Настройки сессии" и представляет собой "бегунок":
- минимальное значение: -25 дБ
- максимальное значение: +25 дБ
- дополнительное поле ручного ввода значения
- шаг изменения громкости - 3 дБ
Стандартными значениями громкости являются +-0/ +-3 / +-6 / +-12 дБ
Выбранная громкость должна отображатся в генерируемом отчёте
Изменить настройку отношения шума к речи
Если "+", то громче речь, а тише шум
Если "-", то наоборот
Формочки поправить и сделать пошире на Шаге 1.
Новый релиз дя показа 16.06
Нужно создать новый релиз для показа 16.06.2021.
Релиз нужно выложить на нашу страничку релизов Git.
В случае недоступности сервиса выдавать сообщение об ошибке
Случается, что сервис по распознаванию речи недоступен.
Сейчас приложение реагирует на это сообщением в консоли, при этом пользовательский интерфейс не выдает адекватной информации для пользователя.
Нужно, чтобы в пользовательском интерфейсе при возникновении ошибки выдавались соответствующие сообщения:
- если сервис недоступен, то - "В настоящее время сервис по распознаванию речи недоступен. Попробуйте позже. Если проблема повторяется, свяжитесь со своим системным администратором".
- если сервис возвращает сообщение об ошибке распознавания, то нужно отобразить внутреннее сообщение об ошибке и обрамить словами: "В процессе распознавания речи произошла ошибка: <текст ошибки из response>
- другой тип ошибки - "Произошла неизвестная ошикбка. Обратитесь к логам приложения".
Реализовать скрипт автоматизации сборки билда для x32 и x64
Автоматизировать процесс создания релизного дистрибутива
Вынести настройки сессии в отдельное окно
Вынести настройки с окна выбора записей, которые не имеют отношения к записям и шумам:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
Реализовать отображение айдиофайлов, находящихся в директории dataset
Из директории data_set на итерации 2 должны подтягиваться аудиофайлы.
Должна быть возможность задания количества "случайного" воспроизводимых наборов файлов.
Постановку нужно детализировать.
Корневой элементв дереве назовем "Записи и звуки".
Добавить предложения
логирование ошибок
-
popup dialog с деталями ошибки, где есть текст и кнопка «ок».
При этом, если падает больше одного сообщения, то остальные отображать в текстовом поле, не больше первых 10. -
Обработку исключений нужно сделать отдельным модулем, чтобы во всех частях программы она была однотипная.
-
Генерация директории «logs”
Дополнить шаблон отчета о тестировании
Внести в отчет о результатах проведенного тестирования новую добавленную информацию:
- Диагноз
- Информацию об оперативном вмешательстве
- Настройки проводимого тестирования:
- Свободное звуковое поле/наушники
- Пол диктора записей
- Слуховой аппарат/имлант
- АС/АД/Бинаурально
- СА/КИ
- Модель аппарата
- Отношение шум/слово
Изменение структуры файлового дерева
Классифицировать записи на числа, односложные, разносложные, предложения, многосложные, которые в свою очередь делятся на существительные, глаголы, наречия и так далее, хранящиеся в соответствующих директориях. Реализовать данную структуру в окне выбора записей с возможностью случайного выбора слов из одной/нескольких директорий
Изменения интерфейса окна автоматического воспроизведения
- Растянуть бегунок, чтобы бегунок лучше подвинулся.
- В автоматическом режиме не открывать новое окно. Сделать лейбл для обновления.
- Переделать кнопочки и поведение "Начала сессии".
Выбор режима воспроизведения
В окне настроек сессии сделать режимы воспроизведения с заглавной буквы.
Первая опция - автоматический - слева
Номер воспроизводимого слова
Разместить номер воспроизводимого слова на страничке воспроизведения и на итоговой странице с результатами.
Добавить кнопку "На предыдущий шаг"
Не хватает возможности вернуться на предыдущий шаг в настройках, при обнаружении ошибки в настройке предыдущего шага.
Нужно добавить кнопку "На предыдущий шаг" на всех страничках.
Реализовать эквалайзер в приложении
Эквалайзер должен позволять настраивать воспроизводимый звук.
Проработать постановку детальнее.
Поведение программы при неработоспособности сервиса распознавания
В случае не работы сервиса по распознаванию - нужна подсказка "Введите услышанный текст" (на поэтапном режиме) - продумать.
Сделать Ping к сервису при старте приложения.
Настройка задержки между словами
В текущей версии приложения переход между словами в рамках одной сессии осуществляется по нажатии кнопки "Следующее слово". Требуется внести в реализацию программы задержку между произношением аудиофайла программой и концом прослушивания пациента таким образом, чтобы алгоритм работы основного окна был следующим:
- Нажатие кнопки "Прослушать"
- По завершении воспроизведения аудиофайла начинается задержка, в течение которой пациент может высказать свою догадку, а программа принимает на вход аудио-данные.
- По завершении задержки программа включает алгоритм распознавания с теми входными данными, что успел произнести пациент.
- По нажатии кнопки "Следующая запись" мы переходим к следующему аудиофайлу.
Длительность задержки определяется в окне настроек сессии. Значение по умолчанию - 3 секунды.
(Опционально) Во время шага 2 отображается прогресс-бар, с обратным отсчётом до следующего аудиофайла.
Добавить отображение выбранного уровня шума на странице результатов
Надиктовать wav файлы
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.