Генерация стрессовых данных для оценки устойчивости моделей прогнозирования многомерных временных рядов
Репозиторий для проекта в Лето с AIRI - "Генерация стрессовых данных для оценки устойчивости моделей прогнозирования многомерных временных рядов".
Сдвиги в данных ухудшают качество моделей машинного обучения. Для оценки устойчивости моделей к сдвигам можно использовать метод наихудшего риска. Метод использует только исторические данные. А что если новые данные будут отличаться?
Решение: создать правдоподобные методы генерации временных рядов для оценки устойчивости моделей. Цель работы: оценить качество моделей на валидационной выборке и на фейковых данных и оценить устойчивость к сдвигам данных.
- Имплементация VARIMAX,DeepAR,Informer и измерение качества прогноза.
- Обучение GAN, VAE и измерение качества генерации. Генерация фейковых данных.
- Анализ устойчивости Informer, SARIMAX и DeepAR на фейковой выборке.
- Данил Гусак
- Юлия Якимова
- Виталий Поздняков