Ссылка на Kaggle.
В репозитории лежит полупустой файл train.csv
(я обрезал 1000 строк), поэтому надо скачать его с Kaggle и поменять.
- В
example_test_files
лежат примеры тестовых сетов, которые нам могут дать. - В
optiver2023
по сути находится файлpublic_timeseries_testing_util.py
только с названием competition. Там лежит штука для линукса, поэтому на винде ничего не запускается. Поэтому я создал рядом простой питонячий файл, но пока что не понял, что нужно указывать в полеself.group_id_column
. Однако на винде с WSL или линуксе можно забить на это болт и запустить из консольки питонячий файл main.py с аналогичным нотбуку содержимым - результат будет тот же. - Также положил сюда нотбук
subm.ipynb
, который можно засылать в качестве константного прогноза.
Нам нужно присылать кэгловский нотбук (вот мой), который надо для этого заранее сохранить там и прогнать (это делается автоматически).
Кроме того, перед сохранением надо выключить подключение к интернету у нотбука - в правой панельке проматываем вниз и в Notebook options
выключаем инет.
В нотбуке показано, как использовать функцию make_env()
, а затем как пользоваться полученной API через её метод iter_test()
, который бегает по тестовому множеству.
Этот метод составляет файл с ответами модели за нас, нам нужно только класть правильный таргет. На данном этапе он пишет, что написан не оптимально, хз, надо ли этот файлик переписывать, но зашло и так.