Git Product home page Git Product logo

competitive_data_science's Introduction

Competitive Data Science Course

Материалы по курсу Введение в соревновательный анализ данных.

Канал в телеграм t.me/data_science_winners

Code style: black

1. 🚀 Введение

Введение в соревновательный Data Science

  • 1.1 🎬 Что даст тебе этот курс?
  • 1.2 ✈️ Суть соревновательного анализа данных
  • 1.3 🤼‍♀️ А с кем и где будем соревноваться в курсе?

2. 🎵 Классические элементы анализа данных

А ты думал сразу стакать будем?!

  • 2.1 🎓🐍 Пишем и организуем код
  • 2.2 🎓🐼 Pandas. Забудь про циклы! 🐍
  • 2.3 💾📈 Данные и визуализация. Куда двигаться?!
  • 2.4 🦾🤖 Валидация и модели

3. 🤿 Углубляемся в Feature Engineering

Перед тем как накидывать модели, выжмем максимум из данных

  • 3.1 💪🐼 Pandas мощнее, чем ты думаешь!
  • 3.2 🤜🦈Генерируем новые признаки и увеличиваем точность
  • 3.3 ☂️ Фильтрация признаков
  • 3.4 👀🚗 Визуализация. Как понять, где модель косячит?
  • 3.5 🦆🔥 Секретный гость (Интервью с KGM)

4. 👨‍🔧Тюнинг бустингов как искусство

Знать как устроены модели мало, надо уметь их оптимизировать

  • 4.1 😺🚀 CatBoost + Feature Engineering
  • 4.2 🦄🎳 LightGBM + Feature Engineering
  • 4.3 👽🔱 XGBoost + Feature Engineering
  • 4.4 🌳🌲🌴 Бустинги. Практика
  • 4.5 🦆🔥 Секретный гость (Советы от KGM)

5. 🍋💦 Выжимаем максимум из ML моделей

Жмем Shift + Tab и подбираем гипер-параметры моделей автоматически

  • 5.1 🎣 Автоматическая генерация и фильтрация признаков
  • 5.2 ⚙️ Не время блендить, давайте выжмем еще!
  • 5.3 🦆🔥 Секретный гость (Секреты от KGM)

6. 🧞‍♂️ Блендинг, cтекинг и другие техники дойти до 95%

И один ты в поле воин, если твой ансамбль из сотни скроен.

  • 6.1 ⚔️ Блендинг. Смешай и точность вырастет!
  • 6.2 💎 Стекинг. Точность снова выросла, да ну на?!
  • 6.3 🦏 Автоматический блендинг и стекинг. Sklearn-Pipelines
  • 6.4 🍸🍧 Взболтать, но не смешивать. Практика

7. 🙋‍♀️ Вспомогательные техники

Помоги своему пайплайну дышать свободнее

  • 7.1 ⏱ Оптимизация памяти и ускорение вычислений
  • 7.2 🧹 Парсинг внешних данных

8. 🏆🥳 Kaggle. Ящик инструментов для победы

  • 8.1 Полное baseline решение. Бей его!
  • 8.2 🚢 Работа с платформой Kaggle и Kaggle API
  • 8.3 🌈 Google Colab, Paper Space, Yandex Cloud и другие

9. 🎁 Бонусные главы

Этих главы не обязательны для получения сертификата за курс, но эти главы выделят тебя на фоне остальных.

  • 9.1 🧠 А нейронки будут ?!
  • 9.2 🚚 Продвинутый Feature Engineering
  • 9.3 🏋️‍♂️🏌️‍♂️ Weigths & Biases
  • 9.4 👩‍🎤👨‍🎤💡Работа в команде

10. 🤐🎃 Запрещенные техники или что там по привату?!

Предупрежден - значит вооружен!

  • 10.1 🎲 Работа с метрикой. Пре-процессинг и пост-процессинг
  • 10.2 🎭 Псевдолейблинг
  • 10.3 🏹 Пробиваем лидерборд

11. 🏁 Финиш курса

  • 11.1 Ну вот и все. Что дальше?

Ссылка на курс: https://stepik.org/a/108888

Авторы

  • Миленькин Александр (@Aleron)
  • Александров Иван (@ivanich_spb)
  • Вольнов Сергей (@sergak0)

competitive_data_science's People

Contributors

a-milenkin avatar sergak0 avatar tenishevnikita avatar ivanich-spb avatar livingtonds avatar bovrrr avatar ilgorjon avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.