Сертификаты о прохождении курсов

Ноутбуки .ipynb и .py скрипты:

  1. Репозиторий - Проекты Data Science
  2. Репозиторий - Проекты Data Analyst
  3. Репозиторий - Алгоритмы и структуры данных


  1. Репозиторий - Web-приложение для определения цены автомобиля
  2. Репозиторий - OpenSource. Классы для отбора признаков и обработке DataFrame. PyPI проект
  3. Репозиторий - Модульная обработка изображений с использованием OpenCV и генераторов Python с помощью Detectron2
  4. Развертывание Yandex Node


Отображение некоторых элементов ограничено - рекомендую смотреть проекты через External Viewer
Для удобства, ссылки ведут сразу на данный сервис просмотра. Если нужны исходные файлы - переходи на соответствующий репозиторий

Проекты Data Science. Deep learning

Проект Тип исследования Статус
01. Компьютерное зрение. Регрессия Необходимо построить модель, которая по фотографии определит приблизительный возраст человека. В нашем распоряжении набор фотографий людей с указанием возраста Завершен
02. Обучение нейронных сетей. DLS Полный цикл обучения ANN, CNN на pyTorch Завершен
03. Компьютерное зрение. Сегментация Реализация архитектур нейронных сетей для задач сегментации, pyTorch Завершен
04. Компьютерное зрение. Автоэнкодеры Реализация архитектур нейронных сетей автокодировщиков, pyTorch Завершен
05. Компьютерное зрение. GAN Реализация архитектур нейронных сетей GAN, pyTorch Завершен
06. Simpsons классификация. CNN Классификация. Компьютерное зрение Завершен
07. Модуль детекции объектов Детекция, сегментация на кастомном сете данных, создание приложения Завершен

Проекты Data Science. Deep learning и NLP

Проект Тип исследования Статус
01. NLP. Классификация тональности текста Необходимо обучить модель классифицировать комментарии на позитивные и негативные Завершен
02. NLP. Простые эмбеддинги реализация простых эмбеддингов, word2vec, ранжирование, pyTorch Завершен
03. NLP. Эмбеддинги реализация эмбеддингов с применением SVD, word2vec, классификация, pyTorch Завершен
04. NLP. Классификация реализация различных подходов к классификации текстов, RNN, CNN, pyTorch Завершен
05. NLP. Языковые модели реализация различных подходов к определению POS, pyTorch Завершен
06. NLP. Seq2Seq with attention реализация seq2seq модели с аттеншн Завершен
07. NLP. BERT работа с трансформерами. BERT Завершен
08. NLP. GPT2 работа с трансформерами. GPT2 Завершен
09. NLP. Summarization работа с с архитектурами для суммаризации текста Завершен
10. NLP. Audio processing работа со звуком, классификация и регрессия Завершен
11. NLP/CV. Image Captioning работа с задачей Image Captioning Завершен

Проекты Data Science. Классический ML

Проект Тип исследования Статус
01. Рекомендация тарифов В нашем распоряжении данные о поведении клиентов, которые уже перешли на эти тарифы. Нужно построить модель для задачи классификации, которая выберет подходящий тариф.Необходимо построить модель с максимально большим значением accuracy Завершен
02. Прогнозирование оттока клиентов банка Необходимо спрогонозировать, уйдет ли клиент в ближайшее время или нет. Завершен
03. Прогнозирование прибыли от нефтяных скважин Моделирование прогнозов (регрессия) Завершен
04. Предсказание коэффициента восстановления золота из золотосодержащей руды Машинное обучение, предобработка данных, визуализация, проверка гипотез. Построение модели для промышленной компании Завершен
05. Аппроксимация и оптимизация Изучение методом аппроксимации и оптимизации функций, численные методы Завершен
06. Защита персональных данных клиентов страховой компании Необходимо защитить персональные данные клиентов страховой компании. Разработать такой метод преобразования данных, чтобы по ним было тяжело восстановить исходную информацию и при этом не менялось качество линейной регрессии. Завершен
07. Предсказания цены автомобиля Необходимо построить и сравнить несколько моделей для определения стоимости автомобиля Завершен
08. SMA стратегия Forex Работа с временными рядами, реализация торговой стратегии Завершен
09. Прогнозирование количества заказов такси Работа с временными рядами, Необходимо построить модель для прогнозирования количества заказов такси. Завершен
10. Аналитика в авиакомпании Понять предпочтения пользователей, покупающих билеты на рейсы в города, где проходят крупнейшие фестивали Завершен
11. OOП в линейных моделях ООП в линейных моделях Завершен
12. Исследование оттока клиентов телеком компании Дипломный проект. Дисбаланс классов, классификация бинарная Завершен
13. Web-приложение - Предсказание цены автомобиля Приложение с API. Flask, html, css, python Завершен
14. Предсказание дефолта клиентов банка Предсказание дефолта с помощью инструментов МЛ, pipiline обработки для продакшн Завершен
15. Предсказание температуры и углерода в процессе продувки Предсказание двух целевых переменных в задаче регрессии с помощью инструментов МЛ, pipiline обработки для продакшн, борьба с различным распределением целевой переменной Завершен
16. Прогнозирование востребования банковской гарантии Построить аппликационную модель оценки вероятности предъявления по гарантии, чтобы минимизировать потери от кредитного риска Завершен
17. Решение задачи регрессии SparkML Построить пайплайн обработки данных с помощью средств SparkML Завершен

Проекты Data Analyst

Проект Тип исследования Статус
01. Исследование объявлений о продаже квартир Исследовательский анализ данных Необходимо определить параметры, оказывающие наибольшее влияние на оценку стоимости недвижимости. Завершен
02. Определение перспективного тарифа для телеком компании Статистический анализ данных Необходимо проанализировать активность клиентов в разрезе тарифов, и определить более перспективный тариф для маркетинговой кампании. Завершен
03. Исследование надёжности заёмщиков Предобработка и очистка данных. Кредитный отдел банка запросил исследовать, какие факторы влияют на надёжность заёмщика. Необходимо предоставить портрет надёжного заемщика. Завершен
04. Прогноз продаж в интернет-магазине Исследовательский и статистический анализ Необходимо выявить определяющие успешность игры закономерности и для каждого из трех регионов (NA, Europe, JP) выбрать игры для рекламных кампаний. Завершен
05. Исследование продаж авиабилетов Понять предпочтения пользователей, покупающих билеты на рейсы в города, где проходят крупнейшие фестивали Завершен
06. Анализ бизнес показателей сервиса Афиша Выявить убыточные источника траффика. Когортный анализ Завершен
07. Принятие решений в бизнесе на основе данных Приоритизировать гипотезы, А/В тестирование Завершен
08. Рынок заведений общественного питания Москвы Исследовать различные форматы точек общественного питания Завершен
09. Исследование поведения пользователей приложения Изучить воронку продаж. Проанализировать результаты ААВ теста Завершен
10. Автоматизация и подготовка dashboards автоматизировать загрузку данных в БД, построить dashboard Завершен
11. Прогнозирование оттока клиентов фитнес-центра Кластеризация, машинное обучение Завершен
12. Телеком. Поиск клиента с неоптимальными тарифами Исследовательский анализ данных. Статистический анализ данных. Поиск закономерностей и разработка методов оптимизации Завершен

Проекты Kaggle

Проект Тип исследования Статус
01. Titanic competition Машинное обучение. Задача классификации и оптимизации Завершен
02. Montecarlo Визуализация ЦПТ и закона больших чисел Завершен
03. Heart attack analysis and prediction Построение модели, предсказывающий сердечный приступ у пациента Завершен
04. Video games EDA Исследовательский анализ продаж игр на различных платформах Завершен
05. Client churn from bank Машинное обучение. Построение модели машинного обучения. Задача классификации Завершен
06. Video games with score Исследовательский анализ продаж игр на различных платформах и рейтинга Завершен
07. Cleaned Toxic Comments NLP, построение модели машинного обучения для предсказаания токсичности текстов Завершен
08. ML Contest Наработки за время прохождения соревнований 30days of ML. Baseline Завершен
09. Digits recognation Распознавание цифр. MNIST, Keras CNN, Tensorflow Завершен
10. LastFM recommendation system Простая рекомендательная система Завершен
11. Telco Customer Churn Предсказать отток клиентов Завершен

Course completion certificates

Notebooks .ipynb and .py scripts:

  1. Repository - Data Science projects
  2. Repository - Data Analyst projects
  3. Repository - Algorithms and data structures


  1. Repository - Web application for determining the price of a car
  2. Repository - OpenSource. Classes for feature selection and DataFrame processing. PyPI project
  3. Repository - Modular image processing using OpenCV and Python generators with Detectron2
  4. Yandex Node Deployment


The display of some elements is limited - I recommend watching projects through External Viewer For convenience, links lead directly to this viewing service. If you need source files, go to the appropriate repository

Data Science projects. Deep learning

Project Type of research Status
01. Computer vision. Regression It is necessary to build a model that will determine the approximate age of a person from a photograph. We have at our disposal a set of photographs of people with the indication of age Completed
02. Training of neural networks. DLS Full training ANN, CNN on pyTorch Completed
03. Computer vision. Segmentation Implementing neural network architectures for segmentation tasks, pyTorch Completed
04. Computer vision. Autoencoders Implementing autoencoder neural network architectures, pyTorch Completed
05. Computer vision. GAN Implementing neural network architectures GAN, pyTorch Completed
06. Simpsons classification. CNN Classification. Computer Vision Completed
07. Object detection module Detection, segmentation on custom data network, application creation Completed

Data Science projects. Deep learning and NLP

Project Type of research Status
01. NLP. Classification of the sentiment of the text It is necessary to train the model to classify comments into positive and negative Completed
02. NLP. Simple embeddings implementation of simple embeddings, word2vec, ranking, pyTorch Completed
03. NLP. Embeddings implementation of embeddings with SVD, word2vec, classification, pyTorch Completed
04. NLP. Classification implementation of different attempts for text classification, RNN, CNN, pyTorch Completed
05. NLP. Language models POS-tagging Completed
06. NLP. Seq2Seq with attention seq2seq model, LSTM, torch Completed
07. NLP. BERT Transformers. BERT Completed
08. NLP. GPT Transformers. GPT2 Completed
09. NLP. Summarization Summarunner Completed
10. NLP. Audio processing audio classification Completed
11. NLP/CV. Image Captioning Image Captioning Completed

Data Science projects. Classic ML

Project Type of research Status
01. Tariff recommendation We have at our disposal data on the behavior of customers who have already switched to these tariffs. It is necessary to build a model for the classification problem, which will select a suitable tariff. It is necessary to build a model with the highest possible accuracy Completed
02. Forecasting the churn of bank customers It is necessary to predict whether the client will leave in the near future or not Completed
03. Forecasting profit from oil wells Modeling Forecasts (Regression) Completed
04. Predicting the recovery rate of gold from gold ore Machine learning, data preprocessing, visualization, hypothesis testing. Building a model for an industrial company Completed
05. Approximation and Optimization Studying by the method of approximation and optimization of functions, numerical methods Completed
06. Protection of personal data of clients of the insurance company It is necessary to protect the personal data of the clients of the insurance company. To develop such a method of data transformation so that it would be difficult to restore the original information based on them and at the same time did not change the quality of linear regression. Completed
07. Car price predictions Multiple Models To Be Build And Compare To Determine The Value Of A Car Completed
08. SMA strategy Forex Working with Time Series, Implementing a Trading Strategy Completed
09. Forecasting the number of taxi orders Working with time series, It is necessary to build a model to predict the number of taxi orders. Completed
10.Analytics in the air company Understand the preferences of users who buy tickets for flights to cities where major festivals take place Completed
11. OOP in linear models OOP in linear models Completed
12. Research of the churn of clients of a telecom company Graduation project. Class imbalance, binary classification Completed
13. Web Application - Car Price Prediction Application with API. Flask, html, css, python Completed
14. Predicting default of bank clients Default prediction using ML tools, pipiline processing for production Completed
15. Predicting temperature and carbon during purging Predicting two target variables in a regression problem using ML tools, pipiline processing for production, dealing with different target variable distributions Completed
16. Forecasting the demand for a bank guarantee Build an application model for assessing the probability of presentation under a guarantee in order to minimize losses from credit risk Completed
17. Regression task with SparkML Build pipeline of prediction and validation with SparkML Completed

Data Analyst projects

Project Type of research Status
01. Research of apartments for sale Exploratory data analysis It is necessary to identify the parameters that have the greatest impact on the valuation of real estate. Completed
02. Determination of a promising tariff for a telecom company Statistical analysis of data It is necessary to analyze the activity of customers in the context of tariffs, and determine a more promising tariff for a marketing campaign. Completed
03. Borrower Reliability Study Data preprocessing and cleaning. The credit department of the bank requested to investigate what factors affect the reliability of the borrower. It is necessary to provide a portrait of a reliable borrower. Completed
04. Online store sales forecast Research and statistical analysis It is necessary to identify the regularities that determine the success of the game and select games for advertising campaigns for each of the three regions (NA, Europe, JP). Completed
05. Air ticket sales research Understand the preferences of users who buy tickets for flights to cities where major festivals take place Completed
06.Analysis of business indicators of the Afisha service Identify unprofitable traffic sources. Cohort Analysis Completed
07. Data-Driven Business Decision Making Prioritize hypotheses, A / B testing Completed
08. Moscow catering establishments market Explore different formats of food service outlets Completed
09. Researching the behavior of users of the application Explore the sales funnel. Analyze AAV test results Completed
10. Automation and provisioning dashboards automate data loading into the database, build a dashboard Completed
11. Fitness center customer churn forecasting Clustering, Machine Learning Completed
12. Telecom. Finding a client with suboptimal rates Exploratory data analysis. Statistical data analysis. Finding patterns and developing optimization methods Completed

Проекты Kaggle

Project Type of research Status
01. Titanic competition Machine learning. Classification and Optimization Problem Completed
02. Montecarlo Visualization of the CLT and the law of large numbers Completed
03. Heart attack analysis and prediction Building a Model Predicting a Patient's Heart Attack Completed
04. Video games EDA Research Analysis of Game Sales on Various Platforms Completed
05. Client churn from bank Machine learning. Building a machine learning model. Classification Task Completed
06. Video games with score Research Analysis of Game Sales on Various Platforms and Rankings Completed
07. Cleaned Toxic Comments NLP, Building a Machine Learning Model to Predict Text Toxicity Completed
08. ML Contest Operating time during the competition 30days of ML. Baseline Completed
09. Digits recognation Recognition of numbers. MNIST, Keras CNN, Tensorflow Completed
10. LastFM recommendation system Simple recommendation system Completed
11. Telco Customer Churn Predict Customer Churn Completed

Artem Solomko's Projects

algorithms icon algorithms

Алгоритмы и структуры данных

detection icon detection

DLS diploma project - Autumn'21. Module pipe for detection

