Data science (machine learning) python pet-projects, including the most important methods/attributes to work with dataframes, train models and predict results
Первый проект, показана работа с основными методами sklearn для организации работы деревьев решений - DecisionTrees
, выбор метрик и их сравнение/варьирование в зависимости от конкретной задачи, а также различные диаграммы и другие методы визуализации полученных результатов встроенными методами pandas, sklearn
pandas
.read_csv()🦎.drop()🦎.get_dummies()🦎.fillna()🦎.melt()
sklearn
tree.DecisionTreeClassifier()🦎.fit()🦎train_test_split()🦎.score()🦎.predict()🦎.predict_proba()🦎cross_val_score()🦎GridSearchCV()🦎.best_params_🦎.best_estimator_🦎precision_score()🦎recall_score()🦎.plot_roc_curve()🦎.plot_precision_recall_curve()🦎.plot_confusion_matrix()
seaborn & numpy
np.where()🦎sns.lineplot()
Подробное описание в самом блокноте проекта
На двух датасетах показана работа с основными методами sklearn для организации работы группы деревьев решений - RandomForest
, методы визуализации важности (влияния на результат) фичей
sklearn
tree.RandomForestClassifier()🦎n_estimators🦎.feature_importances_
numpy
np.random.seed()
Подробное описание в самом блокноте проекта