당뇨병 환자의 CAD 동반 질환 예측
Predicting the risk of coronary artery disease(CAD) onset in diabetes patients using the MIMIC-IV dataset and an undersampling-based model
-
MIMIC-IV 데이터 추출 및 정제
-
데이터 전처리
-
최종 데이터셋
-
5가지 모델에 훈련 후 성능 확인
-
BalancedBagging 하이퍼파라미터 튜닝
classifier = BalancedBaggingClassifier(
random_state=0,
n_estimators=400,
max_features=0.75,
sampling_strategy=0.7,
base_estimator=DecisionTreeClassifier(
max_depth=20,
min_samples_split=10,
min_samples_leaf=5,
max_features=0.75,
class_weight={0: 1.0, 1: 0.7}
)
)
-
XGBoost와 BalancedBagging 비교
-
feature selection을 통한 최종 모델링 코드