데이터 분석-캐글 집값 예측(발표)
개요 1. 데이터 전처리(이상치, 결측값제거 포함) 2. 교차검증, 모델 셋업 3. 스태킹, 스코어 4. 블랜드, 최종결과 다음으로 각 모델들을 블렌딩한 후, 예측값을 출력해보겠습니다. 블렌딩은 앙상블 기법 중 하나로, 앙상블 기법은 머신 러닝에서 다양한 베이스 모델을 결합하여 단일 모델보다 향상된 성능의 예측 모델을 만들어냅니다. 즉, 위와 같이 train set을 학습 시킬 때 한가지 알고리즘이 아니라 다양한 모델을 사용하는 것입니다. 저희는 WEIGHT 블렌딩을 사용했기 때문에 위에서 평가한 각 모델의 예측 능력을 고려해 가중치를 부여했고, 여기서 가중치는 총 합이 1이 되어야 합니다. 그리고 앙상블 모델의 경우 표준 편차를 계산하기 어려우므로, 0으로 설정합니다. 블렌딩한 모델을 포함해 각 모델의..
데이터 분석
2023. 9. 29. 02:00