본문 바로가기

빅데이터 분석/기초 모델링 연습

(2)
[GridSearchCV] 최고 와인품질 예측을 위한 Hyper Parameter 탐색(feat.Python) 이전 포스팅에서는 와인 품질 예측을 위해서 기본적으로 어떻게 모델을 적용해서 Classification을 하는지 알아봤다. 이번에는 각 모델 안에서 최적의 결과를 찾을 수 있는 Grid Search를 소개해보고자 한다. 이 과정은 Hypter Paramter를 탐색하는 과정으로 Machine Learning을 공부하는 사람들에게 필수적인 기능이기도 하다. 1. 기초 데이터 준비 우리가 사용할 기초 데이터셋은 와인 품질 데이터를 예측하기 위한 데이터이다. 이 데이터셋은 Kaggle이나 학교 과제용도로도 굉장히 유명한 데이터이기에 한 번씩 다루어보면 기초 실력을 쌓기에 좋다. 어디서 자료를 찾을 수 있을지 링크를 남겨둘테니, 필요한 사람은 참고해서 사용해보도록 하자. 데이터셋 원본 링크 - Red Wine ..
기초 모델링 연습. 와인 품질 예측을 위한 모델링(Wine Quality Prediction) 1. 데이터 기본 설명 - Wine Quality 2. 모델링을 위한 기본 프로세스 설명 3. 실제 모델링을 위한 코드 4. 코드 한 줄 정리 1. 데이터 기본 설명 - Wine Quality 이번 시간에는 모델링의 기초 중에 기초를 복습하는 차원에서 쉽고 유명한 데이터를 가져왔습니다. 이 데이터의 목적은 와인의 품질을 예측하는데 목적을 두고 있습니다. 데이터의 출처는 삽입되어 있는 주소로 따라가지면 편하게 다운 받을 수 있습니다. 각종 변수들은 산도, 알콜 농도, 잔여 당분 등 여러 가지 변수가 있습니다. 원래는 데이터 특성에 대한 심층적인 탐구가 이루어진 이후에 모델링으로 들어가는 것이 맞지만, 이번 포스팅은 "아 모델링은 이러한 과정을 거쳐서 이루어지는구나~"에 초점을 맞추기 때문에 최대한 단순하게..

728x90
반응형