본문 바로가기

빅데이터 분석

(6)
Facebook Prophet 모델 - 초보자를 위한 이론부터 코드까지 한 번에 Prophet이란 Facebook(Meta)에서 시계열 예측을 위해서 개발한 Machine Learning 모델을 의미한다. 이번 포스팅에서는 Prophet모델의 통계적인 기초, 원리 그리고 구현 코드에 대해서 이해하기 쉽게 설명해보고자 한다. 목차 1. Facebook Prophet에 대한 기본 개념 잡기 2. Prophet 모델의 구성 요소 3. Prophet Python 코드로 구현하기 4. Prophet 학습 결과 시각화 진행하기 5. Prophet 모델의 장단점 및 추가 학습 범위 1. Facebook Prophet에 대한 기본 개념 잡기 프로핏은 다양한 시계열 예측 모형 중에서 비교적 최근에 나온 모델이다. 조금 더 정확하게 말해서 Prophet은 시계열 데이터 예측을 위해서 Meta, 과거에..
[논문 리뷰] CUPED의 이론부터 코드까지 한 번에 이해하기 CUPED란 Controlled Experiments by Utilizing Pre-Experiment Data의 약자로, 온라인 환경에서 A/B Test를 진행할 때 빈도주의 모델 성능을 획기적으로 개선시켜 줄 수 있는 모델을 의미한다. 이번 포스팅에서는 CUPED의 통계적 이론부터 시작하여, Python을 기반으로 어떻게 구현할 수 있는지에 대해서 다루어보고자 한다. 목차 1. CUPED 논문 소개 2. 사전 지식 익히기 - A/B Testing & 독립표본 T-Test 3. 사전 지식 익히기 - 기존 빈도주의 모델의 한계 4. CUPED 이론 이해하기 5. CUPED 코드로 구현하기 1. CUPED 논문 소개 CUPED는 Controlled Experiments by Utilizing Pre-Exp..
[GridSearchCV] 최고 와인품질 예측을 위한 Hyper Parameter 탐색(feat.Python) 이전 포스팅에서는 와인 품질 예측을 위해서 기본적으로 어떻게 모델을 적용해서 Classification을 하는지 알아봤다. 이번에는 각 모델 안에서 최적의 결과를 찾을 수 있는 Grid Search를 소개해보고자 한다. 이 과정은 Hypter Paramter를 탐색하는 과정으로 Machine Learning을 공부하는 사람들에게 필수적인 기능이기도 하다. 1. 기초 데이터 준비 우리가 사용할 기초 데이터셋은 와인 품질 데이터를 예측하기 위한 데이터이다. 이 데이터셋은 Kaggle이나 학교 과제용도로도 굉장히 유명한 데이터이기에 한 번씩 다루어보면 기초 실력을 쌓기에 좋다. 어디서 자료를 찾을 수 있을지 링크를 남겨둘테니, 필요한 사람은 참고해서 사용해보도록 하자. 데이터셋 원본 링크 - Red Wine ..
ECO Project - There are ways to save more people than Covid Vaccine. Title: There are ways to save more people than Covid-19 Vaccine. 1. Introduction (1) Covid, How serious it is? 인류는 과거에서부터 현대에서도 많은 질병과 전쟁을 치뤄왔다. 2003년에는 SARS(중증 급성 호흡기, 사스)로부터 인류는 위협을 받았고, 총 8,098명이 감염 됐고 그중에서 774명이 사망[1] 하였다. 2012년에는 MERS(중동 호흡기 증후군)가 전세계를 강타하여 총 2,494명이 감염 됐고 그 중에서 858명이 사망하여 치사율 약 20%라는 위협적인 질병을 겪었다 [2]. 그러나 코로나는 흑사병 이후로 다른 질병들이 따라올 수 없을만큼 인류에 많은 피해를 끼치고 있다. 총 감염자 수는 약 1억 8천만..
[Kaggle] Prosper Loan 데이터 분석1. 위험 회피형 투자자를 위한 포트폴리오(파이썬 기반 분석) 1. 데이터의 출처 및 설명 2. 데이터 분석의 목적 - 투자자 성향에 맞는 포트폴리오 제안 - 위험 회피형 3. 데이터 분석 - 데이터의 선정 및 정제, 데이터 분석, 데이터 시각화 및 최종 제안 1. 데이터의 출처 - Kaggle P2P 채권 데이터 www.kaggle.com/yousuf28/prosper-loan ProsperLoan Dataset www.kaggle.com (1) 데이터의 설명 요즘 한국에도 개인 간 금융 대출이 가능한 플랫폼이 있는데요, 이는 원래 미국에서 발전한 금융 플랫폼이죠. 그 중에 대표적인 회사 중에 하나가 Prosper Loan입니다. 여기서 거의 10년 전 데이터에 가까웟 현재 P2P 시장을 반영한다고 보기에는 다소 무리가 있으나 P2P 데이터에 대해 어떻게 실전에 ..
기초 모델링 연습. 와인 품질 예측을 위한 모델링(Wine Quality Prediction) 1. 데이터 기본 설명 - Wine Quality 2. 모델링을 위한 기본 프로세스 설명 3. 실제 모델링을 위한 코드 4. 코드 한 줄 정리 1. 데이터 기본 설명 - Wine Quality 이번 시간에는 모델링의 기초 중에 기초를 복습하는 차원에서 쉽고 유명한 데이터를 가져왔습니다. 이 데이터의 목적은 와인의 품질을 예측하는데 목적을 두고 있습니다. 데이터의 출처는 삽입되어 있는 주소로 따라가지면 편하게 다운 받을 수 있습니다. 각종 변수들은 산도, 알콜 농도, 잔여 당분 등 여러 가지 변수가 있습니다. 원래는 데이터 특성에 대한 심층적인 탐구가 이루어진 이후에 모델링으로 들어가는 것이 맞지만, 이번 포스팅은 "아 모델링은 이러한 과정을 거쳐서 이루어지는구나~"에 초점을 맞추기 때문에 최대한 단순하게..

728x90
반응형