본문 바로가기

빅데이터 분석/실전 데이터 분석 및 모델링

(3)
[논문 리뷰] CUPED의 이론부터 코드까지 한 번에 이해하기 CUPED란 Controlled Experiments by Utilizing Pre-Experiment Data의 약자로, 온라인 환경에서 A/B Test를 진행할 때 빈도주의 모델 성능을 획기적으로 개선시켜 줄 수 있는 모델을 의미한다. 이번 포스팅에서는 CUPED의 통계적 이론부터 시작하여, Python을 기반으로 어떻게 구현할 수 있는지에 대해서 다루어보고자 한다. 목차 1. CUPED 논문 소개 2. 사전 지식 익히기 - A/B Testing & 독립표본 T-Test 3. 사전 지식 익히기 - 기존 빈도주의 모델의 한계 4. CUPED 이론 이해하기 5. CUPED 코드로 구현하기 1. CUPED 논문 소개 CUPED는 Controlled Experiments by Utilizing Pre-Exp..
ECO Project - There are ways to save more people than Covid Vaccine. Title: There are ways to save more people than Covid-19 Vaccine. 1. Introduction (1) Covid, How serious it is? 인류는 과거에서부터 현대에서도 많은 질병과 전쟁을 치뤄왔다. 2003년에는 SARS(중증 급성 호흡기, 사스)로부터 인류는 위협을 받았고, 총 8,098명이 감염 됐고 그중에서 774명이 사망[1] 하였다. 2012년에는 MERS(중동 호흡기 증후군)가 전세계를 강타하여 총 2,494명이 감염 됐고 그 중에서 858명이 사망하여 치사율 약 20%라는 위협적인 질병을 겪었다 [2]. 그러나 코로나는 흑사병 이후로 다른 질병들이 따라올 수 없을만큼 인류에 많은 피해를 끼치고 있다. 총 감염자 수는 약 1억 8천만..
[Kaggle] Prosper Loan 데이터 분석1. 위험 회피형 투자자를 위한 포트폴리오(파이썬 기반 분석) 1. 데이터의 출처 및 설명 2. 데이터 분석의 목적 - 투자자 성향에 맞는 포트폴리오 제안 - 위험 회피형 3. 데이터 분석 - 데이터의 선정 및 정제, 데이터 분석, 데이터 시각화 및 최종 제안 1. 데이터의 출처 - Kaggle P2P 채권 데이터 www.kaggle.com/yousuf28/prosper-loan ProsperLoan Dataset www.kaggle.com (1) 데이터의 설명 요즘 한국에도 개인 간 금융 대출이 가능한 플랫폼이 있는데요, 이는 원래 미국에서 발전한 금융 플랫폼이죠. 그 중에 대표적인 회사 중에 하나가 Prosper Loan입니다. 여기서 거의 10년 전 데이터에 가까웟 현재 P2P 시장을 반영한다고 보기에는 다소 무리가 있으나 P2P 데이터에 대해 어떻게 실전에 ..

728x90
반응형