본문 바로가기

통계학 기초

(14)
베이지안 기초4. 실전 A/B Test 코드 구현하기[Python] [글의 목차 - Contents] 1. A/B Test란? - 간단하게 알아보기 2. 베이지안 A/B Test 절차 정리 (1) 기본 데이터셋 설명 - A/B Test의 실전 데이터셋 구현 (2) 베이지안 추론 과정 설계 & Pseudo Code (3) 실제 코드로 구현하기 (4) 실험 과정 관측 및 실험 결과 해석 하기 1. A/B Test란? - 간단하게 알아보기 A/B Test란 하나의 실험으로서, 원하는 결과(종속변수)를 설정하여 A그룹과 B그룹을 비교해서, 더 높은 결과값을 나타내는 Group을 선택하는 과정을 의미한다. 보통 A/B Test는 기업에서 디자인들의 성과 비교, 클릭률 비교, 전환율 비교 등에 활용되는 용어이자 스킬로서 굉장히 주요한 개념으로 사용한다. 오늘은 베이지안 추론을 활용..
베이지안 기초3. 베이지안을 활용한 A/B Test 예시[Python] 여러분들의 광고 시청 및 클릭은 블로그 운영에 큰 힘이 됩니다!! 1. 베이지안 기초 개념 복습 - 베이지안 기초 함수: 𝑝(Θ|𝑋)=𝑝(𝑋|Θ)∗𝑝(Θ)𝑝(𝑋)p(Θ|X)=p(X|Θ)∗p(Θ)p(X) - Posterior: p(Θ | X ) - Likelihood: p(X | Θ) - Prior: p(Θ) - Evidence: p(X) 이 부분에 대해서 모르시겠다면 이전 포스팅을 참조해주시기 바랍니다. 베이지안 확률의 기본 이론: URL 베이지안 확률의 수식적 이해: URL 이번에 학습에 활용할 예시는 바로 일명 빠친코, Slot Machine입니다. 영어로는 bandit 예제로 유명한데요. Bayesian Machine Learning을 배우는 학생들이 필수 예시입니다. 이 예시가 가장 실용적인 이유..
베이지안 기초2. 베이지안 Classification의 이해 목차 1. 기본적인 Bayesian 수식 2. Bayesian by Likelihood & Prior 3. Conditional Independence Density 4. Final Naive Bayesian Function 1. 수식을 통한 Bayesian의 이해 들어가기 전에 기본 수식만 보면 이해가 안 갈 테니, 이해하기 쉬운 예제와 함께 보려고 한다. 우리가 소풍을 간다 안 간다를 예측하기 위해서, 여러가지 날씨 변수를 계산하다고 생각해보자. 우리가 날씨, 온도, 습도, 풍량, 수온, 일기 예보 정보를 알고 있을 때, 소풍을 갈지 안 갈지를 결정하는 상황이라고 이해해보자. 그러면 여기서 Y는 "소풍가기"가 될 것이고, 각 변수들은 X1 ~ X6까지 고려되어야 한다. 우선 소풍갈 확률은 편리하게 5..
베이지안 기초1. 기초 개념 및 예시를 통한 완벽 이해 학습 목표 및 목차 목표: 학부 수준에서 베이지안 논리를 이해하는 것 목차 1. 베이지안 확률론의 기본 2. 예시를 통해 베이지안 논리의 이해 1. 베이지안 확률론의 기본 1-1. 기본 개념 (1) 사전 확률 분포 - P(A) - 개념: 이미 알고 있는 정보. 관측 데이터와 혼동하면 안 된다. - 수식: P(A) (2) 자료의 확률 분포 - P(B|A) - 개념: 데이터에서 관측된 분포. 이것을 흔히 Likelihood라고 부르는 개념. 과거의 경험 혹은 관측 데이터에 근거하여, 사건 B가 발생할 확률을 부분적으로 알고 있는 것이다. 여기가 정말 핵심인 이유는 "과거의 데이터로 관심이 있는 사건의 확률에 대해 추정한다는 것"이다. 이 부분은 예시를 통해 더욱 이해가 가능할 것이다. - 수식: P(B|A)..
상관관계 분석의 실습 [Python 활용] 1. 활용 데이터셋 이전에 통계학에서 다루는 대표적인 상관 관계분석 모델을 이전 포스팅에서 알아봤다. 이번에는 실습을 해볼 차례로, 와인 데이터셋을 활용할 것이다. 이 데이터셋은 데이터 입문자들에게 아주 유용한 자료이니 비단 이 자료만이 아니더라도 활용해볼만한 가치가 있다고 생각한다. https://www.kaggle.com/datasets/yasserh/wine-quality-dataset?select=WineQT.csv Wine Quality Dataset Wine Quality Prediction - Classification Prediction www.kaggle.com 여기서는 총 13가지 Column들이 있는데, 실제 의미를 따지기 보다는 모델 실급에 적한한 변수들을 취사선택하여 실제 모델 해..
상관관계 분석의 기초 정립 [Python 활용] 1. 상관관계란? (1) 개념적 이해 상관관계란 두 연속 변수(numeric variable)이 선형 관계에 있는지 분석하는 기법으로 서로 움직이는 방향이 양(+)의 방향인지 혹은 음(-)의 방향인지 판단하는 것이다. 상관관계는 절대로 인과성을 증명하는 것이 아니다. 사회과학에서 인과 관계를 정의할 때는 3가지 조건을 지키는데, 상관관계는 이와는 관련이 없기 때문이다. 사회과학에서 말하는 인과관계 조건은 3가지가 있다. 첫 번째. 독립변수와 종속변수는 모두 변화가 존재해야 한다는 것 (concomitant variance) 두 번째. 독립변수는 종속변수보다 먼저 변화가 이루어져야 한다는 것 (Time Order) 세 번째. 독립변수와 종속변수 이외에 다른 외생 변수는 변화가 없어야 한다는 것 (Contr..

728x90
반응형