본문 바로가기

통계학 기초

(14)
회귀모델 평가를 위한 통계 오차 지표 모음(MSE, MAE, RMSE 등 5개 지표) 다양한 회귀모델이 있는데, 가장 중요한 것은 모델의 성능을 비교할 수 있는 지표가 필요하다. 이를 위해서 통계 오차를 사용하고, 대표적인 지표인 MSE, RMSE, MAE, MAPE, 그리고 sMAPE에 대해서 수식과 해석할 수 있는 가이드를 얘기해보고자 한다. 목차 1. 통계 오차란 무엇이고, 회귀 모델에 왜 필요할까? 2. MSE 수식과 해석 방법 3. RMSE 수식과 해석 방법 4. MAE 수식과 해석 방법 5. MAPE 수식과 해석 방법 6. sMAPE 수식과 해석 방법 1. 통계 오차란 무엇이고, 회귀 모델에 왜 필요할까? 회귀 모델에서 왜 오차라는 지표가 필요한지에 대해 알려면, 회귀 모델에 대해서 아주 간략하게라도 이해가 필요하다. 회귀분석 모델은 X축과 Y축 모두 연속현 변수(Numeric..
[Python]독립표본(Independent Samples) T-Test를 활용한 A/B Test 검증(코드부터 결과 해석까지 한 번에) E-commerce에서 가장 많이 하는 데이터 분석 업무 중 하나가 바로 A/B Test이다. 빈도주의 관점에서 실행할 수 있는 모델링 중 가장 기초적이면서도 바로 실무에 활용할 수 있는 모델이 독립표본 T-test이다. 이번 포스팅에서는 모델에 대한 기본 소개, 가설부터 시작하여 예제 코드까지 다루어볼 예정이다. 목차 1. E-commerce 환경에서 A/B Test의 기본적인 소개 2. 독립표본 T-Test의 소개 및 기본 가설 3. A/B Test 환경에서 실행하는 독립표본 T-Test 1. E-commerce 환경에서 A/B Test의 기본적인 소개 🔎 A/B Test라는 것은 무엇이며, 왜 필요하나요? 쉬운 버전으로 말하면, A/B Test은 기본적으로 두 가지 대안이 있을 때, 어떤 옵션이 더..
[Python]이원분산분석(Two-way ANOVA) 코드부터 결과 해석 가이드 Two-way ANOVA는 논문 연구주제부터 실무에서까지 굉장히 많이 쓰이는 통계 분석 방법이다. 이원배치분산분석의 개념을 아주 쉽게 설명하는 것부터 시작하여 Stats모델을 통한 코드 및 결과해석 실습까지 해보고자 한다. 목차 1. 이원배치분산분석의 분석 과정 안내 2. 이원분산분석(Two-way ANOVA)의 통계적 개념, 사전 조건, 그리고 가설 3. 기초 데이터셋 설명 및 전처리 안내 - 쉽게 따라하기 4. 상호작용(Interaction Effect)를 통한 결과 해석 이원배치분산분석의 분석 과정 안내 이원배치분산 분석, 왜 그리고 언제 써야 쓰는 모델인가 이원배치분산 분석은 독립변수(범주형 척도)가 2개이고 종속변수(연속형 척도)가 하나일 때 독립변수 간에 나타나는 상호작용을 검증해보기 위해서 ..
[Python] 카이제곱 독립성 검정을 활용한 데이터 분석(feat. A/B Test까지) 카이제곱(chi-square) 독립성 검정은 두 변수 간 상호 영향도를 판단할 때 사용하는 대표적인 통계모델이다. 오늘은 이 모델의 개념과 수식부터 시작해서 예제를 통해 이해해보도록 하겠다. 또한 실제 A/B Test에서는 카이제곱 모델을 어떻게 활용하는지 Python을 통해서 구현해보도록 하겠다. 글의 목차 1. 카이제곱 독립성 검정의 개념 2. 카이제곱 독립성 검정의 수식 3. A/B Test에서 활용하는 카이제곱 독립성 검정 카이제곱 독립성검정의 개념 카이제곱 독립성 검정의 목표는 "내가 설정한 독립변수(원인)가 종속변수(결과)에 정말 영향을 미치는지 아니면 독립적인지"하기 위해서 하는 작업이다. 인과관계를 증명할 때 다양한 모델이 있지만, 카이제곱 검정을 반드시 써야만 할 때가 있다. 그렇다면 어..
[Python] COHORT 분석 개념부터 실전 코드까지 (feat. 분석 예제 포함) 이번 글에서는 Cohort분석을 통해서 고객들이 웹사이트/앱에 얼마나 재방문을 하는지 파악하는 방법을 알아보고자 한다. COHORT 분석의 기초 개념부터 시작하여, 실제 어떻게 코드로 구현할 수 있는지, 마지막으로 실무에서는 Retention 인사이트를 어떻게 뽑아낼 수 있는지 알아보겠다. COHORT 분석의 정의와 활용 방법 코호트 분석의 정의 코호트 분석(COHORT Analysis)이란 특정 기간 동안 일정한 기준으로 동일한게 묶을 수 있는 사용자들의 집단을 분석하는 기법이다. 가장 흔하게 쓰이는 방법은 특정 날짜를 기준으로 사용자들을 하나의 집단으로 묶어 이들의 행동을 분석하는 것이다. 코호트 분석을 하는 이유 가장 핵심적인 것은 왜 고객들을 하나의 집단으로 묶는가를 아는 것이다. 실무적으로는 고..
[Python]베이지안 A/B Test로 기대수익과 기대손실 계산하는 방법 이번 포스팅에서는 베이지안 A/B Test를 수행한 이후 기대 수익을 계산하는 방법에 대해서 얘기해보고자 한다. 기존에는 결과 값이 0과 1로 boolean 값이기 때문에 Beta 분포를 사전분포로 활용했었다. 그러나 기대수익은 단위당 수익을 나타내는 양의 실수이기 때문에 동일한 분포를 적용할 수 없는 문제가 생긴다. 이러한 문제를 Gamma 분포와 베이지안 추론을 통해서 해결하는 방법을 Python기반으로 소개해보고자 한다. 1. 이론적 방법 소개 - 감마분포를 통한 기대수익 산출 방법 (1) 베이지안 추론 - Prior 변수 설명 우리는 이번 목적이 기대수익을 창출하는 것이다. 아주 간단한 아이디어부터 시작을 해보자. 1,000명의 사람이 들어왔을 때 만약 100명이 구매를 했고, 1명당 평균 수익이..
[Python] 선형회귀분석을 이론, 결과해석, 그리고 코드까지 (Linear Regression Model) 통계학 모델 중에서 가장 기초이자 반드시 알아야 할 선형회귀분석(Linear Regression Model)을 소개할 것이다. 이 통계 모형을 처음 듣는 사람에게 설명한다는 관점으로 회귀분석이론부터 시작하여 회귀분석의 목적, 수식으로 이해하는 회귀모형, 회귀분석의 목적 그리고 회귀분석 결과 해석하는 가이드를 설명할 것이다. 이 모든 과정을 Python으로 구현해봄으로써 실무에서 어떻게 사용할 수 있을지까지 힌트를 남길 것이다. [ 글의 목차 ] 1. 회귀분석의 기초 2. 선형회귀분석의 목적 3. Linear Regression Model의 수식 4. 선형회귀분석의 해석 방법 5. 코드로 Linear Regression Model 구현해보기 1. 회귀분석의 기초 회귀분석을 가장 쉽게 말하자면, 결과를 일으..
[Python] One way ANOVA 분석하기 - 이론부터 코드까지 한 번에 이번 포스팅에서는 ANOVA 중 가장 기초적인 One Way ANOVA 분석에 대해서 이론부터 시작하여 Python 코드로 실제 구현하는 부분까지 다루어볼 것이다. 파이썬 패키지 중에서도 Stats 와 Scipy 패키지를 활용하여 원하는 스타일에 맞게 보고서를 작성하는 연습을 진행해볼 것이다. [ 글의 목차 ] 1. ANOVA는 무엇이고, One Way ANOVA는 무슨 차이인가? 2. Python으로 One Way ANOVA 분석을 하는 방법 1. ANOVA는 무엇이고, One Way ANOVA는 무슨 차이인가? ✅ 결과 미리보기 - One way ANOVA 분석 이렇게 진행해요! (1) 일원분산분석(One way ANOVA)의 개념 및 수식 1 - 1) 개념으로 이해하는 ANOVA 분산분석(ANOVA..

728x90
반응형