본문 바로가기

전체 글

(92)
Facebook Prophet 모델 - 초보자를 위한 이론부터 코드까지 한 번에 Prophet이란 Facebook(Meta)에서 시계열 예측을 위해서 개발한 Machine Learning 모델을 의미한다. 이번 포스팅에서는 Prophet모델의 통계적인 기초, 원리 그리고 구현 코드에 대해서 이해하기 쉽게 설명해보고자 한다. 목차 1. Facebook Prophet에 대한 기본 개념 잡기 2. Prophet 모델의 구성 요소 3. Prophet Python 코드로 구현하기 4. Prophet 학습 결과 시각화 진행하기 5. Prophet 모델의 장단점 및 추가 학습 범위 1. Facebook Prophet에 대한 기본 개념 잡기 프로핏은 다양한 시계열 예측 모형 중에서 비교적 최근에 나온 모델이다. 조금 더 정확하게 말해서 Prophet은 시계열 데이터 예측을 위해서 Meta, 과거에..
회귀모델 평가를 위한 통계 오차 지표 모음(MSE, MAE, RMSE 등 5개 지표) 다양한 회귀모델이 있는데, 가장 중요한 것은 모델의 성능을 비교할 수 있는 지표가 필요하다. 이를 위해서 통계 오차를 사용하고, 대표적인 지표인 MSE, RMSE, MAE, MAPE, 그리고 sMAPE에 대해서 수식과 해석할 수 있는 가이드를 얘기해보고자 한다. 목차 1. 통계 오차란 무엇이고, 회귀 모델에 왜 필요할까? 2. MSE 수식과 해석 방법 3. RMSE 수식과 해석 방법 4. MAE 수식과 해석 방법 5. MAPE 수식과 해석 방법 6. sMAPE 수식과 해석 방법 1. 통계 오차란 무엇이고, 회귀 모델에 왜 필요할까? 회귀 모델에서 왜 오차라는 지표가 필요한지에 대해 알려면, 회귀 모델에 대해서 아주 간략하게라도 이해가 필요하다. 회귀분석 모델은 X축과 Y축 모두 연속현 변수(Numeric..
[MySQL] Hackerrank - Challenges 문제 풀이 및 해설 오늘 풀어보면서 공부할 문제는 Hackerrank에서 출제한 SQL Project Planning이다. 이 문제를 풀 때 개인적으로 Exists문을 통해서 풀어 냈고, 이 과정에서 배운 것을 공유하고자 한다. 목차 1. 문제 출처 및 소개 2. MAX와 IN을 이용한 문제 풀이 3. Lesson Learned 1. 문제 출처 및 소개 문제의 출처: URL 문제의 요구 조건 정리 Hacker의 ID, 이름 그리고 각자 만든 문제 수를 호출하는 것 정렬 순서는 문제 수 기준 내림차순과 hacker id기준으로 오름차순으로 정리 문제의 특이사항 정리 만약에 중복된 문제 개수가 있다면 제외할 것 단, 그 중복된 문제 개수가 최대값과 일치한다면 제외시키지 말 것 이 문제의 핵심은 문제 풀이 수를 기준으로 예외 처..
[논문 리뷰] CUPED의 이론부터 코드까지 한 번에 이해하기 CUPED란 Controlled Experiments by Utilizing Pre-Experiment Data의 약자로, 온라인 환경에서 A/B Test를 진행할 때 빈도주의 모델 성능을 획기적으로 개선시켜 줄 수 있는 모델을 의미한다. 이번 포스팅에서는 CUPED의 통계적 이론부터 시작하여, Python을 기반으로 어떻게 구현할 수 있는지에 대해서 다루어보고자 한다. 목차 1. CUPED 논문 소개 2. 사전 지식 익히기 - A/B Testing & 독립표본 T-Test 3. 사전 지식 익히기 - 기존 빈도주의 모델의 한계 4. CUPED 이론 이해하기 5. CUPED 코드로 구현하기 1. CUPED 논문 소개 CUPED는 Controlled Experiments by Utilizing Pre-Exp..
[MySQL] Hackerrank - SQL Project Planning 문제 풀이 해설 오늘 풀어보면서 공부할 문제는 Hackerrank에서 출제한 SQL Project Planning이다. 이 문제를 풀 때 개인적으로 Exists문을 통해서 풀어 냈고, 이 과정에서 배운 것을 공유하고자 한다. 목차 1. 문제 출처 및 소개 2. Exists문을 통한 문제 풀이 3. Lesson Learned 1. 문제 출처 및 소개 문제의 출처: URL 문제의 요구 조건 정리 모든 프로젝트의 시작일과 종료일을 호출하는 것 정렬 순서는 프로젝트 기간을 기준으로 오름차순으로 할 것 문제의 특이사항 정리 모든 Task의 시작일과 종료일은 1일로 제한 Task의 종료일과 Task의 시작일이 겹치면 그것은 같은 프로젝트 여기서 문제의 핵심은 Task에 부여되어 있는 시작일과 종료일을 어떻게 전처리를 하는가에 있다..
[Python]독립표본(Independent Samples) T-Test를 활용한 A/B Test 검증(코드부터 결과 해석까지 한 번에) E-commerce에서 가장 많이 하는 데이터 분석 업무 중 하나가 바로 A/B Test이다. 빈도주의 관점에서 실행할 수 있는 모델링 중 가장 기초적이면서도 바로 실무에 활용할 수 있는 모델이 독립표본 T-test이다. 이번 포스팅에서는 모델에 대한 기본 소개, 가설부터 시작하여 예제 코드까지 다루어볼 예정이다. 목차 1. E-commerce 환경에서 A/B Test의 기본적인 소개 2. 독립표본 T-Test의 소개 및 기본 가설 3. A/B Test 환경에서 실행하는 독립표본 T-Test 1. E-commerce 환경에서 A/B Test의 기본적인 소개 🔎 A/B Test라는 것은 무엇이며, 왜 필요하나요? 쉬운 버전으로 말하면, A/B Test은 기본적으로 두 가지 대안이 있을 때, 어떤 옵션이 더..
[MySQL & Oracle]HackerRank - Occupations 해설 및 오답노트 오늘은 Hacker Rank 중에서 The Report 문제에 대한 간단한 번역과 해답에 대해서 요약하고자 한다. 해설은 MySQL과 Oracle에서 모두 작동하는 것으로 기록했고, 문제 풀이 과정에서 얻었던 내용을 오답노트로 기록하였다. 목차 1. 문제 출처 및 소개 2. Full Join을 활용한 Orcale 풀이 3. GROUP BY를 활용한 MySQL 풀이 1. 문제 출처 및 소개 문제의 출처: Hacker Rank The Report 문제의 요구 사항 정리 요구사항 1. 각 직업별로 알파벳 순서대로 이름을 나열 요구사항 2. 만약 순서에 맞는 사람이 없다면 NULL로 호출 요구사항 3. Column의 순서는 doctor, professor, singer 그리고 actor이 되어야 할 것 사실 이..
[MySQL] HackerRank - The Report 해답 및 오답 노트 오늘은 Hacker Rank 중에서 The Report 문제에 대한 간단한 번역과 해답에 대해서 요약하고자 한다. 해설은 MySQL과 Oracle에서 모두 작동하는 것으로 기록했고, 문제 풀이 과정에서 얻었던 내용을 오답노트로 기록하였다. 목차 1. 문제 출처 및 소개 2. 문제의 해답 3. 오답노트 1. 문제 출처 및 소개 문제의 출처: Hacker Rank The Report 문제의 요구 사항 정리 요구사항 1. Name, Grade, 그리고 Mark 순으로 Column을 반환 요구사항 2. Grade가 8 미만인 학생들의 이름은 'NULL"로 호출 요구사항 3. 순서는 Grade 내림차순, 이름의 알파벳 오름차순으로 정렬할 것 2. 문제의 해답 1 2 3 4 5 6 7 8 9 10 SELECT CA..

728x90
반응형