본문 바로가기

전체 글

(92)
[Oracle] 입양 시각 구하기(1) - Group by 사용법 마스터하기 이번 포스팅에서는 Oracle 언어를 사용하여 프로그래머스 고득점 키트 문제 중 "입양 시각 구하기(1)" 문제를 풀어볼 것이다. 단순 정답만 제공하는 것이 아니라 Group by 문법을 정확하게 사용하는 방법까지 알아보면서 실력을 키워보는 것이 목표이다. 문제의 출처 및 기본 해설 문제의 출처는 당연히 프로그래머스 SQL 고득점 키트 중에서 Group by 영역을 찾아가면 된다. 이 문제의 소스 데이터는 Kaggle의 동물 입양 데이터를 기반으로 기출 문제가 만들어졌기 때문에 더 심도 있는 공부를 원하는 사람들은 사이트를 참고해도 좋을 것이다. 참고로구글에 Austin Animal Center Shelter Intakes and Outcomes 라고 검색하면 원하는 데이터를 바로 찾을 수 있다. 문제의..
[Python] 카이제곱 독립성 검정을 활용한 데이터 분석(feat. A/B Test까지) 카이제곱(chi-square) 독립성 검정은 두 변수 간 상호 영향도를 판단할 때 사용하는 대표적인 통계모델이다. 오늘은 이 모델의 개념과 수식부터 시작해서 예제를 통해 이해해보도록 하겠다. 또한 실제 A/B Test에서는 카이제곱 모델을 어떻게 활용하는지 Python을 통해서 구현해보도록 하겠다. 글의 목차 1. 카이제곱 독립성 검정의 개념 2. 카이제곱 독립성 검정의 수식 3. A/B Test에서 활용하는 카이제곱 독립성 검정 카이제곱 독립성검정의 개념 카이제곱 독립성 검정의 목표는 "내가 설정한 독립변수(원인)가 종속변수(결과)에 정말 영향을 미치는지 아니면 독립적인지"하기 위해서 하는 작업이다. 인과관계를 증명할 때 다양한 모델이 있지만, 카이제곱 검정을 반드시 써야만 할 때가 있다. 그렇다면 어..
[Python]버블정렬 알고리즘 코드 및 예시로 마스터 하기 이번 포스팅에서는 버블정렬 알고리즘을 파이썬으로 구현하는 것부터 시작하여 실제 예시를 통해 코딩 테스트까지 대비해보는 포스팅을 다루도록 할 것이다. 목차 1. 버블정렬의 기본 개념 2. 버블정렬(Bubble Sort) 알고리즘 원리 이해하기 3. 버블 정렬 Python 코드로 구현하기 4. 버블 정렬 시공간복잡도 계산하기 1. 버블정렬(Bubble Sort)의 기본 개념 버블정렬이란 두 인접한 데이터를 비교해서, 앞에 있는 데이터가 뒤에 있는 데이터보다 크면, 자리를 바꾸는 정렬 알고리즘을 말한다. 물론 정렬의 원칙에 따라서는 버블정렬을 내림차순으로 구현할 수도 있고, 오름차순으로 구현할 수도 있다. 이번 포스팅에서는 이 두 방법 모두 알아보고 코드로 구현해보고자 한다. 2. 버블정렬(Bubble Sor..
[Python] COHORT 분석 개념부터 실전 코드까지 (feat. 분석 예제 포함) 이번 글에서는 Cohort분석을 통해서 고객들이 웹사이트/앱에 얼마나 재방문을 하는지 파악하는 방법을 알아보고자 한다. COHORT 분석의 기초 개념부터 시작하여, 실제 어떻게 코드로 구현할 수 있는지, 마지막으로 실무에서는 Retention 인사이트를 어떻게 뽑아낼 수 있는지 알아보겠다. COHORT 분석의 정의와 활용 방법 코호트 분석의 정의 코호트 분석(COHORT Analysis)이란 특정 기간 동안 일정한 기준으로 동일한게 묶을 수 있는 사용자들의 집단을 분석하는 기법이다. 가장 흔하게 쓰이는 방법은 특정 날짜를 기준으로 사용자들을 하나의 집단으로 묶어 이들의 행동을 분석하는 것이다. 코호트 분석을 하는 이유 가장 핵심적인 것은 왜 고객들을 하나의 집단으로 묶는가를 아는 것이다. 실무적으로는 고..
[Python]베이지안 A/B Test로 기대수익과 기대손실 계산하는 방법 이번 포스팅에서는 베이지안 A/B Test를 수행한 이후 기대 수익을 계산하는 방법에 대해서 얘기해보고자 한다. 기존에는 결과 값이 0과 1로 boolean 값이기 때문에 Beta 분포를 사전분포로 활용했었다. 그러나 기대수익은 단위당 수익을 나타내는 양의 실수이기 때문에 동일한 분포를 적용할 수 없는 문제가 생긴다. 이러한 문제를 Gamma 분포와 베이지안 추론을 통해서 해결하는 방법을 Python기반으로 소개해보고자 한다. 1. 이론적 방법 소개 - 감마분포를 통한 기대수익 산출 방법 (1) 베이지안 추론 - Prior 변수 설명 우리는 이번 목적이 기대수익을 창출하는 것이다. 아주 간단한 아이디어부터 시작을 해보자. 1,000명의 사람이 들어왔을 때 만약 100명이 구매를 했고, 1명당 평균 수익이..
[Python] 선형회귀분석을 이론, 결과해석, 그리고 코드까지 (Linear Regression Model) 통계학 모델 중에서 가장 기초이자 반드시 알아야 할 선형회귀분석(Linear Regression Model)을 소개할 것이다. 이 통계 모형을 처음 듣는 사람에게 설명한다는 관점으로 회귀분석이론부터 시작하여 회귀분석의 목적, 수식으로 이해하는 회귀모형, 회귀분석의 목적 그리고 회귀분석 결과 해석하는 가이드를 설명할 것이다. 이 모든 과정을 Python으로 구현해봄으로써 실무에서 어떻게 사용할 수 있을지까지 힌트를 남길 것이다. [ 글의 목차 ] 1. 회귀분석의 기초 2. 선형회귀분석의 목적 3. Linear Regression Model의 수식 4. 선형회귀분석의 해석 방법 5. 코드로 Linear Regression Model 구현해보기 1. 회귀분석의 기초 회귀분석을 가장 쉽게 말하자면, 결과를 일으..
[SQL] JOIN 한 방에 정리 - 개념부터 코드까지 이것만 보자 SQL을 다루는 사람들이 반드시 알아야 할 개념 중에 하나가 바로 JOIN이다. Join은 아주 쉽게 얘기해서 집합의 개념과 매우 유사하다. Data Analyst, PO, PM 등 많은 직군의 사람들이 쓰기 시작해서, 반드시 알아야 할 기초와 코드를 정리해보고자 한다. 오늘 다루게 될 내용은 INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, 그리고 FULL OUTER JOIN이다. 1. JOIN의 모든 종류 JOIN의 기초 문법 안내 JOIN 원하는 테이블 AS 약칭 ON 기준1 = 기준2 Tip1. 기준1과 기준2는 데이터 구조도 동일하게 하는 것을 권장한다. Tip2. Bigquery에서는 데이터 구조가 다르면 JOIN시 Error가 발생한다. Big Query 실..
[문정법조타운 삽겹살 맛집] 호미정-고급삼겹살을 찾는 사람에게 추천 오늘 리뷰를 할 장소는 바로 문정법조타운에서 삽겹살 맛집인 호미정이다. 이 동네 살면서 4 ~ 5번 정도 재방문했었고, 음식의 맛이 정말 마음에 들어서 포스팅에서 다루기로 하였다. 식당의 기본 정보부터 어떤 메뉴를 추천하고, 어떤 장점이 있었는지 최대한 자세하게 기술하도록 하겠다. 1. 호미정 - 식당 기본 정보 (1) 장소 및 기본 영업 시간 안내 호미정은 위치가 메인 먹자 골목에 있지만 약간 찾기가 힘들 수도 있다. 정확한 위치는 정확히 테라타워1차와 2차 사이에 있으니 찾는데 어려움이 없기를 바란다. 영업시간 안내 평일 영업시간: 11:00 ~ 22:00 브레이크 타임: 14:00 ~ 17:00 토요일 영업시간: 16:00 ~ 21:00 일요일 정기 휴무 삼겹살 집이라고 해도 일반적인 집들과 달리 ..

728x90
반응형