본문 바로가기

분류 전체보기

(91)
[SQL] 프로그래머스 - 보호소에서 중성화한 동물(inner join 기출) 1. 문제의 출처 - 프로그래머스 오늘은 프로그래머스 SQL 고득점키트 중 "join"에 대해서 풀어볼 것이다. Join문제에는 4개가 있는데 그중에서 "보호소에서 중성화한 동물" 문제에 대한 해설을 해보고자 한다. 여기서 문제의 핵심은 Join을 활용하여 상태값이 어떻게 다른지 비교할 수 있는 것이 핵심이다. 문제 URL 코딩테스트 연습 - 보호소에서 중성화한 동물 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디 programmers.co.kr 2. 문제의 설명 및 ..
베이지안 기초4. 실전 A/B Test 코드 구현하기[Python] [글의 목차 - Contents] 1. A/B Test란? - 간단하게 알아보기 2. 베이지안 A/B Test 절차 정리 (1) 기본 데이터셋 설명 - A/B Test의 실전 데이터셋 구현 (2) 베이지안 추론 과정 설계 & Pseudo Code (3) 실제 코드로 구현하기 (4) 실험 과정 관측 및 실험 결과 해석 하기 1. A/B Test란? - 간단하게 알아보기 A/B Test란 하나의 실험으로서, 원하는 결과(종속변수)를 설정하여 A그룹과 B그룹을 비교해서, 더 높은 결과값을 나타내는 Group을 선택하는 과정을 의미한다. 보통 A/B Test는 기업에서 디자인들의 성과 비교, 클릭률 비교, 전환율 비교 등에 활용되는 용어이자 스킬로서 굉장히 주요한 개념으로 사용한다. 오늘은 베이지안 추론을 활용..
[SQL] 프로그래머스 - 최댓값 구하기 해설(feat. 집계함수 모음) 1. 문제 출처 프로그래머스 최대값 구하기 문제 원본으로 이동 오늘의 핵심은 SQL에는 어떤 집계함수가 있고, 어떻게 활용할 수 있는지 파악해보는 것이다. SQL의 기본 실력을 쌓는데 핵심이니, 단순 풀이 뿐만 아니라 집계함수의 종류에 대해서도 알아가면 좋다. 2. 문제 간단 설명 - 가장 최근에 들어온 동물의 시간은? 문제의 요구 사항은 정말 간단하다. 가장 최근에 동물은 언제들어왔는지 정확한 시간을 구하는 것이다. 난이도가 쉬워서 그렇지, 어렵게 냈으려면 시간의 형식도 정해줬을 것이다. 이 부분은 나중에 기회가 있을 때 다루도록 하자. 3. 코드 해설 - 다양한 집계함수를 써보자 1 2 3 4 5 6 7 8 9 10 -- 좋은 코드의 예시 SELECT max(ai.DATETIME) 시간 FROM AN..
[Python] Pandas Query 정복 - 실전 데이터 활용(EPL 리그) ※ 참고 사항 - 활용 데이터 셋은 EPL 프로 축구 리그 데이터 데이터 셋 원본 다운로드 페이지로 이동하기 축구에 관심이 있으신 분들이 보면 재미있게 데이터 분석을 공부할 수 있는 좋은 데이터셋입니다. 또한 실전 데이터라고 봐도 무방할 만큼 아주 좋은 데이터셋입니다. 원래 데이터가 생긴 모습 1. Query 활용법 요약 - 1분도 길다. 결론부터!! Query 기능 설명 코드 논리 및 예시 1. 비교 연산자 검색 , ==, != 등을 활용한 데이터 검색 df.query(' column 비교연산자 숫자 ') e.g. df.query(' col != 10') 2. in 논리 검색 in, not in 을 활용한 데이터 검색 df.query('column == [원하는 조건]') df.query('column..
[Python] Pandas의 Pivot Table 활용 마스터하기 목차 1. 활용 데이터셋 소개 - EPL 리그 데이터 2. Pivot Table 기초 소개 3. 실제 데이터 활용 - Query 활용, Aggfunc의 활용을 통한 실제 인사이트 도출 Q. 플레이스타일이 가장 호전적인 팀은 어디? 1. 활용 데이터셋 - EPL 리그의 경기 데이터 https://www.kaggle.com/datasets/azminetoushikwasi/epl-21-22-matches-players EPL 2021-22 | English Premier League Detailed Match & Player Stats of English Premier League Season 2021-22 www.kaggle.com 재미있는 데이터이니 다운받아보자 2. Pivot Table의 기초 활용법 -..
[Python] argmax, argmin, max, min - 마스터 1분컷 1. 결론 요약 Method 의미 예시 max(데이터) 데이터 중 최대값을 반환 max([1,2,3,10000]) = 10000 np.argmax(데이터) 최대값이 "어디에 있는지" 반환 max([1,2,3,10000]) = 3 ## 인덱스 번호 min(데이터) 데이터 중 최소값을 반환 min([1,2,3,10000]) = 1 np.argmin() 최소값이 "어디에 있는지" 반환 argmin([1,2,3,10000]) = 0 ##인덱스 번호 2. Method 상세 설명 이러한 데이터가 있는데, "최대값과 최소값이 무엇이고 어디에 있는지 찾아라"라는 업무를 수행해야 한다면? (1) max & argmax - max( iterable or objects) : 최대값을 반환 - numpy.argmax(iter..
베이지안 기초3. 베이지안을 활용한 A/B Test 예시[Python] 여러분들의 광고 시청 및 클릭은 블로그 운영에 큰 힘이 됩니다!! 1. 베이지안 기초 개념 복습 - 베이지안 기초 함수: 𝑝(Θ|𝑋)=𝑝(𝑋|Θ)∗𝑝(Θ)𝑝(𝑋)p(Θ|X)=p(X|Θ)∗p(Θ)p(X) - Posterior: p(Θ | X ) - Likelihood: p(X | Θ) - Prior: p(Θ) - Evidence: p(X) 이 부분에 대해서 모르시겠다면 이전 포스팅을 참조해주시기 바랍니다. 베이지안 확률의 기본 이론: URL 베이지안 확률의 수식적 이해: URL 이번에 학습에 활용할 예시는 바로 일명 빠친코, Slot Machine입니다. 영어로는 bandit 예제로 유명한데요. Bayesian Machine Learning을 배우는 학생들이 필수 예시입니다. 이 예시가 가장 실용적인 이유..
베이지안 기초2. 베이지안 Classification의 이해 목차 1. 기본적인 Bayesian 수식 2. Bayesian by Likelihood & Prior 3. Conditional Independence Density 4. Final Naive Bayesian Function 1. 수식을 통한 Bayesian의 이해 들어가기 전에 기본 수식만 보면 이해가 안 갈 테니, 이해하기 쉬운 예제와 함께 보려고 한다. 우리가 소풍을 간다 안 간다를 예측하기 위해서, 여러가지 날씨 변수를 계산하다고 생각해보자. 우리가 날씨, 온도, 습도, 풍량, 수온, 일기 예보 정보를 알고 있을 때, 소풍을 갈지 안 갈지를 결정하는 상황이라고 이해해보자. 그러면 여기서 Y는 "소풍가기"가 될 것이고, 각 변수들은 X1 ~ X6까지 고려되어야 한다. 우선 소풍갈 확률은 편리하게 5..

728x90
반응형