본문 바로가기

전체 글

(92)
베이지안 기초2. 베이지안 Classification의 이해 목차 1. 기본적인 Bayesian 수식 2. Bayesian by Likelihood & Prior 3. Conditional Independence Density 4. Final Naive Bayesian Function 1. 수식을 통한 Bayesian의 이해 들어가기 전에 기본 수식만 보면 이해가 안 갈 테니, 이해하기 쉬운 예제와 함께 보려고 한다. 우리가 소풍을 간다 안 간다를 예측하기 위해서, 여러가지 날씨 변수를 계산하다고 생각해보자. 우리가 날씨, 온도, 습도, 풍량, 수온, 일기 예보 정보를 알고 있을 때, 소풍을 갈지 안 갈지를 결정하는 상황이라고 이해해보자. 그러면 여기서 Y는 "소풍가기"가 될 것이고, 각 변수들은 X1 ~ X6까지 고려되어야 한다. 우선 소풍갈 확률은 편리하게 5..
베이지안 기초1. 기초 개념 및 예시를 통한 완벽 이해 학습 목표 및 목차 목표: 학부 수준에서 베이지안 논리를 이해하는 것 목차 1. 베이지안 확률론의 기본 2. 예시를 통해 베이지안 논리의 이해 1. 베이지안 확률론의 기본 1-1. 기본 개념 (1) 사전 확률 분포 - P(A) - 개념: 이미 알고 있는 정보. 관측 데이터와 혼동하면 안 된다. - 수식: P(A) (2) 자료의 확률 분포 - P(B|A) - 개념: 데이터에서 관측된 분포. 이것을 흔히 Likelihood라고 부르는 개념. 과거의 경험 혹은 관측 데이터에 근거하여, 사건 B가 발생할 확률을 부분적으로 알고 있는 것이다. 여기가 정말 핵심인 이유는 "과거의 데이터로 관심이 있는 사건의 확률에 대해 추정한다는 것"이다. 이 부분은 예시를 통해 더욱 이해가 가능할 것이다. - 수식: P(B|A)..
상관관계 분석의 실습 [Python 활용] 1. 활용 데이터셋 이전에 통계학에서 다루는 대표적인 상관 관계분석 모델을 이전 포스팅에서 알아봤다. 이번에는 실습을 해볼 차례로, 와인 데이터셋을 활용할 것이다. 이 데이터셋은 데이터 입문자들에게 아주 유용한 자료이니 비단 이 자료만이 아니더라도 활용해볼만한 가치가 있다고 생각한다. https://www.kaggle.com/datasets/yasserh/wine-quality-dataset?select=WineQT.csv Wine Quality Dataset Wine Quality Prediction - Classification Prediction www.kaggle.com 여기서는 총 13가지 Column들이 있는데, 실제 의미를 따지기 보다는 모델 실급에 적한한 변수들을 취사선택하여 실제 모델 해..
상관관계 분석의 기초 정립 [Python 활용] 1. 상관관계란? (1) 개념적 이해 상관관계란 두 연속 변수(numeric variable)이 선형 관계에 있는지 분석하는 기법으로 서로 움직이는 방향이 양(+)의 방향인지 혹은 음(-)의 방향인지 판단하는 것이다. 상관관계는 절대로 인과성을 증명하는 것이 아니다. 사회과학에서 인과 관계를 정의할 때는 3가지 조건을 지키는데, 상관관계는 이와는 관련이 없기 때문이다. 사회과학에서 말하는 인과관계 조건은 3가지가 있다. 첫 번째. 독립변수와 종속변수는 모두 변화가 존재해야 한다는 것 (concomitant variance) 두 번째. 독립변수는 종속변수보다 먼저 변화가 이루어져야 한다는 것 (Time Order) 세 번째. 독립변수와 종속변수 이외에 다른 외생 변수는 변화가 없어야 한다는 것 (Contr..
ECO Project - There are ways to save more people than Covid Vaccine. Title: There are ways to save more people than Covid-19 Vaccine. 1. Introduction (1) Covid, How serious it is? 인류는 과거에서부터 현대에서도 많은 질병과 전쟁을 치뤄왔다. 2003년에는 SARS(중증 급성 호흡기, 사스)로부터 인류는 위협을 받았고, 총 8,098명이 감염 됐고 그중에서 774명이 사망[1] 하였다. 2012년에는 MERS(중동 호흡기 증후군)가 전세계를 강타하여 총 2,494명이 감염 됐고 그 중에서 858명이 사망하여 치사율 약 20%라는 위협적인 질병을 겪었다 [2]. 그러나 코로나는 흑사병 이후로 다른 질병들이 따라올 수 없을만큼 인류에 많은 피해를 끼치고 있다. 총 감염자 수는 약 1억 8천만..
GA 구축의 기초3. 목표(Goal) 설정하기 1. GA 목표란? 2. 일반적인 GA 목표 종류 3. GA 목표 세팅 방법 실습 1. GA 목표란? (1) 기본 개념 우선 목표라는 것은 쉽게 말해서 "소비자들이 내 웹/앱에 들어와서 달성했으면 하는 행동"을 의미합니다. 예를 들면, 제 블로그에 와서 사람들이 해줬으면 하는 행동에는 "내 글을 자세히 읽어 줬으면 좋겠어"라는 생각이 들 수 있겠죠. 그렇다면 "글을 자세히 읽다"라는 행동을 어떻게 측정할 수 있을까에 대한 고민부터 시작하면 됩니다. 간단하게 생각하면 2가지 항목이 떠오를 수 있습니다. 첫 번째. 사람들이 스크롤을 하단까지 내렸을까? 두 번째. 사람들이 많은 시간을 들여서 글을 읽었을까? 왜냐하면 단순히 들어왔다고 해서 글을 읽었는지 안 읽었는지는 모를 수 있기 때문이죠. 만약에 내 글이 ..
SQL - 프로그래머스 - 입양 시각구하기(2) 1. 문제의 출처 프로그래머스 입양 시각 구하기 문제로 이동하기 2. 문제의 설명 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각 동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. NAMETYPENULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE NAME VARCHAR(N) TRUE SEX_UPON_OUTCOME VARCHAR(N) FALSE 보호소에서는 몇 시에 입양이..
백준 - 1912번 - 연속합[파이썬] 1. 문제 출처 백준 - 1912번: 연속합 문제로 이동하기 우선 링크로 가서 문제를 보도록 하자. 2. 문제 설명 문제 n개의 정수로 이루어진 임의의 수열이 주어진다. 우리는 이 중 연속된 몇 개의 수를 선택해서 구할 수 있는 합 중 가장 큰 합을 구하려고 한다. 단, 수는 한 개 이상 선택해야 한다. 예를 들어서 10, -4, 3, 1, 5, 6, -35, 12, 21, -1 이라는 수열이 주어졌다고 하자. 여기서 정답은 12+21인 33이 정답이 된다. 입력 첫째 줄에 정수 n(1 ≤ n ≤ 100,000)이 주어지고 둘째 줄에는 n개의 정수로 이루어진 수열이 주어진다. 수는 -1,000보다 크거나 같고, 1,000보다 작거나 같은 정수이다. 테스트 케이스1 10 10 -4 3 1 5 6 -35 1..

728x90
반응형