본문 바로가기

Python

(37)
[Python] 바이올린 플롯(Violin Plot) - 기술통계와 분포를 동시에 보여주는 그래프(feat. Seaborn) Seaborn에서는 바이올린 플롯(Violin Plot)이라는 시각화 방식을 제공하는데, 장점들이 매우 큰 시각화 방법이다. 크게 바이올린 플롯은 기술통계량과 데이터의 분포를 한 번에 보여줄 수 있다는 점과 여러 가지 변수를 한 번에 비교 분석하기 쉽게 보여줄 수 있다는 점이 있다. 이번 포스팅에서는 바이올린 플롯의 기본부터 시작해서, 구현 코드, 그리고 해석 하는 방법까지 아주 쉽게 소개하려고 한다. 목차 1. 기초 데이터 소개 및 바이올린 플롯 기본 및 해석 가이드 2. 시각화 Tip1. X축과 Y축 회전하기 3. 시각화 Tip2. 여러 개 변수를 설정할 수 있는 Violin Plot 4. 시각화 Tip3. Split 기능을 통해 분포 비교하기 5. 시각화 Tip4. 다양하게 기술통계량 표현해보기 1..
[Python] Seaborn으로 데이터 분포 3분만에 마스터하기 Python에서 데이터 분포를 그리기 위해서 다양한 방법이 있다. 그 중에서도 가장 시각적으로 효과적이고 난이도도 쉬운 Seaborn(향후 sns)으로 데이터 분포를 시각화 하는 패키지를 소개하려고 한다. 대표적으로 sns.histplot()이 있고, 이외에 유용한 패키지를 중심으로 다뤄보려 한다. 목차 1. 기초 데이터 및 Seaborn 소개 2. 상대적인 비율을 보여주는 데이터 분포 시각화 3. 절대적인 빈도를 보여주는 데이터 분포 시각화( feat. distplot() ) 4. 시각화에 유용한 파라미터 소개 1. 기초 데이터 및 Seaborn 소개 기초 데이터셋 소개 이번 포스팅에서 데이터 시각화할 때 사용할 아주 기초적인 데이터이다. 여기에서는 데이터 분포를 시각화하는 것이기 때문에 여기 있는 함..
[Python] 초보자도 마스터하는 Matplotlib에서 범례(Legend) 표시 Legend는 범례라는 뜻으로 데이터 시각화에 있어서 아주 간단하면서도 핵심적인 정보를 전달해주는 요소이다. 이번 포스팅에서는 기본적으로 어떻게 사용하는지부터 시작하여 위치, 폰트, 테두리 설정 등 데이터 시각화할 때 바로 사용할 수 있는 팁을 위주로 설명하고자 한다. 목차 1. 예시 데이터 및 matplotlib Legend의 기초 2. plt.legend의 위치 설정하기 3. plt.legend 열과 행 개수 지정하기 4. 폰트 및 글자 크기 조절하기 5. 범례 제목 설정하기 6. 기타 알아두면 좋은 기능 모음 1. 기초 데이터셋 및 Matplotlib Legend 기초 사용법 여기에서는 예시 데이터와 다른 시각화 방식은 주 내용이 아니기에 아래의 코드를 공유할 것이다. 따라서 참고를 할 때도 자기가..
[Python] 초보자도 따라하는 Line Plot(라인차트) 만들기 오늘은 데이터 시각화의 시작이라고 할 수 있는 라인차트 만드는 방법에 대해서 알아볼 것이다. 파이썬에서 대표적인 시각화 패키지로 matplotlib과 seaboarn을 사용하여 어떻게 하면 가시성이 좋고, 원하는 선형 그래프를 만들 수 있는지 아주 쉽게 알아보는 것을 목표로 할 것이다. 데이터 시각화할 때 잊지 말아야 할 원칙도 알아보면서 자신의 실력을 키워보는 보는 것도 권장한다. 목차 1. 기초 데이터셋 소개 및 데이터 준비 방법 안내 2. Matplotlib을 활용한 라인차트 그리기 3. Seaborn을 활용한 라인차트 그리기 1. 기초 데이터셋 소개 및 데이터 준비 방법 오늘 활용할 데이터셋은 한국 기상청에서 아주 쉽게 구할 수 있는 지역별 날씨 데이터이다. 데이터셋은 굳이 가서 찾을 필요가 없도..
[selenium4 기준] Python으로 인스타그램 크롤링 알고리즘 짜기 최근에 Selenium4로 업데이트 되면서 기존에 짜놓은 코드가 돌아가지 않는 현상을 겪고 있고, Instagram도 Frontend 로직이 바뀌면서 많은 독자가 어려움을 겪었다. 그래서 이번에 Selenium4와 최신 코드를 기준으로 자동으로 정보를 긁어올 수 있는 크롤러를 새로 개발하여 공개하고자 한다. 목차 1. 셀레니움 설치 및 기본 함수 소개 2. 셀레니움으로 인스타그램에 로그인하기 3. 인스타그램 크롤링 코드 Logic 설명 4. Pandas를 활용한 DataFrame 형성 5. 전체 코드 소개 1. 셀레니움 설치 및 기본 함수 소개 자신의 컴퓨터에 셀레니움 설치하는 방법 셀레니움4를 설치할 때는 두 가지 사항만 진행하면 아주 간단하게 할 수 있다. 첫 번째는 로컬 환경 내에 pip insta..
[Python] 데이터 추가 하기 - append, extend, insert 3분 마스터 Python List에서는 크게 3가지 방법으로 데이터를 추가할 수 있다. append(), insert(), 그리고 extend() 메소드를 통해서 가능하고 특히 데이터 전처리 상황에서 유용하게 쓰일 수 있다. 목차 1. append() 사용법 안내 2. extend() 사용법 안내 3. insert() 사용법 안내 1. append() 가이드 append(object)는 리스트 마지막에 object의 형태를 유지하면서 인자를 첨부하는 것이다. 이는 비단 리스트에서 뿐만 아니라 DataFrame에서도 가능한 함수여서 굉장히 편리하다. 1 2 3 4 5 6 7 8 9 10 11 12 list_sample = [1,2,3, 'a'] test1 = ['a','b','c'] ## 데이터 추가하기 list_sa..
[Python]버블정렬 알고리즘 코드 및 예시로 마스터 하기 이번 포스팅에서는 버블정렬 알고리즘을 파이썬으로 구현하는 것부터 시작하여 실제 예시를 통해 코딩 테스트까지 대비해보는 포스팅을 다루도록 할 것이다. 목차 1. 버블정렬의 기본 개념 2. 버블정렬(Bubble Sort) 알고리즘 원리 이해하기 3. 버블 정렬 Python 코드로 구현하기 4. 버블 정렬 시공간복잡도 계산하기 1. 버블정렬(Bubble Sort)의 기본 개념 버블정렬이란 두 인접한 데이터를 비교해서, 앞에 있는 데이터가 뒤에 있는 데이터보다 크면, 자리를 바꾸는 정렬 알고리즘을 말한다. 물론 정렬의 원칙에 따라서는 버블정렬을 내림차순으로 구현할 수도 있고, 오름차순으로 구현할 수도 있다. 이번 포스팅에서는 이 두 방법 모두 알아보고 코드로 구현해보고자 한다. 2. 버블정렬(Bubble Sor..
[python] for문 예상 시간 측정하기 - ipypb 및 tqdm 소개 오늘은 python에서 for 반복문을 사용할 때 예상 시간 및 리소스를 측정할 수 있는 패키지를 소개하고자 한다. 사실 사람들이 tqdm은 많이 알고 있을텐데, 개인적으로는 ipypb의 ipb 패키지가 훨씬 좋다고 생각해서 이를 중점적으로 소개하려 한다. 1. Ipypb의 ipb를 활용한 for문 예상 시간 측정 ipypb의 사용법은 코린이도 사용할만큼 아주 단순하고 유용하다. 문법: for index in ipb(반복하는 객체 넣어주기) ipypb에서 자세한 사항 알아보기 - 참고 URL 개인적으로 Python에서 가장 이쁘게 시각화할 수 있는 것이 ipb라고 본다. UI도 굉장히 단순하면서 좋고, tqdm과는 다르게 반복문 중간에 다른 객체나 명령어가 들어가도 상관 없이, 프로세스 바가 정말 이쁘게..

728x90
반응형