| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 내일배움캠프#til#데이터 리터러시
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 내일배움캠프#til#sqld
- 통계101x데이터분석
- vscode
- A/B테스트
- 라이브 세션
- 가설검정
- 내일배움캠프#til#파이썬#python#전처리
- 데이터
- 이상치 제거
- 제1종오류
- Ai
- 통계학공부
- 제2종오류
- 이상탐지
- 데이터분석
- 다중검정
- 책
- t검정
- 내일배움캠프#til#파이썬#python
- 차원축소
- 내일배움캠프#til#파이썬#python#통계학
- 통계
- 내일배움캠프#til#sql
- 카이제곱검정
- #내일배움캠프 #사전캠프 #til #sql
- 딥러닝
- 통계학
- 머신러닝
- Today
- Total
목록2025/05/23 (2)
Ming's Life
1. 오늘 학습 키워드기초 데이터 분석 팀과제 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 4. 리뷰수가 많은 출판사를 찾아서 상위 10위 출판사를 도출하고 출판사별로 다른 컬럼에서 특징이 있는지 group by, rank 이용하여 리뷰수가 많은 상위 10위 출판사 도출하기select *from(select b.publisher, count(1) cnt_review, rank() over(order by count(1) desc) rank_publisherfrom sampled_ratings rinner join sampled_books b on r.title = b.titlewhere b.publisher !=""and b.publisher is not nullgroup..
1. 오늘 학습 키워드기초 데이터 분석 팀과제 2. 오늘 학습 한 내용을 나만의 언어로 정리하기EDA(Exploratory Data Analysis)1. 아마존 책 리뷰 데이터를 파악Objective: 아마존 책 정보와 리뷰 데이터를 파악하고 다양한 분석을 해보고 이상치, 결측치 찾아서 해결하기원본 데이터가 양이 크기 때문에 다음과 같이 샘플을 추출하여 데이터 분석sampled_books: 책 4.2만개 정보(3.6MB)sampled_ratings: 60만 개의 리뷰(50MB)sampled_books: 책에 대한 정보가 있는 테이블변수명설명Title책 제목description책 줄거리authors저자명image책 표지 링크previewLinkgoogle Books에서 책의 링크publisher출판사명p..