| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | ||
| 6 | 7 | 8 | 9 | 10 | 11 | 12 |
| 13 | 14 | 15 | 16 | 17 | 18 | 19 |
| 20 | 21 | 22 | 23 | 24 | 25 | 26 |
| 27 | 28 | 29 | 30 | 31 |
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 이상탐지
- 내일배움캠프#til#파이썬#python#통계학
- 제1종오류
- 내일배움캠프#til#sqld
- 통계학
- 데이터분석
- 통계
- 데이터
- #내일배움캠프 #사전캠프 #til #sql
- 내일배움캠프#til#파이썬#python
- 딥러닝
- 다중검정
- 내일배움캠프#til#파이썬#python#전처리
- 내일배움캠프#til#데이터 리터러시
- 책
- 이상치 제거
- 제2종오류
- 라이브 세션
- 머신러닝
- 내일배움캠프#til#sql
- A/B테스트
- t검정
- 차원축소
- 가설검정
- Ai
- 카이제곱검정
- vscode
- 통계학공부
- 통계101x데이터분석
- Today
- Total
목록2025/07 (27)
Ming's Life
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 제 1종 오류와 제 2종 오류 ☑️ 제 1종 오류귀무가설이 참인데 기각하는 오류잘못된 긍정을 의미 (아무런 영향이 없는데 영향이 있다고 하는 것)한 단어로 위양성!α를 경계로 귀무가설을 기각하기 때문에 제1종 오류가 α만큼 발생따라서 유의수준(α)을 정함으로써 제 1종 오류 제어 가능만약, 유의수준이 0.05라면 100번 중 5번 정도 일어날 수 있는 제 1종 오류는 감수하겠다는 것☑️ 제 2종 오류귀무가설이 거짓인데 기각하지 않는 오류.잘못된 부정을 의미 (영향이 있는데 영향이 없다고 하는 것)한 단어로 위음성!제 2종 오류가 일어날 확률은 β로 정의.제 2종 오류가 일어나지 않을 확률은 검정력(1-β)으로 정..
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 카이제곱검정 1) 카이제곱검정이란 무엇인가?☑️ 카이제곱검정범주형 데이터의 표본 분포가 모집단 분포와 일치하는지 검정(적합도 검정)하거나두 범주형 변수 간의 독립성을 검정(독립성 검정)☑️ 적합도 검정관찰된 분포와 기대된 분포가 일치하는지 검정p값이 높으면 데이터가 귀무 가설에 잘 맞음. 즉, 관찰된 데이터와 귀무 가설이 적합p값이 낮으면 데이터가 귀무 가설에 잘 맞지 않음. 즉, 관찰된 데이터와 귀무 가설이 부적합☑️ 독립성 검정두 범주형 변수 간의 독립성을 검정p값이 높으면 두 변수 간의 관계가 연관성이 없음 → 독립성이 있음p값이 낮으면 두 변수 간의 관계가 연관성이 있음 → 독립성이 없음 2) 카이제곱검정..
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 다중검정 1) 다중검정이란 무엇인가?☑️ 다중검정여러 가설을 동시에 검정할 때 발생하는 문제각 검정마다 유의수준을 조정하지 않으면 1종 오류(귀무가설이 참인데 기각하는 오류) 발생 확률이 증가1종 오류가 무엇인지랑 왜 다중검정시 발생확률이 증가하는지는 밑에서 다시 설명! 지금은, 어떤 오류가 발생할 수 있다는 정도로 이해!☑️ 보정 방법본페로니 보정, 튜키 보정, 던넷 보정, 윌리엄스 보정 등이 있음가장 대표적이고 기본적인게 본페로니 보정 2) 다중검정과 보정을 어떻게 적용되어질까?☑️ 여러 약물의 효과를 동시에 검정이 때 본페로니 보정을 사용해볼 수 있음☑️ 파이썬 실습import numpy as npimport..
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. t검정1) t검정이란 무엇인가?☑️ t검정t검정은 두 집단 간의 평균 차이가 통계적으로 유의미한지 확인하는 검정 방법독립표본 t검정과 대응표본 t검정으로 나뉨☑️ 독립표본 t검정두 독립된 그룹의 평균을 비교☑️ 대응표본 t검정동일한 그룹의 사전/사후 평균을 비교 2) 가설검정이 실제로 어떻게 적용되어질까?☑️ p-값을 통한 유의성 확인두 클래스의 시험 성적 비교(독립표본 t검정)다이어트 전후 체중 비교(대응표본 t검정)# 학생 점수 데이터scores_method1 = np.random.normal(70, 10, 30)scores_method2 = np.random.normal(75, 10, 30)# 독립표본 t검정..
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 가설검정 1) 가설검정이란 무엇인가? ☑️ 가설검정표본 데이터를 통해 모집단의 가설을 검증하는 과정즉, 데이터가 특정 가설을 지지하는지 평가하는 과정귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정데이터 분석시 두가지 전략을 취할 수 있음확증적 자료분석미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석탐색적 자료분석(EDA)가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것 ☑️ 단계귀무가설(H0)과 대립가설(H1) 설정유의수준(α) 결정검정통계량 계산p-값과 유의수준 비교결론 도출 2) 가설검정이란 무엇인가?통계적 유의성과 p값☑️ 통계적 유..
1. 오늘 학습 키워드통계학 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. A/B 검정☑️ A/B 검정A/B 검정은 두 버전(A와 B) 중 어느 것이 더 효과적인지 평가하기 위해 사용되는 검정 방법.마케팅, 웹사이트 디자인 등에서 많이 사용됨.사용자들을 두 그룹으로 나누고, 각 그룹에 다른 버전을 제공한 후, 반응을 비교.일반적으로 전환율, 클릭률, 구매수, 방문 기간, 방문한 페이지 수, 특정 페이지 방문 여부, 매출 등의 지표를 비교. ☑️ 목적두 그룹 간의 변화가 우연이 아니라 통계적으로 유의미한지를 확인. ☑️ 실제 적용) 두 개를 비교하여 구매 전환율이 큰 것을 선택온라인 쇼핑몰에서 두 가지 디자인(A와 B)에 대한 랜딩 페이지를 테스트하여 어떤 디자인이 더 높은 구매 전환율을 ..
Notion 공식 가이드Notion 단축키텍스트(Text)WindowsmacOS볼드체** 텍스트 ** or Ctrl + B** 텍스트 ** or Cmd + B이탤릭체* 텍스트 * or Ctrl + I** 텍스트 ** or Cmd + B취소선~ 텍스트 ~ or Ctrl + Shift + S* 텍스트 * or Cmd + I인라인 코드Ctrl + E~ 텍스트 ~ or Cmd + Shift + S밑줄Ctrl + UCmd + U링크Ctrl + KCmd + K댓글Ctrl + Shift + MCmd + Shift + M 기본 블록(Basic blocks)슬래시(/) 명령어Windows & macOsHeading 1/h1# + SpaceHeading 2/h2## + SpaceHeading 3/h3### + SpaceT..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 이상 탐지(Anomaly Detection)란?☑️ 왜 필요한가?금융 사기카드 사기, 계좌 해킹 등으로 인한 금전적 손실을 미리 막기 위해제조업생산 라인이나 기계 설비에서 발생하는 고장을 사전에 예측하여 유지보수 비용 절감, 다운타임 최소화보안네트워크 침입 시도나 데이터 탈취 등을 빠르게 감지 ☑️ 이상치 탐지(Outlier Detection)와의 차이이상치 탐지(Outlier Detection)는 단순히 통계적으로 극단값(Outlier)을 찾는 데 초점을 둔다. 예를 들어 평균에서 크게 벗어난 데이터 포인트를 찾는 방식이상 탐지(Anomaly Detection)는 단순 극단값 뿐 아니라, 맥락(Context)이..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 차원 축소가 왜 필요할까?☑️ 차원 축소의 필요성고차원 데이터란?데이터의 피처(변수)가 매우 많은 상태를 말합니다. 예컨대 이미지 데이터의 경우, 한 장의 이미지를 구성하는 픽셀 수만큼의 피처가 있을 수 있습니다.어떤 문제가 생길까?모델 학습 시 연산 복잡도가 급증하여 시간이 오래 걸림많은 피처들 중 일부는 실제로 중요한 정보를 주지 못하는 노이즈(잡음)일 수 있음차원이 너무 높아지면 데이터를 시각화하기가 어려워 패턴 파악이 힘듬차원 축소의 장점노이즈 제거로 모델 성능 및 일반화 능력을 개선할 수 있음2차원이나 3차원으로 축소하면 시각적으로 직관적인 분석을 할 수 있음데이터의 핵심 구조나 패턴을 더 쉽게 발견할 ..
1. 오늘 학습 키워드머신러닝 기초 2. 오늘 학습 한 내용을 나만의 언어로 정리하기 1. 비지도 학습 개요☑️ 비지도 학습이란?비지도 학습(Unsupervised Learning)은 정답(레이블) 없이 데이터에서 패턴이나 구조를 찾는 머신 러닝 기법을 의미활용 영역데이터의 군집화(Clustering)차원 축소(Dimensionality Reduction)이상치 탐지(Anomaly Detection) 등 ☑️ 지도 학습과의 비교지도 학습(Supervised Learning)입력 데이터에 대한 정답(레이블)을 알고 있는 상태에서 모델을 학습하여, 새로운 데이터가 들어왔을 때 레이블을 예측.ex) 이미지 분류, 스팸 메일 분류비지도 학습(Unsupervised Learning)별도의 레이블이 없고, 오직 ..