Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
Tags
- 다중검정
- 통계101x데이터분석
- 데이터
- 내일배움캠프#til#sql
- 통계
- 제1종오류
- 내일배움캠프#til#sqld#eda#데이터리터러시
- 데이터분석
- 통계학
- 내일배움캠프#til#파이썬#python#통계학
- 이상탐지
- 내일배움캠프#til#데이터 리터러시
- 머신러닝
- 내일배움캠프#til#파이썬#python#전처리
- 가설검정
- 내일배움캠프#til#sqld
- 카이제곱검정
- 책
- 차원축소
- 내일배움캠프#til#파이썬#python
- vscode
- A/B테스트
- 이상치 제거
- Ai
- 딥러닝
- 제2종오류
- #내일배움캠프 #사전캠프 #til #sql
- 라이브 세션
- t검정
- 통계학공부
Archives
- Today
- Total
Ming's Life
통계학(가설검정) 본문
1. 오늘 학습 키워드
- 통계학 기초
2. 오늘 학습 한 내용을 나만의 언어로 정리하기
1. 가설검정
1) 가설검정이란 무엇인가?


☑️ 가설검정
- 표본 데이터를 통해 모집단의 가설을 검증하는 과정
- 즉, 데이터가 특정 가설을 지지하는지 평가하는 과정
- 귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정
- 데이터 분석시 두가지 전략을 취할 수 있음
- 확증적 자료분석
- 미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석
- 탐색적 자료분석(EDA)
- 가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것
- 확증적 자료분석
☑️ 단계
- 귀무가설(H0)과 대립가설(H1) 설정
- 유의수준(α) 결정
- 검정통계량 계산
- p-값과 유의수준 비교
- 결론 도출
2) 가설검정이란 무엇인가?통계적 유의성과 p값
☑️ 통계적 유의성
- 통계적 유의성은 결과가 우연히 발생한 것이 아니라 어떤 효과가 실제로 존재함을 나타내는 지표
- p값은 귀무 가설이 참일 경우 관찰된 통계치가 나올 확률을 의미
- 일반적으로 p값이 0.05 미만이면 결과를 통계적으로 유의하다고 판단
☑️ p-값
- 귀무가설이 참일 때, 관찰된 결과 이상으로 극단적인 결과가 나올 확률
- 일반적으로 p-값이 유의수준(α)보다 작으면 귀무가설을 기각
- 유의수준으로 많이 사용하는 값이 0.05
☑️ p-값을 통한 유의성 확인
- p-값이 0.03이라면, 3%의 확률로 우연히 이러한 결과가 나올 수 있음
- 일반적으로 0.05 이하라면 유의성이 있다고 봄
3) 신뢰구간과 가설검정의 관계
☑️ 신뢰구간과 가설검정
- 신뢰구간과 가설검정은 밀접하게 관련된 개념
- 둘 다 데이터의 모수(ex. 평균)에 대한 정보를 구하고자 하는 것이지만 접근 방식이 다름
- 신뢰구간
- 특정 모수가 포함될 범위를 제공
❓신뢰구간 (Confidence Interval)
- 신뢰구간은 모집단의 평균이 특정 범위 내에 있을 것이라는 확률을 나타냅니다.
- 일반적으로 95% 신뢰구간이 사용되며, 이는 모집단 평균이 95% 확률로 이 구간 내에 있음을 의미합니다.
- 만약 어떤 설문조사에서 평균 만족도가 75점이고, 신뢰구간이 70점에서 80점이라면, 우리는 95% 확률로 실제 평균 만족도가 이 범위 내에 있다고 말할 수 있습니다.
- 가설검정
- 모수가 특정 값과 같은지 다른지 테스트
4) 가설검정이 실제로 어떻게 적용되어질까?
☑️ 가설을 설정하여 검증
- 새로운 약물이 기존 약물보다 효과가 있는지 검정
- 이 때 새로운 약물은 기존 약물과 큰 차이가 없다는 것이 귀무가설!
- 대립가설은 새로운 약물이 기존 약물과 대비해 교과가 있다는 것!
☑️ 파이썬 실습
# 기존 약물(A)와 새로운 약물(B) 효과 데이터 생성
A = np.random.normal(50, 10, 100)
B = np.random.normal(55, 10, 100)
# 평균 효과 계산
mean_A = np.mean(A)
mean_B = np.mean(B)
# t-검정 수행
t_stat, p_value = stats.ttest_ind(A, B)
print(f"A 평균 효과: {mean_A}")
print(f"B 평균 효과: {mean_B}")
print(f"t-검정 통계량: {t_stat}")
print(f"p-값: {p_value}")
# t-검정의 p-값 확인 (위 예시에서 계산된 p-값 사용)
print(f"p-값: {p_value}")
if p_value < 0.05:
print("귀무가설을 기각합니다. 통계적으로 유의미한 차이가 있습니다.")
else:
print("귀무가설을 기각하지 않습니다. 통계적으로 유의미한 차이가 없습니다.")
'통계학' 카테고리의 다른 글
| 통계학(다중검정) (0) | 2025.07.10 |
|---|---|
| 통계학(t검정) (2) | 2025.07.10 |
| 통계학(A/B 검정) (1) | 2025.07.10 |
| 통계학(통계분표) (0) | 2025.06.25 |
| 통계학(1주차 연습문제) (0) | 2025.06.24 |