통계학(가설검정)

Notice

Recent Posts

Recent Comments

Link

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

Ming's Life

통계학(가설검정) 본문

통계학

통계학(가설검정)

chamiii 2025. 7. 10. 20:07

1. 오늘 학습 키워드

통계학 기초

2. 오늘 학습 한 내용을 나만의 언어로 정리하기

1. 가설검정

1) 가설검정이란 무엇인가?

https://www.kdnuggets.com/hypothesis-testing-and-ab-testing

https://prepnuggets.com/glossary/two-tailed-hypothesis-test/

☑️ 가설검정

표본 데이터를 통해 모집단의 가설을 검증하는 과정
즉, 데이터가 특정 가설을 지지하는지 평가하는 과정
귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정
데이터 분석시 두가지 전략을 취할 수 있음
- 확증적 자료분석
  - 미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석
- 탐색적 자료분석(EDA)
  - 가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것

☑️ 단계

귀무가설(H0)과 대립가설(H1) 설정
유의수준(α) 결정
검정통계량 계산
p-값과 유의수준 비교
결론 도출

2) 가설검정이란 무엇인가?통계적 유의성과 p값

☑️ 통계적 유의성

통계적 유의성은 결과가 우연히 발생한 것이 아니라 어떤 효과가 실제로 존재함을 나타내는 지표
p값은 귀무 가설이 참일 경우 관찰된 통계치가 나올 확률을 의미
일반적으로 p값이 0.05 미만이면 결과를 통계적으로 유의하다고 판단

☑️ p-값

귀무가설이 참일 때, 관찰된 결과 이상으로 극단적인 결과가 나올 확률
일반적으로 p-값이 유의수준(α)보다 작으면 귀무가설을 기각
유의수준으로 많이 사용하는 값이 0.05

☑️ p-값을 통한 유의성 확인

p-값이 0.03이라면, 3%의 확률로 우연히 이러한 결과가 나올 수 있음
일반적으로 0.05 이하라면 유의성이 있다고 봄

3) 신뢰구간과 가설검정의 관계

☑️ 신뢰구간과 가설검정

신뢰구간과 가설검정은 밀접하게 관련된 개념
둘 다 데이터의 모수(ex. 평균)에 대한 정보를 구하고자 하는 것이지만 접근 방식이 다름
신뢰구간
- 특정 모수가 포함될 범위를 제공

❓신뢰구간 (Confidence Interval)

신뢰구간은 모집단의 평균이 특정 범위 내에 있을 것이라는 확률을 나타냅니다.
일반적으로 95% 신뢰구간이 사용되며, 이는 모집단 평균이 95% 확률로 이 구간 내에 있음을 의미합니다.
만약 어떤 설문조사에서 평균 만족도가 75점이고, 신뢰구간이 70점에서 80점이라면, 우리는 95% 확률로 실제 평균 만족도가 이 범위 내에 있다고 말할 수 있습니다.

가설검정
- 모수가 특정 값과 같은지 다른지 테스트

4) 가설검정이 실제로 어떻게 적용되어질까?

☑️ 가설을 설정하여 검증

새로운 약물이 기존 약물보다 효과가 있는지 검정
이 때 새로운 약물은 기존 약물과 큰 차이가 없다는 것이 귀무가설!
대립가설은 새로운 약물이 기존 약물과 대비해 교과가 있다는 것!

☑️ 파이썬 실습

# 기존 약물(A)와 새로운 약물(B) 효과 데이터 생성
A = np.random.normal(50, 10, 100)
B = np.random.normal(55, 10, 100)

# 평균 효과 계산
mean_A = np.mean(A)
mean_B = np.mean(B)

# t-검정 수행
t_stat, p_value = stats.ttest_ind(A, B)

print(f"A 평균 효과: {mean_A}")
print(f"B 평균 효과: {mean_B}")
print(f"t-검정 통계량: {t_stat}")
print(f"p-값: {p_value}")

# t-검정의 p-값 확인 (위 예시에서 계산된 p-값 사용)
print(f"p-값: {p_value}")
if p_value < 0.05:
    print("귀무가설을 기각합니다. 통계적으로 유의미한 차이가 있습니다.")
else:
    print("귀무가설을 기각하지 않습니다. 통계적으로 유의미한 차이가 없습니다.")

'통계학' 카테고리의 다른 글

통계학(다중검정) (0)	2025.07.10
통계학(t검정) (2)	2025.07.10
통계학(A/B 검정) (1)	2025.07.10
통계학(통계분표) (0)	2025.06.25
통계학(1주차 연습문제) (0)	2025.06.24

'통계학' Related Articles

Ming's Life

통계학(가설검정) 본문

통계학(가설검정)

1. 가설검정

1) 가설검정이란 무엇인가?

☑️ 가설검정

☑️ 단계

2) 가설검정이란 무엇인가?통계적 유의성과 p값

☑️ 통계적 유의성

☑️ p-값

☑️ p-값을 통한 유의성 확인

3) 신뢰구간과 가설검정의 관계

☑️ 신뢰구간과 가설검정

4) 가설검정이 실제로 어떻게 적용되어질까?

☑️ 가설을 설정하여 검증

☑️ 파이썬 실습

'통계학' 카테고리의 다른 글

티스토리툴바