Ming's Life

통계학(가설검정) 본문

통계학

통계학(가설검정)

chamiii 2025. 7. 10. 20:07

1. 오늘 학습 키워드

  • 통계학 기초

 


 

2. 오늘 학습 한 내용을 나만의 언어로 정리하기

 

 

1. 가설검정

 

1) 가설검정이란 무엇인가?

https://www.kdnuggets.com/hypothesis-testing-and-ab-testing

 

https://prepnuggets.com/glossary/two-tailed-hypothesis-test/

 

☑️ 가설검정

  • 표본 데이터를 통해 모집단의 가설을 검증하는 과정
  • 즉, 데이터가 특정 가설을 지지하는지 평가하는 과정
  • 귀무가설(H0)과 대립가설(H1)을 설정하고, 귀무가설을 기각할지를 결정
  • 데이터 분석시 두가지 전략을 취할 수 있음
    • 확증적 자료분석
      • 미리 가설들을 먼저 세운 다음 가설을 검증해 나가는 분석
    • 탐색적 자료분석(EDA)
      • 가설을 먼저 정하지 않고 데이터를 탐색해보면서 가설 후보들을 찾고 데이터의 특징을 찾는 것

 

☑️ 단계

  1. 귀무가설(H0)과 대립가설(H1) 설정
  2. 유의수준(α) 결정
  3. 검정통계량 계산
  4. p-값과 유의수준 비교
  5. 결론 도출

 


2) 가설검정이란 무엇인가?통계적 유의성과 p값

☑️ 통계적 유의성

  • 통계적 유의성은 결과가 우연히 발생한 것이 아니라 어떤 효과가 실제로 존재함을 나타내는 지표
  • p값은 귀무 가설이 참일 경우 관찰된 통계치가 나올 확률을 의미
  • 일반적으로 p값이 0.05 미만이면 결과를 통계적으로 유의하다고 판단

☑️ p-값

  • 귀무가설이 참일 때, 관찰된 결과 이상으로 극단적인 결과가 나올 확률
  • 일반적으로 p-값이 유의수준(α)보다 작으면 귀무가설을 기각
  • 유의수준으로 많이 사용하는 값이 0.05

☑️ p-값을 통한 유의성 확인

  • p-값이 0.03이라면, 3%의 확률로 우연히 이러한 결과가 나올 수 있음
  • 일반적으로 0.05 이하라면 유의성이 있다고 봄

 

 


3) 신뢰구간과 가설검정의 관계

☑️ 신뢰구간과 가설검정

  • 신뢰구간과 가설검정은 밀접하게 관련된 개념
  • 둘 다 데이터의 모수(ex. 평균)에 대한 정보를 구하고자 하는 것이지만 접근 방식이 다름
  • 신뢰구간
    • 특정 모수가 포함될 범위를 제공

❓신뢰구간 (Confidence Interval)

  • 신뢰구간은 모집단의 평균이 특정 범위 내에 있을 것이라는 확률을 나타냅니다.
  • 일반적으로 95% 신뢰구간이 사용되며, 이는 모집단 평균이 95% 확률로 이 구간 내에 있음을 의미합니다.
  • 만약 어떤 설문조사에서 평균 만족도가 75점이고, 신뢰구간이 70점에서 80점이라면, 우리는 95% 확률로 실제 평균 만족도가 이 범위 내에 있다고 말할 수 있습니다.
  • 가설검정
    • 모수가 특정 값과 같은지 다른지 테스트

 

 


4) 가설검정이 실제로 어떻게 적용되어질까?

☑️ 가설을 설정하여 검증

  • 새로운 약물이 기존 약물보다 효과가 있는지 검정
  • 이 때 새로운 약물은 기존 약물과 큰 차이가 없다는 것이 귀무가설!
  • 대립가설은 새로운 약물이 기존 약물과 대비해 교과가 있다는 것!

 

☑️ 파이썬 실습

# 기존 약물(A)와 새로운 약물(B) 효과 데이터 생성
A = np.random.normal(50, 10, 100)
B = np.random.normal(55, 10, 100)

# 평균 효과 계산
mean_A = np.mean(A)
mean_B = np.mean(B)

# t-검정 수행
t_stat, p_value = stats.ttest_ind(A, B)

print(f"A 평균 효과: {mean_A}")
print(f"B 평균 효과: {mean_B}")
print(f"t-검정 통계량: {t_stat}")
print(f"p-값: {p_value}")

# t-검정의 p-값 확인 (위 예시에서 계산된 p-값 사용)
print(f"p-값: {p_value}")
if p_value < 0.05:
    print("귀무가설을 기각합니다. 통계적으로 유의미한 차이가 있습니다.")
else:
    print("귀무가설을 기각하지 않습니다. 통계적으로 유의미한 차이가 없습니다.")

 

'통계학' 카테고리의 다른 글

통계학(다중검정)  (0) 2025.07.10
통계학(t검정)  (2) 2025.07.10
통계학(A/B 검정)  (1) 2025.07.10
통계학(통계분표)  (0) 2025.06.25
통계학(1주차 연습문제)  (0) 2025.06.24