가설 검정
𝐻0: 귀무 가설(Null Hypothesis)
- 통상적으로 받아들여지는 가설, 입증이 불필요 합니다.
𝐻1: 대립 가설(Alternative Hypothesis)
- 귀무 가설에 대립이 되는 가설, 주장하고자하는 가설로서, 입증이 필요합니다.
ex) 무죄 추정의 원칙
𝐻0: 피고는 무죄입니다.
𝐻1: 피고는 유죄입니다.
검사는 피고는 유죄임을 입증하는 증거를 제시하여 피고가 유죄라는 것을 밝힙니다.
판사는 제시된 증거를 가지고 판단합니다.
피고의 유죄임이 증거가 불충분하다면, 피고가 무죄라는 귀무 가설은 기각하지 못합니다(Not Reject).
피고의 유죄임이 증거가 충분하다면, 피고가 무죄라는 귀무 가설을 기각(Reject)합니다.
검정 오류
False Positive: Type-1 Error, False Positive(𝐻1) – 𝐻1으로 결론 낸 것이 잘못된 것을 말합니다.
False Negative: Type-2 Error, False Negative(𝐻0) – 𝐻0로 결론 낸 것이 잘못됨 것을 말합니다.
Truth\Conclusion | 𝐻0 Rejected | 𝐻0 not Rejected |
---|---|---|
𝐻1 is true | TP(True Positive) | FN(False Negative) Type 2 Error(2종 오류) |
𝐻0 is true | FP(False Positive) Type 1 Error(1종 오류) | TN(True Negative) |
pvalue: 증거에 기반하여 귀무 가설을 기각한 것이 오류일 확률을 말합니다.
- Type-I 오류일 확률
유의 수준(significance level, 𝛼): 귀무 가설 기각을 판단하기 위한 pvalue의 기준점 입니다.
귀무 가설에 유리하게 가설 검정을 바라봅니다.
- pvalue가 유의 수준 보다 크거나 같으면 𝐻0을 택합니다.
- 이런 관점에서, pvalue의 정의를 “증거에 기반하여 귀무 가설을 기각한 것이 오류일 확률의 최대값“으로 확장됩니다
귀무 가설이 특정 값이 아닌 범위 일 때,
귀무 가설이 취하는 범위 중에서 pvalue가 가장 큰 값이 되는 경우로 pvalue를 구합니다.
pvalue의 계산
- Type-I 오류의 의미에서 False Positive → 귀무 가설이 맞습니다.
- 귀무 가설이 맞다는 가정과 주어진 조건을 이용하여 증거의 확률 분포를 구합니다.
- 확률을 구할 통계량의 영역에 따른 검정 종류 파악
대립 가설이 지지하는통계량의 영역 | 검정 종류 | pvalue 계산법 |
---|---|---|
좌측 | 좌측(left) 꼬리 검정 | pvalue를 검정통계량 기준으로 확률 분포의 좌측 꼬리 영역을 계산 |
우측 | 우측(right) 꼬리 검정 | pvalue를 검정통계량 기준으로 확률 분포의 우측 꼬리 영역을 계산 |
양쪽 | 양측(two-sided) 꼬리 검정 | 1. 대칭 분포일 경우: 좌측 꼬리에 해당하는 검정통계량을 구하고 좌측 꼬리 영역을 계산값의 2배를 취합니다. 2.비대칭 분포일 경우: 기각역을 구하여 판단하거나, pvalue의 근사값을 구합니다. * 이 때 정확한 pvalue는 구할 수 없으며, 꼬리 영역의 너비가 작은 쪽의 2배를 취하여 어림 잡습니다. |
통계적 가설 검정의 절차
pvalue를 통한 방법
- 𝐻0와 𝐻1을 설정합니다.
- 수집된 증거(통계량)와 제시된 정보에서 pvalue를 구할 방법을 찾습니다.
귀무 가설이 맞다는 가정하에 증거가 가지는 확률 분포와 검정 통계량을 도출합니다.
- pvalue를 계산합니다.
- pvalue와 유의 수준을 비교하여 결론을 냅니다.
ex)
A 설탕은 포대 당 무게가 20kg 이라고 표시가 되어 있습니다.
소비자 보호센터에 A설탕의 포대 당 무게가 20kg이 되지 않는다는 사건이 접수가 되었습니다.
포장 기계에는 발생할 수 표준편차가 0.4kg 이라고 적혀 있었고, 이 기계에서 발생하는 오차는 맞다고 가정합니다.
이를 위해 30개의 표본 포대 무게를 측정한 결과를 가지고 (30개는 표본의 평균이 정규분포를 따르기에 충분한 표본 수라고 가정합니다.)
소비자의 주장을 받아들일 수 있는지 분석을 해봅니다. (유의 수준: 0.05)
치즈 슬라이스 표본의 무게(kg)
19.37, 20.20, 19.91, 19.20, 19.57, 20.46, 18.83, 19.63, 20.31, 19.45,
19.53, 19.76, 20.40, 19.54, 19.62, 19.63, 20.68, 20.67, 20.20, 19.95,
20.09, 20.40, 19.43, 20.27, 19.30, 19.54, 20.16, 19.23, 19.74, 19.46
귀무 가설과 대립 가설을 세웁니다.
𝐻0: 설탕 포대 무게(의 모평균) = 20kg
𝐻1: 설탕 포대 무게(의 모평균) < 20kg
X = [
19.37, 20.20, 19.91, 19.20, 19.57, 20.46, 18.83, 19.63, 20.31, 19.45,
19.53, 19.76, 20.40, 19.54, 19.62, 19.63, 20.68, 20.67, 20.20, 19.95,
20.09, 20.40, 19.43, 20.27, 19.30, 19.54, 20.16, 19.23, 19.74, 19.46
]
pvalue = 0.006 으로 유의 수준 0.05 보다 적어서
귀무 가설을 기각합니다.
기각역에 의한 방법
- 기각역(rejection region): 귀무가설이 기각되는 검정 통계량의 구간
- 임계값(critical value): 기각역의 경계점의 통계량
- 𝐻0와 𝐻1을 설정합니다.
- 수집된 증거(통계량)와 제시된 정보에서 기각역을 구할 방법을 정합니다.
귀무 가설이 맞다는 가정하에 증거가 가지는 확률 분포를 구하고, 유의 수준보다 pvalue가 작은 영역 도출
- 수집된 증거의 검정 통계량을 구합니다.
- 기각역과 통계량을 바탕으로 결론을 냅니다.