-
반응형
2021.12.02 - [잡담] - 가설 검정과 유의수준을 알아보자
p-value(유의확률)에 대해 알기 전에 가설 검정과 유의수준에 대해서 알아야 합니다. 따라서 이전 글을 먼저 보시길 추천드립니다.
이전 내용과 p-value는 별로 다른 내용이 없습니다.
p-value(유의확률) : 검정통계량의 값으로부터 계산된 확률로서 귀무가설 $H_0$를 기각케 하는 최소의 유의수준.
정의를 보면 잘 이해가 되질 않네요...
결국은 귀무가설을 기각케 하는 유의수준이다! 라는 것이 핵심입니다.
일반적으로 가설검정 문제에선 유의수준 α값을 정해 놓고, 이에 해당하는 기각역을 구한 후에 귀무가설 $H_0$의 기각 여부를 결정합니다. 그러나 p-value가 계산된다면 직접 유의수준 α값과 비교하여 기각여부를 결정할 수 있습니다. 따라서 p-value를 이용하면 매번 기각역을 구하지 않고도 귀무가설 $H_0$의 기각여부를 결정할 수 있습니다.
문제를 통해 과정이 어떻게 다른지 확인합시다.
먼저 p-value를 사용하지 않을 때입니다.
어떤 정규 모집단의 모평균 m = 70이라고 알려져 왔으나, 조사자 A는 추출된 표본자료의 결과로 모평균 m이 70보다 작다고 주장한다. 이 주장을 조사자 A의 입장에서 유의수준 α=0.05로 검정하라.($z_0.05$ = 1.645)
->
(1) 가설 설정 : $H_0$ : m = 70
$H_1$ : m < 70
(2) 기각역설정 : 기각역 R : Z < -$z_α$, Z = ${\bar{X} - m \over σ/\sqrt{n}}$
(3) 계산 : 주어진 수치를 활용하여 검정통계량을 구한다.
σ = 15, m = 70, n = 25, $\bar{x}$ = 64.32, α = 0.05
z = ${\bar{X} - m \over σ/\sqrt{n}}$ = ${64.32 - 70 \over 15/\sqrt{25}}$ ≓ -1.893
(4) 의사결정 : z = -1.893 < -1.645 = -$z_0.05$ 이므로 유의수준 α=0.05에서 귀무가설은 기각되어야 한다.
자 그럼 p-value를 이용한 방법을 보겠습니다. 위의 과정에서 (3)번까지는 동일합니다.
(4) 의사결정 :
p = P(Z<-1.893) = 0.03 < 0.05 = α 이므로 귀무가설은 기각되어야 한다.
과정이 거의 동일하기 때문에 딱히 설명할 게 없습니다.
그렇다면 p-value는 왜 쓸까요?
1. 확률로 확인할 수 있다.
-> 귀무가설이 제1종오류를 일으킬 확률을 확인할 수 있습니다. 위의 경우에는 3%라고 나오듯이.
2. 표준정규분포 수치를 변환할 필요가 없다.
-> 유의수준을 변환할 필요가 없습니다. 이게 아마 가장 큰 이유라고 생각되는데요 요즘은 대부분 툴을 쓰는데 한 번에 촥 나오고 직관적으로 와닿기 때문입니다.
2021.12.03 - [잡담] - A/B Test란? (feat. p-value)
반응형'잡담' 카테고리의 다른 글
A/B Test란? (feat. p-value) (0) 2021.12.03 가설 검정과 유의수준을 알아보자 (0) 2021.12.02 빅데이터 분석기사 후기 (0) 2021.09.15 [git] RPC failed; curl 92 에러 (0) 2021.01.24 아마존 리눅스와 Nginx를 이용해 리액트 웹 서버 구축하기(3) (0) 2021.01.05