👩🎓✍/BigData 분석기사
18. 추론 통계
글로랴
2021. 3. 11. 23:08
추론 통계
모집단의 표본(Sample)을 가지고 모집단의 특성(모수)을 추론하고 그 결과의 신뢰성을 검정하는 것이다.
1️⃣ 점 추정
(1) 점 추정의 조건 ✔
- 불편성, Unbiasedness : 추정량의 기댓값은 모집단의 모수와 차이가 없음
- 효율성 : 추정량의 분산은 작을수록 좋음
- 일치성 : 표본의 크기가 아주 커지면, 추정량이 모수와 거의 같아짐
- 충족성 : 추정량은 모수에 대하여 모든 정보를 제공
2️⃣ 구간 추정
- 추정값에 대한 신뢰도를 제시하면서 범위로 모수를 추정하는 기법
- 추정량의 분포에 대한 전제와 신뢰수준이 주어져야 함
(1) 구간 추정 용어
- 신뢰 수준
- 추정값이 존재하는 구간에 모수가 포함될 확률
- 100 * (1-α)
- α : 조사에서 인정되는 오차 수준(유의수준)
- 신뢰 구간
- 신뢰수준을 기준으로 추정된 통계적으로 유의미한 모수의 범위
- (표본평균) - (z * 표준오차) ~ (표본평균) + (z * 표준오차)가 모집단 평균에 대한 신뢰구간
3️⃣ 가설검정
모집단의 특성, 특히 모수에 대한 가정 혹은 잠정적인 결론
(1) 가설 종류
- 귀무가설(영가설, H0) : 현재까지 주장되어 온 것이거나 기존과 비교하여 변화 혹은 차이가 없음을 나타내는 가설
- 대립가설(연구가설, H1) : 표본을 통해 확실한 근거를 가지고 입증하고자 하는 가설
(2) 가설 검정 절차
- 가설 설정 - 유의수준 설정 - 검정방법 설정(양측, 단측) - p값 산출 - 가설 검정(p값과 유의수준 비교) - 가설 채택 및 기각
(3) 가설 검정 오류의 종류 ✔
- 제 1종 오류(α) - 귀무가설이 참인데 잘못하여 이를 기각하게 되는 오류
- 제 2종 오류(β) - 귀무가설이 참이 아닌데 잘못하여 이를 채택하게 되는 오류
4️⃣ 검정 통계량
- 가설검정의 대상이 되는 모수를 추론하기 위해 사용되는 표본 통계량
- 귀무가설이 참이라는 전제하에서 모집단으로부터 추출된 확률분포의 정보를 이용하여 계산
5️⃣ p-값
- 귀무가설이 참이라는 가정에 따라 주어진 표본 데이터를 희소 또는 극한값으로 얻을 확률값
- 귀무가설이 참일 때 귀무가설을 기각하게 되는 제 1종 오류를 범할 확률
- p값 < 유의수준 α
반응형