- 6.1 통계적 추론
- 6.2 모평균에 대한 점추정
- 6.3 모평균에 대한 구간추정
- 6.4 모비율에 대한 추정
R과 함께하는 통계학의 이해 - 최용석
6.1 통계적 추론
통계적 추론(statistical inference): 모집단의 수치적 특성을 나타내는 모수(parameter)에 대한 정보를 얻어내기 위한 일련의 과정
통계량(statistic)들의 값을 계산하고 이것을 이용하여 모집단의 특성(모수)를 알아보는 것이다.
1) 추정(estimation): 모수에 대한 추측값을 얻되, 그 값의 정밀도를 함께 구하는 것
2) 가설 검정(hypotheses testing): 표본의 자료가 모수의 참값에 대한 조사자의 추측을 뒷받침하는지 혹은 반증하는지 결정하는 것 -> 7장
6.2 모평균에 대한 점추정
점추정: 모수의 참값과 유사할 것이라고 예상되는 하나의 값 제시
모집단의 크기가 $n$인 표본을 임의로 추출할 때 이를 $n$개의 확률변수 $X_1,X_2,…,X_n$으로 표현
추정하고자 하는 하나의 모수에 대하여 이들 $n$개의 확률변수를 이용하여 하나의 통계량을 만들고,
나아가 주어진 표본으로부터 그 실제값을 계산하여 하나의 수치를 제시하는 것
추정량(estimator): 모수를 추정하기 위해 만들어진 통계량 (ex. $ \hat{\mu}, \hat{\sigma} $)
추정치(estimate): 주어진 표본으로부터 계산된 추정량의 실제값
$ \hat{\mu} = \bar{X} = \frac{1}{n}(X_1+X_2+…+X_n) = \frac{1}{n}\sum{X_i}$
여기서 $\hat{\mu}$는 모평균 $\mu$에 대한 추정량
이러한 추정량은 확률변수들로부터 만들어진 하나의 확률변수이므로 추출된 표본의 값에 따라 그 값(추정치)가 달라질 수 있다.
표준오차(standard error, S.E.): 수치(추정치)들의 변동은 추정량의 정확도와 관계가 있는데, 이 정확도를 측정하기 위해 추정량의 표준편차를 계산한 것
$ E(\bar{X}) = \mu ,\quad S.E.(\bar{X}) = \frac{\sigma}{\sqrt{n}} $
따라서 표본평균 $ \bar{X} $를 이용하여 모평균 $\mu$를 추정하고자 할 경우 표본의 크기 $n$이 클수록 표준오차가 작아져서 보다 정확한 추정이 가능하다.
하지만 모수인 $ \sigma $(모집단의 표준편차)를 모르는 경우 계산할 수 없다.
표본의 표준편차 $ \hat{\sigma} $를 이용하여 추정할 수 있다.
$ \hat{\sigma} = s = \sqrt{ \frac{1}{n-1}\sum{(X_i-\bar{X})^2} } $
- 소나무 성장 연구를 위한 1년생 소나무 묘목 40그루의 크기를 조사한 자료 : 2.6, 1.9, 1.8, 1.6, 1.4, 2.2,…,1.2
전체 1년생 소나무 묘목의 평균 크기에 대한 추정치(= 표본평균($\bar{x}$)) 와 표준오차($\frac{s}{\sqrt{n}}$) :
$ \bar{x} = \frac{1}{40} \times (2.6+1.9+…+1.2) = 1.715 $
$ s^2 = \frac{1}{40-1} \times \{ (2.6 - 1.715)^2 + … + (1.2-1.715)^2 \} = 0.2254 $
$ \frac{s}{\sqrt{n}} = \frac{ \sqrt{0.2254} } { \sqrt{40}} = 0.0751 $