R과 함께하는 통계학의 이해 - 최용석


6.1 통계적 추론

통계적 추론(statistical inference): 모집단의 수치적 특성을 나타내는 모수(parameter)에 대한 정보를 얻어내기 위한 일련의 과정

통계량(statistic)들의 값을 계산하고 이것을 이용하여 모집단의 특성(모수)를 알아보는 것이다.

1) 추정(estimation): 모수에 대한 추측값을 얻되, 그 값의 정밀도를 함께 구하는 것

2) 가설 검정(hypotheses testing): 표본의 자료가 모수의 참값에 대한 조사자의 추측을 뒷받침하는지 혹은 반증하는지 결정하는 것 -> 7장


6.2 모평균에 대한 점추정

점추정: 모수의 참값과 유사할 것이라고 예상되는 하나의 값 제시

모집단의 크기가 $n$인 표본을 임의로 추출할 때 이를 $n$개의 확률변수 $X_1,X_2,…,X_n$으로 표현
추정하고자 하는 하나의 모수에 대하여 이들 $n$개의 확률변수를 이용하여 하나의 통계량을 만들고,
나아가 주어진 표본으로부터 그 실제값을 계산하여 하나의 수치를 제시하는 것

추정량(estimator): 모수를 추정하기 위해 만들어진 통계량 (ex. $ \hat{\mu}, \hat{\sigma} $)

추정치(estimate): 주어진 표본으로부터 계산된 추정량의 실제값

$ \hat{\mu} = \bar{X} = \frac{1}{n}(X_1+X_2+…+X_n) = \frac{1}{n}\sum{X_i}$

여기서 $\hat{\mu}$는 모평균 $\mu$에 대한 추정량

이러한 추정량은 확률변수들로부터 만들어진 하나의 확률변수이므로 추출된 표본의 값에 따라 그 값(추정치)가 달라질 수 있다.

표준오차(standard error, S.E.): 수치(추정치)들의 변동은 추정량의 정확도와 관계가 있는데, 이 정확도를 측정하기 위해 추정량의 표준편차를 계산한 것

$ E(\bar{X}) = \mu ,\quad S.E.(\bar{X}) = \frac{\sigma}{\sqrt{n}} $
따라서 표본평균 $ \bar{X} $를 이용하여 모평균 $\mu$를 추정하고자 할 경우 표본의 크기 $n$이 클수록 표준오차가 작아져서 보다 정확한 추정이 가능하다.
하지만 모수인 $ \sigma $(모집단의 표준편차)를 모르는 경우 계산할 수 없다.
표본의 표준편차 $ \hat{\sigma} $를 이용하여 추정할 수 있다.

$ \hat{\sigma} = s = \sqrt{ \frac{1}{n-1}\sum{(X_i-\bar{X})^2} } $

6.3 모평균에 대한 구간추정

구간추정: 모수의 참값을 포함할 것으로 예상되는 적절한 구간을 제시


6.4 모비율에 대한 추정