실험
표본
- 모집단과 표본 : 모집단은 어떤 확률분포로부터 관찰될 수 있는 모든 관측값들을 의미함. 표본은 실험자가 알려지지 않은 확률분포를 조사하기 위해 사용하는 모집단의 부분집합임. 확률표본은 모집단에서 임의로 선택된 표본이며, 표본이 모집단을 대표한다는 것을 입증하기 위해 사용됨.
표본 통계량
표본 평균
- 자료의 표본평균 $\bar{x}$는 단순히 관측치들의 평균값임. $n$개의 관측치 $x_1,...,x_n$에 대하여 표본 평균은
$$
\bar{x}=\frac{\sum^n_{i-1}x_i}{n}
$$
임. 이는 중간값을 나타낸다고 볼 수도 있음.
표본 최빈값
- 표본 최빈값 : 표본 최빈값은 범주형 또는 이산형 자료에서 관측치 중 가장 많은 빈수를 갖는 값임.
표본 분산
- 자료 관찰값 $x_1,...,x_n$의 표본 분산은 다음과 같이 정의됨. ⬇️
$$
s^2=\frac{\sum^n_{i=1}(x_i-\bar{x})^2}{n-1}
$$
표본 분산 $s^2$는 모분산 $\sigma^2$의 추정치로서, 분산 $\sigma^2$가 확률분포의 변동성을 나타내는 것과 마찬가지로 표본의 변동성을 나타냄. 표본 분산을 구하는 또 다른 계산식으로는
$$
s^2=\frac{(\sum^n_{i=1}x^2)-n\bar{x}^2}{n-1},s^2=\frac{(\sum^n_{i=1}x^2)-(\sum^n_{i=1}x)^2/n}{n-1}
$$
이 있음.
표본 분위수
- 표본 분위수 : $p$번째 표본 분위수는 표본의 비율 $p$에 해당하는 표본들보다는 크고 비율 $1-p$에 해당되는 표본들보다 작은 값으로, 미지의 확률분포의 $p$번째 분위의 추정치임.