K. NAGAI
大人からはじめる統計 vol.6 標本平均の標準化
更新日:2021年4月15日
前回は、中心極限定理をご紹介しました。
中心極限定理に基づく統計手法は多くあります。
今回は、標本平均から母平均について推測する準備として、中心極限定理を使い標本分布を標準化します。
中心極限定理は、母集団がどんな分布をしていても、標本平均の分布(以下、標本分布)は正規分布に近づく、という定理でした。

標本分布が従う正規分布のパラメータは次のようになります(上図)。
平均 = 母平均 (1)
標準偏差 = 母標準偏差/√サンプルサイズ (2)
vol.4でご紹介したように、正規分布であれば、たった一つのz分布に標準化することができます。

この式を標本平均について書き換えます。

中心極限定理の説明にあった(1)(2)を代入しました。nはサンプルサイズです。

図:標本分布も標準化するとおなじみのZ分布に
ここまでで、標本平均のZ値を計算することができました。
標本平均を標準化した値は、検定や区間推定など、統計的に推測する多くの場面で使用します。
しかし、今回の式には母標準偏差が含まれています。
標本平均から母平均について推定するとき、母集団について直接調べられないからサンプルを使うのに、母標準偏差が分かっているのはヘンな状況です。
次回、この式を実用的な形にします。
[統計小話]
正確には、中心極限定理はサンプルサイズが大きいほど標本分布が正規分布に近づきます。
下の図は、サイコロをn回振った平均のヒストグラムです。
nはサンプルサイズにあたります。
赤→青→水→緑→黄の順で、サンプルサイズが大きくなるほど、おわん型から正規分布に近づいています。

引用:Minitab 20サポート 中心極限定理のデモンストレーション