K. NAGAI
大人からはじめる統計 vol.10 標準偏差のn-1
更新日:2021年11月19日
前回は、自由度について紹介しました。
自由度は、標準偏差の分母n-1として知っている方も多いのではないでしょうか。
-1に違和感を感じながらも、
「標準偏差は、とりあえずn-1で割ればいいんだな」
なんて覚えていないでしょうか?
実はこれも、標本から母集団について推定しているからn-1なのです。

n:標本サイズ、Xbar:標本平均
順を追ってn-1の理由を見てみましょう。
各標本と母平均との差を二乗して総和をとると、次のように分解できます。

イメージ図(分解の途中式が気になる方は参考文献をご覧ください)
標本平均Xbarと母平均μの差、Xbar-μを考えるところがポイントです。

式の右辺第1項(標準偏差の分子ですね)を主語にして、nで割ります。

ここで、標本が無限に大きい時を考えます。
標本が無限に大きい時、右辺第1項は母分散σ^2になります。
無限に大きい標本 = 母集団という感覚です。
右辺第2項はどうなるでしょうか?
2乗なので、μとXbarを入れ替えても同じ値です。

これは、標本平均Xbarの分布(標本分布)の分散で、
実は、vol6で既に登場しています。
図では標準偏差になっており、2乗すると、
標本分布の分散 = 母分散σ^2/サンプルサイズn

ここまでの内容を組み合わせると、無限の標本を考えた時、次の式になります。

両辺にnをかけて、右辺をσ^2でくくります。

n-1がついに現れましたね!もうお分かりだと思います。
σ^2を主語にすると

母分散を推定する式になりました!
平方根をとれば、最初の母標準偏差を推定する式になります。
母分散そのものではなく推定と言う理由は、この式を作るときに、無限の標本を考えました。
標本が大きければ大きいほどこの値は母分散に近づきますが、実際には無限の標本を手にすることはできないため、推定となります。
毎回、母分散(推定)、母標準偏差(推定)というのはまどろっこしいので、
不偏分散、不偏標準偏差、といいます。
サンプルは母集団の一部なので、母集団に比べると偏っています。
その偏りを補正したという意味で”不偏”とついています。
ここまで式を追っていただいた方、お疲れ様でした!
----
参考文献
実践統計学入門(足立堅一)