• K. NAGAI

大人からはじめる統計 vol.9 1サンプルt検定の自由度とは

1サンプルt検定で使われる、t分布の形は自由度によって異なります。

青線が、自由度1のとき。

赤線が、自由度3のとき。

緑線が、自由度30のとき。


自由度が小さいほど裾が広く、自由度が大きいほど裾が狭まり、0のところで山が高くなっていきます。

画像はMinitab社のブログより:https://blog.minitab.com/ja/statistics-and-quality-data-analysis/what-are-degrees-of-freedom-in-statistics



そもそも自由度とは


例えば、値が10個あるサンプルデータがあるとします。

何も制約が無ければ、各値は任意の数になりえます。このとき、自由度10です。


1サンプルt検定を使って、このサンプルの母平均について推定を行うとします。

ここで生じる制約は何でしょうか?


1サンプルt検定は、サンプルの平均から、母平均=目標値かどうか推定する検定でした。

このとき、サンプルの平均を使っています。

実は、平均を使うというだけで、制約が生じます。


どのような制約でしょうか?


「データを足し合わせると、平均 × データ数 になる」という制約です。


つまり、サンプルデータに10個値がある場合、その合計は平均の10倍になります。

平均が2.5であれば、合計は25です。


合計が35と決まっているとき、最初の9個の値はどんな値もとりえます。

たとえば、-9, 1, 10, -33, 20, 40, 100, 9, 11

合計は、149です。

最後の1個の値は、帳尻合わせのために-124だけに決まります。

149-124=25


10個の値のうち、9個はどんな値もとりえる。これがこのサンプルの自由度です。

平均という1つの制約で、自由度がデータの個数から1つ減る。

だから1サンプルt検定での自由度は「n-1」・・・データ数-1

なんですね。


いかがでしたでしょうか。

自由度とは、データ数 ー 制約の数。


平均を使うというだけで「データを足し合わせると、平均 × データ数 になる」という

制約が生じる。

統計はつくづく、実践で使うのにも基本が重要となる学問です。

逆に言えば、基本を理解してしまえばこちらのもの。


製造業で使われる実践的な統計を身に付けたい方は、

弊社の統計トレーニングをご活用ください!



---

参考文献

足立堅一(平成13年)「実践統計学入門」篠原出版新社

Minitab社のブログ(2021)「統計における自由度とは何か? What Are Degrees of Freedom in Statistics?」https://blog.minitab.com/ja/statistics-and-quality-data-analysis/what-are-degrees-of-freedom-in-statistics



[2021/10/20, K. Nagai]

226回の閲覧0件のコメント

最新記事

すべて表示