K. NAGAI
大人からはじめる統計 vol.9 1サンプルt検定の自由度とは
1サンプルt検定で使われる、t分布の形は自由度によって異なります。
青線が、自由度1のとき。
赤線が、自由度3のとき。
緑線が、自由度30のとき。
自由度が小さいほど裾が広く、自由度が大きいほど裾が狭まり、0のところで山が高くなっていきます。

画像はMinitab社のブログより:https://blog.minitab.com/ja/statistics-and-quality-data-analysis/what-are-degrees-of-freedom-in-statistics
そもそも自由度とは
例えば、値が10個あるサンプルデータがあるとします。
何も制約が無ければ、各値は任意の数になりえます。このとき、自由度10です。
1サンプルt検定を使って、このサンプルの母平均について推定を行うとします。
ここで生じる制約は何でしょうか?
1サンプルt検定は、サンプルの平均から、母平均=目標値かどうか推定する検定でした。
このとき、サンプルの平均を使っています。
実は、平均を使うというだけで、制約が生じます。
どのような制約でしょうか?
「データを足し合わせると、平均 × データ数 になる」という制約です。
つまり、サンプルデータに10個値がある場合、その合計は平均の10倍になります。
平均が2.5であれば、合計は25です。
合計が35と決まっているとき、最初の9個の値はどんな値もとりえます。
たとえば、-9, 1, 10, -33, 20, 40, 100, 9, 11
合計は、149です。
最後の1個の値は、帳尻合わせのために-124だけに決まります。
149-124=25
10個の値のうち、9個はどんな値もとりえる。これがこのサンプルの自由度です。
平均という1つの制約で、自由度がデータの個数から1つ減る。
だから1サンプルt検定での自由度は「n-1」・・・データ数-1
なんですね。
いかがでしたでしょうか。
自由度とは、データ数 ー 制約の数。
平均を使うというだけで「データを足し合わせると、平均 × データ数 になる」という
制約が生じる。
統計はつくづく、実践で使うのにも基本が重要となる学問です。
逆に言えば、基本を理解してしまえばこちらのもの。
製造業で使われる実践的な統計を身に付けたい方は、
弊社の統計トレーニングをご活用ください!
---
参考文献
足立堅一(平成13年)「実践統計学入門」篠原出版新社
Minitab社のブログ(2021)「統計における自由度とは何か? What Are Degrees of Freedom in Statistics?」https://blog.minitab.com/ja/statistics-and-quality-data-analysis/what-are-degrees-of-freedom-in-statistics
[2021/10/20, K. Nagai]