これから統計分析を取り入れたい製造業のお客様から、「不良数は記録しているが、どのような分析ができるか」といったご質問をよくいただきます。
良/不良といった2択に関するデータを二項データといいます。
前回はデータの種類と、種類よって分析方法が異なることについてご紹介しました。
今回はさらに踏み込んで"二項データ"の分析例を紹介します。
例題
ある技術者が、溶接工程における不良の多さについて統計的に調べたいと考えています。
技術者は、11日間にわたり80個部品を収集して、不良の数を記録しました。
この工程について歩留まり改善のための活動を行いたいのですが、どこから手をつけたらよいかわからないため、統計的に有意に不良数が多い日(不良率が高い日)について、設備や人員の状況を確認する方針です。
統計的に有意に不良率が高い日があるか、調べていきます。
分析手順
1. それぞれの日について、不良率 = 不良数/80 を計算します。
2. 不良率について、11日間の平均を計算します。
ここまで、11日間の平均不良率が計算できました。
3. 不良率はどれくらいばらついているのか、標準偏差を推定します。
今回の不良率のような比率は正規分布に近づくのですが、その標準偏差は、
√ 比率 ×(1 - 比率) / n
今回の場合は
√ 不良率 × (1 - 不良率) / n
具体的な数値を代入して、
√ 0.075 × (1 -0.075) / 80 = 0.029
4. 統計的に不良率が高いとみなせる基準を求めます。
統計的に意味がある水準=有意水準は0.05とします。
基準値の計算には、手順2で計算した平均不良率、手順3で計算した標準偏差と、標準正規分布を使います。
基準値の詳しい計算式はこちら:平均の分析における二項データの方法と計算式
5. 平均不良率を中心、基準線を上下に赤で示します。11日分、不良率をプロットします。
グラフから、4日目は統計的に有意に不良率が高いことがわかりました。この結果をもとに、4日目の設備や人員の状況から、原因を探り、改善に活かすことができます。
統計ソフトMinitabを使うと、手順1-4の途中計算はソフトウェアが行い、瞬時に5のグラフが表示されます。
誰にでも使える強力な統計解析ソフトウェア Minitab:詳細を見る
サンプルデータはこちら:Minitabヘルプ 二項データの平均の分析の例
Comments