因子が1つの場合の分散分析。
例
xi1 | xi2 | xi3 | 計 Ti⋅ | 平均ˉxi⋅ | |
A1 | 20 | 22 | 21 | 63 | 21.0 |
A2 | 24 | 28 | 26 | 78 | 26.0 |
A3 | 22 | 24 | 26 | 72 | 24.0 |
A4 | 20 | 17 | 20 | 57 | 19.0 |
総合計T=270 | 全平均ˉˉx=22.5 |
このデータの構造は、“肥料の違い” と “それ以外の誤差” に分けられる。
xij−ˉˉx=(ˉxi⋅−ˉˉx)+(xij−ˉxi⋅)
ばらつきの分解は、平方和をとることで行う。
a∑i=1r∑j=1(xij−ˉˉx)2=a∑i=1r∑j=1{(ˉxi⋅−ˉˉx)+(xij−ˉxi⋅)}2=∑∑(ˉxi⋅−ˉˉx)2+∑∑(xij−ˉxi⋅)2+2∑∑(ˉxi⋅−ˉˉx)(xij−ˉxi⋅)
水準の違いによる分散が、誤差の分散に比べてあまりにも小さければ、水準を変えても効果無いんじゃないの、という評価になる。2つの分散の比を取って、F検定を行う。分散分析では、分散のことを平均平方とも呼ぶ。
母平均μ、各水準内での平均と全平均との差αi、誤差項ϵijを使って次のようにかける。
xij=μ+αi+ϵij ただし∑αi=0, ϵ∼N(0,σ2)
平方和は、上の式より少しだけ楽に(?)計算する方法がある。
ここで、R:F0≥F(ϕA,ϕE;α)であれば、帰無仮説は棄却され、水準間の平均に有意な差があると言える。