因子が1つの場合の分散分析。
例
$x_{i1}$ | $x_{i2}$ | $x_{i3}$ | 計 $T_{i\cdot}$ | 平均$\bar{x}_{i\cdot}$ | |
A1 | 20 | 22 | 21 | 63 | 21.0 |
A2 | 24 | 28 | 26 | 78 | 26.0 |
A3 | 22 | 24 | 26 | 72 | 24.0 |
A4 | 20 | 17 | 20 | 57 | 19.0 |
総合計$T=270$ | 全平均$\bar{\bar{x}}=22.5$ |
このデータの構造は、“肥料の違い” と “それ以外の誤差” に分けられる。
$$x_{ij}-\bar{\bar{x}}=(\bar{x}_{i\cdot}-\bar{\bar{x}})+(x_{ij}-\bar{x}_{i\cdot})$$
ばらつきの分解は、平方和をとることで行う。
\begin{eqnarray} \sum^{a}_{i=1}\sum^{r}_{j=1}(x_{ij}-\bar{\bar{x}})^2 &=& \sum^{a}_{i=1}\sum^{r}_{j=1}\{(\bar{x}_{i\cdot}-\bar{\bar{x}})+(x_{ij}-\bar{x}_{i\cdot})\}^2 \\ &=& \sum\sum(\bar{x}_{i\cdot}-\bar{\bar{x}})^2 + \sum\sum(x_{ij}-\bar{x}_{i\cdot})^2 + 2\sum\sum(\bar{x}_{i\cdot}-\bar{\bar{x}})(x_{ij}-\bar{x}_{i\cdot}) \end{eqnarray}
水準の違いによる分散が、誤差の分散に比べてあまりにも小さければ、水準を変えても効果無いんじゃないの、という評価になる。2つの分散の比を取って、F検定を行う。分散分析では、分散のことを平均平方とも呼ぶ。
母平均$\mu$、各水準内での平均と全平均との差$\alpha_i$、誤差項$\epsilon_{ij}$を使って次のようにかける。
$x_{ij}=\mu+\alpha_i+\epsilon_{ij}~~~~$ただし$\sum\alpha_i=0,~~~~\epsilon\sim N(0,\sigma^2)$
平方和は、上の式より少しだけ楽に(?)計算する方法がある。
ここで、$R:F_0 \ge F(\phi_A, \phi_E; \alpha)$であれば、帰無仮説は棄却され、水準間の平均に有意な差があると言える。