目次

分散分析

一元配置分散分析

因子が1つの場合の分散分析。

  • 4種類の肥料があり、ある植物にどれが最も合うか知りたい
  • 同程度の生育度合いの植物を12株用意し、3株ずつ4グループに分け肥料$A_1$~$A_4$を与え、3ヶ月後の成長(mm)を見る
$x_{i1}$$x_{i2}$$x_{i3}$計 $T_{i\cdot}$ 平均$\bar{x}_{i\cdot}$
A12022216321.0
A22428267826.0
A32224267224.0
A42017205719.0
総合計$T=270$全平均$\bar{\bar{x}}=22.5$

このデータの構造は、“肥料の違い” と “それ以外の誤差” に分けられる。

$$x_{ij}-\bar{\bar{x}}=(\bar{x}_{i\cdot}-\bar{\bar{x}})+(x_{ij}-\bar{x}_{i\cdot})$$

ばらつきの分解は、平方和をとることで行う。

\begin{eqnarray} \sum^{a}_{i=1}\sum^{r}_{j=1}(x_{ij}-\bar{\bar{x}})^2 &=& \sum^{a}_{i=1}\sum^{r}_{j=1}\{(\bar{x}_{i\cdot}-\bar{\bar{x}})+(x_{ij}-\bar{x}_{i\cdot})\}^2 \\ &=& \sum\sum(\bar{x}_{i\cdot}-\bar{\bar{x}})^2 + \sum\sum(x_{ij}-\bar{x}_{i\cdot})^2 + 2\sum\sum(\bar{x}_{i\cdot}-\bar{\bar{x}})(x_{ij}-\bar{x}_{i\cdot}) \end{eqnarray}

結果の検定

水準の違いによる分散が、誤差の分散に比べてあまりにも小さければ、水準を変えても効果無いんじゃないの、という評価になる。2つの分散の比を取って、F検定を行う。分散分析では、分散のことを平均平方とも呼ぶ。

データの構造式

母平均$\mu$、各水準内での平均と全平均との差$\alpha_i$、誤差項$\epsilon_{ij}$を使って次のようにかける。

$x_{ij}=\mu+\alpha_i+\epsilon_{ij}~~~~$ただし$\sum\alpha_i=0,~~~~\epsilon\sim N(0,\sigma^2)$

帰無仮説

検定統計量の計算

平方和は、上の式より少しだけ楽に(?)計算する方法がある。

ここで、$R:F_0 \ge F(\phi_A, \phi_E; \alpha)$であれば、帰無仮説は棄却され、水準間の平均に有意な差があると言える。

分散分析後の推定