推定
検定が「同じか同じでないか」など、二者択一的な問題に答えを出す手法だったのに対し、推定はサンプルから得られたデータから、母集団の各パラメータ(母数)がどのような値になっているかを具体的に数値で求める手法である。
- 母数
- 母平均、母分散、など求める対象としている母集団のパラメータ。基本的に神のみぞ知る。
- 推定量
- サンプルから推定されるべき母数の値
- 推定値
- 具体的な数値で算出された推定量の値
- 点推定
- の値を、1つの値で求める
- 区間推定
- の値は95%の確率で0.15から0.18の間にありますよ、というように区間で求める
- 正しく推定値が区間内にある確率を信頼率という。で表す。上の「95%の確率で~」なら、
- 区間を信頼区間、上限と下限をそれぞれ信頼上限、信頼加減という
点推定
最小分散不偏推定量を用いる。
不偏推定量
全てのに対して、となるを不偏推定量という。
不偏推定量は1つの母数に対して複数存在するが、その中で分散が最小となるものを不偏分散推定量という。
なんか意味がいまいち取れないのだが、要は「サンプルいっぱい集めたら偏りは減るよね! 基本的にはサンプルの平均や分散を、そのまま母平均や母分散として推定するんだけど、できるだけいっぱいサンプル採って算出しようね!」くらいの意味だろう、たぶん。(絶対違う)
区間推定
信頼率、サンプルデータは互いに独立にに従うとした場合、
| 正規化 | |
| 正規化を元に戻す | |
| について整理 |
より、はの区間にの確率で含まれていると導き出せる。
ここでとは、検定のページで解説したと同じく、「標準正規分布で以上の値を取る確率がとなるような値」で、である。ただし文脈によっては取る確率をのままで計算してたりすることもあるので、注意。

