Loading [MathJax]/jax/output/CommonHTML/jax.js

目次

統計

勉強中ゆえに用語とか認識とかかなりいい加減なので信用しない。

頻度主義とベイズ主義

頻度主義

ベイズ主義

ベイズは追々やるとして、まず古典的な頻度主義から。

期待値と分散

母集団と標本の平均と分散

正規分布

f(x)=12πσexp{(xμ)22σ2}

標準正規分布

f(x)=12πexp(x22)

平均、分散はデータスケールによって変化するため、異なる分布を比べやすくするために標準化を行う。標準正規分布は、μ=0,σ2=1となる。

正規分布の線形性を利用して、xN(μ,σ2)のとき、u=xμσとすると、uN(0,12)に変換できる。

正規分布は確率密度分布なので、「xがa以上b以下となる確率は?」を調べるには、Pr{axb}=baf(x)dx、(f(x)は標準正規分布関数)を解く必要があるが、そんな計算毎回はやってられない。標準化してデータベース化しておけば、変換して参照するだけで十分な精度を持った近似値が得られる。(標準正規分布表)

  • 例:xN(18,22)である時、20以上となる確率
    • u=xμσ=20182=1より、Pr(x20)=Pr(u1)
    • 数値表から、Pr(u1)0.1587より、およそ15.87%
  • 例:xN(50,102)である時、上位5%の境界はどれほどの値か
    • 数値表から、Pr(uk)=0.05となるkの値は、1.645
    • u=a5010=1.645となるので、a=66.45

基本定理

大数の法則

ゆるい証明

  • nの時、E(¯x)μ,V(¯x)0を示す
  • xiが互いに独立より、期待値の加法性、分散の加法性が使える
  • E(¯x)=E(1nxi)=1nE(xi)=1nμ=nμn=μ
  • V(¯x)=V(1nxi)=1n2V(xi)=1n2σ2=nσ2n2=σ2n
    • ここで、nより、σ2n0
  • 分散が0なら期待値を点として扱ってしまっていいのか、という話になると、チェビシェフの不等式を使用した厳密な証明になる

中心極限定理

統計量の分布

標本平均

xN(μ,σ2)の場合、¯xN(μ,σ2n)に従う。

データ数を増やすほど分散が0に近づく、つまり、標本平均が母平均から大きく外れる確率が低くなる。

これを標準化した場合、u=¯xμσ2/nN(0,12)となる。

不偏分散