Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「統計的検定の考え方」

これは問題です:

  1. F値が何なのかよくわかりませんでした.
  2. 棄却域の話がよくわかりませんでした.

統計的検定の根幹は,データからある差異や比が計算されたとき,その値が「意味がある(有意である)かどうか」を調べるという点にあります.まずはじめに,データから「検定統計量」を計算します.たとえば分散分析だと処理と誤差の分散比であるF値が検定統計量であり,処理平均の差に関する検定であれば処理平均差が検定統計量となります.問題はこれら実際に求められた検定統計量の値が,帰無仮説のもとでどの程度の確率で生じるかという点です.もしも「差がない(=比が1)」という帰無仮説のもとでもその程度の値ならば大きな確率で生じるといえるとき,帰無仮説は棄却できません.ところが帰無仮説のもとではありえないような検定統計量が得られたならば,帰無仮説を捨てて対立仮説を選ぶということになります.そのときの第一種過誤を犯す領域が棄却域ということになります.帰無仮説のもとでの検定統計量の分布(すなわち帰無分布)は,パラメトリック統計学であればF分布やt分布で与えられますが,来月話をする予定の計算機統計学の手法(ブーツストラップやジャックナイフ)を使えばデータからのリサンプリングによって経験的に帰無分布を構築するという方法もあります.