Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「第4回の講義」

今回の講義では,データのもつ「ばらつき(変動)」をどのように数値化するかというテーマを取り上げます.さまざまな実験や観察をするとき,測定されたデータは実験処理の効果あるいは偶然的な原因によりさまざまなばらつきかたをします.統計処理のポイントは,このような「ばらつき」の背後にどんなパターンがあるのかを発見し,それをうまく説明できるモデルを立てて説明することです.

そのためには,あらかじめデータの「ばらつき」を定量化する手順が必要になります.今回は,それぞれのデータと総平均との「偏差」を出発点として,「平方和」から「分散」にいたる道筋をできるだけ直感的に説明して,データのもつ「ばらつき」がどのように「数値」によって表現できるのかを講義します.

ふたつ目のポイントは「確率変数」と「確率分布」です.データの「ばらつき」を数式として表現することにより,パラメトリック統計学の理論体系が構築されてきました.今日の講義では「正規分布」を取り上げて,その分布の形を決めるパラメーター(μとσ)についてRコマンダーのデモを交えて解説します.