Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「パラメトリック・ブーツストラップの問題点」

パラメトリック・ブーツストラップに関して,次のような質問がありました:

パラメトリック・ブーツストラップにおけるモデル選択の妥当性はどうしたら評価できるのでしょうか.講義中のデモでは,母集団が正規分布の所からN=1000の標本をとり,そこから得た推定値を用いて正規分布をつくって,ブーツストラップをしていたので自然に思えました.しかし,もし母集団が正規分布でなかったら,データから得た推定値自体怪しい上に,正規分布による生成は母集団からずれてくる気がします.

確かに,講義で用いた事例では,母集団の確率分布が既知であると仮定してシミュレーションをしたわけですが,現実には母集団の分布は未知です.したがって,パラメトリック・ブーツストラップは,他の統計モデリングと同様に,たとえば正規分布というモデルを仮定した上で,シミュレーションを実行し,ある統計量の誤差分布を推定します.他のモデルとの比較については,前にお話したようなモデル選択論からの相互比較が必要になるわけですね.ですから,手順としては,まず妥当なモデルを選択し,その後にパラメトリック・ブーツストラップを行なうということになるでしょう.