Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「リサンプリング手法の使い分け」

計算統計学の手法の使い分けについての質問がありました:

ブーツストラップとジャックナイフ(とモンテ・カルロ)のどれを用いるべきか,何か判断基準となるものはあるのでしょうか?

モンテカルロが一番役立ちそうだか,もっとも間違いそうな感じがする.ノンパラのブーツストラップ?

講義で説明したモンテ・カルロ(=パラメトリック・ブーツストラップ)は,データから推定されたパラメータ値をもつパラメトリック・モデルから擬似データを繰り返し生成する.この点で,そのようなモデルを前提としない[ノンパラメトリック]ブーツストラップやジャックナイフとは根本的なちがいがあります.

一方,ブーツストラップとジャックナイフの使い分けについては,一般的には統計量のばらつきはブーツストラップの方が大きいとされていて,リサンプリング法として優れているという見られています.ただし,1サンプルを除去する「delete-one jackknife」は挙動が異常な外れ値の検出に使えるので,ブーツストラップとは異なる使い道はあるようです.

系統樹の推定に関していえば,1980年代に最初にブーツストラップが樹形の誤差評価(再現性)に導入されて以来,形質データからのノンパラメトリック・ブーツストラップが独占的に用いられてきました.あるいは,個々の形質について抽出確率を設定する最節約ジャックナイフ法も樹形誤差評価に用いられています.

近年では,データから推定された分子進化パラメータと系統樹の樹形のもとで,形質をモンテカルロ的にシミュレートするパラメトリック・ブーツストラップも用いられるようになってきました.これは,次回説明する予定の,モデル選択における尤度比検定を実行するための有力な方法です.