Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「ネイマン-ピアソン結界関連(備忘メモ)」

依頼原稿を締め切り間際にやっと書き上げた『心理学評論』第59巻第2号特集〈心理学の再現可能性〉はゴールデンウィーク明けにも早期公開が予定されている.この原稿執筆の過程で,今から5年も前の日録に「ネイマン-ピアソン(Neyman-Pearson)結界」関連の情報を束ねていたことがわかった.書いた本人がすっかり忘れても日録には永遠?に残るのだ.備忘のため下記に再録する.まずは2011年11月5日(土)日録から:

[蒐書日誌]ネイマン-ピアソン結界の暗黒を覗き込む車中 —— 本日の車内修行本: E. L. Lehmann『Testing Statistical Hypotheses』 (1959年刊行,John Wiley & Sons[Wiley Publications in Statistics], New York, xiv+349 pp.).この叢書はことのほかフォントが細かくて,新幹線の振動に乗って微細な添字が睡魔を呼び込みやすい.新幹線車中で「ごりごりの数理統計学本」を読んではならない.しかし,いったん「結界」に入ってしまったからには,もう逃げ出すことはできない…….まずは,ネイマン-ピアソン結界を守護している大論文の数々を列挙してみる:

  • Jerzy Neyman and Egon S. Pearson 1928a. On the Use and Interpretation of Certain Test Criteria for Purposes of Statistical Inference. Part I. Biometrika, 20A: 175-240 → Jstor
  • Jerzy Neyman and Egon S. Pearson 1928b. On the Use and Interpretation of Certain Test Criteria for Purposes of Statistical Inference. Part II. Biometrika, 20A: 263-94 → Jstor
  • Jerzy Neyman and Egon S. Pearson 1933a. On the Problem of the Most Efficient Test of Statistical Hypotheses. Philosophical Transactions of the the Royal Statistical Society, Series A, 231: 289-337 → Jstor | pdf
  • Jerzy Neyman and Egon S. Pearson 1933b. The Testing of Statistical Hypotheses in Relation to Probabilities a priori. Proceedings of the Cambridge Philosophical Society, 24: 492-510 → abstract
  • Jerzy Neyman and Egon S. Pearson 1936a. Contributions to the Theory of Testing Statistical Hypotheses. Statistical Research Memorandum, 1: 1-37
  • Jerzy Neyman and Egon S. Pearson 1936b. Sufficient Statistics and Uniformly Most Powerful Tests of Statistical Hypotheses. Statistical Research Memorandum, 1: 113-37

これじゃあ,ネイマン-ピアソン結界に入り込んだ初心者が一瞬にして「石」になってしまうのもムリはない.Lehmann 本はまるごと一冊,意思決定理論(decision theory)としてのネイマン-ピアソン結界の解説に当てている.そう,冒頭の第1章のタイトル「The General Decision Problem」が象徴しているように,ネイマン-ピアソン結界は「統計学は意思決定のための理論である」という前提のもとに築かれている.

The need for statistical analysis stems from the fact that the distribution of X, and hence some aspect of the situation underlying the mathematical model, is not known. The consequence of such a lack of knowledge is uncertainty as to the best mode of behavior. To formalize this, suppose that a choice has to be made between a number of alternative actions. The observations, by providing information about the distribution from which they came, also provide guidance as to the best decision. The problem is to determine a rule which, for each set of values of the observations, specifies what decision should be taken. (p. 1: 下線みなか)

「最良の行動」あるいは「最善の決定」をするための手段が統計学であるとしつこいほど強調されている.興味深い点は,統計的な推論と意思決定が対置された上で,統計的推論を意思決定に取り込んでしまうという姿勢が明言されていることだ:

All the problems considered so far could be termed action problems. It was assumed in all of them that if θ were known a unique correct decision would be available, that is, given any θ there exists a unique d for which L(θ,d)=0 [=loss]. However, not all statistical problems are so clear-cut. Frequently it is a question of providing a convenient summary of the data or indicating what information is available concerning the unknown parameter or distribution. This information will be used for guidance in various considerations but will not provide the sole basis for any specific decisions. In such cases the emphasis is on the inference rather than on the decision aspect of the problem, although formally it can still be considered a decision problem if the inferential statement itself is interpreted as the decision to be taken. (pp. 4-5: 下線みなか)

つまり,「意思決定」すなわち仮説検定に直結しない統計的な「推論」はあり得るだろうが,それもまた意思決定だとみなせばいいというかなり強圧的な見解である.通常の帰無仮説 vs. 対立仮説の二者択一的な「仮説検定(hypothesis testing)」を基本的な決定問題とするとき,その延長線上には複数の対立仮説を含む「多重決定(multiple-decision procedures)」の問題があり,さらにそのスペクトラムの果てにパラメーターの点推定(point estimation)という決定問題が位置すると著者はみなす(pp. 3-4).要するにすべては意思決定という枠組みの中で捉えられる.点推定ではない信頼集合(confidence set)の概念もまた本書では決定理論の中で展開されることになる.

—— パラメトリック統計学のこの天守閣をときどき見に行くと,新たな発見とともに彼我のギャップの大きさにくらくらすることがある.

続いて,翌日の2011年11月6日(日)日録へ:

[欹耳袋]昨日に続き,仮説検定に関連する総説論考をふたつメモクリップしておく:

  • Jeff Gill 1999. The Insignificance of Null Hypothesis Significance Testing. Political Research Quarterly, 52(3): 647-674 → Jstor | pdf
  • Douglas H. Johnson 1999 The Insignificance of Statistical Significance Testing. The Journal of Wildlife Management, 63(3): 763-772 → Jstor | html | pdf

このふたつは,政治学と野生生物管理というまったく畑違いのジャーナルであるにもかかわらず,論文タイトルが酷似している.しかも同年の出版だから,みごとな「収斂」と言うしかない~.Johnson の総説はいたるところで引用されまくりだから有名だが,Gill の論考は古典的な「仮説検定」の世界観を知る上で便利だった.

さらに Togetter -「君が出した有意差に意味はあるのか」という5年前のツイート束まで発掘してしまった.芋づる式とはこういうときのためにある表現だ.なお,統計学者 Eric L. Lehman については次の記事も参照のこと:leeswijzer「『Testing Statistical Hypotheses』の改訂版と姉妹本」(2011年11月9日).

―― 1930年代から80年も経過した現代の統計ユーザーが,いまなお無意識のうちに〈ネイマン-ピアソン結界〉の中で操られているという意味で.『犬神家の一族』の犬神弥兵衛による “死後遠隔操作” を思い出してしまった.