Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

『統計思考の世界:曼荼羅で読み解くデータ解析の基礎』アマゾン近刊予約開始

三中信宏

(2018年5月中旬刊行予定,技術評論社,東京,ca 240 pp., 本体価格2,300円, ISBN:9784774197531確定目次

アマゾンでの近刊予約が始まった.本書『統計思考の世界』の企画案が最初に技術評論社から提示されたのは2009年10月のことだった.その後,さまざまな延滞要因が重なってしまい,けっきょく刊行が9年後の今年になってしまった.本書は,昨年4月に出た:『思考の体系学:分類と系統から見たダイアグラム論』(2017年4月25日刊行,春秋社,東京, 6+316+23 pp., 本体価格2,500円, ISBN:9784393333556目次版元ページコンパニオン・サイト),ならびに今月中旬に出る:『系統体系学の世界:生物学の哲学とたどった道のり』(2018年4月20日刊行予定,勁草書房けいそうブックス],東京, 507 pp.[xii+430+lxv pp.], 本体価格2,700円, ISBN:9784326154517版元ページコンパニオン・サイト)とともにひとつの “単系統群” を形成する姉妹本である.これら3冊は内容的にそれぞれ統計学離散数学・生物体系学に特化しているが,どの本からも他の2冊が technical supplement として相互引用されている.いまようやく3冊が揃い踏みすることになるのはシアワセ至極だ.

「統計量が同一になるデータセットを生成する」

ACM SIGCHI Conference on Human Factors in Computing Systems 2017.

Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing.

https://www.autodeskresearch.com/publications/samestats

平均や分散(標準偏差)や相関係数などの統計量がまったく同じなのにデータセットの “形状” がまったく異なる事例は,かつて1973年に統計学者フランク・アンスコムが発表した有名な “アンスコムのカルテット” がある:Francis J. Anscombe (1973) Graphs in statistical analysis. The American Statistician, 27(1):17-21. (pdf).単に統計量を計算しただけでは,データセットの “かたち” のちがいを見落としてしまうという教訓はグラフィック統計学の重要性を示唆する.では,アンスコムの事例のように,統計量を変化させないという制約条件のもとで,異なる “形状” をもつデータセットをどのように生成すればいいのか.上の最新論文ではシミュレーテッド・アニーリングのアルゴリズムを用いてこの問題を解決した.上のサイトにはgif動画も公開されている.こういう “統計学” は楽しいな.

〈統計の落とし穴と蜘蛛の糸〉ウェブ再公開

 → https://www.yodosha.co.jp/smart-lab-life/statics_pitfalls/index.html

羊土社のオンライン雑誌〈実験科学online〉上で2014年2月号から2015年4月号まで掲載されたワタクシの連載記事〈統計の落とし穴と蜘蛛の糸〉は,すでに書籍化されている:三中信宏みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』(2015年6月5日第1刷刊行|2017年3月15日第2刷刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:9784758120586目次版元ページコンパニオン・サイト).このたび同社の新設サイト〈Smart Lab Life〉にて全コンテンツが順次公開されることになりました.

[追記]2018年2月2日までに全12回の連載記事がすべて公開されました.

「統計的有意性とP値に関するASA声明」

アメリ統計学会が2016年に出した「p値」に関する声明文:

ASA Statement on Statistical Significance and P-values

http://amstat.tandfonline.com/doi/pdf/10.1080/00031305.2016.1154108 [pdf]

が翻訳され,「統計的有意性とP値に関するASA声明」[佐藤俊哉訳]として日本計量生物学会ウェブサイトで公開されました:

日本計量生物学会

http://biometrics.gr.jp/


統計的有意性とP値に関するASA声明

http://biometrics.gr.jp/news/all/ASA.pdf [pdf]

統計分析に少しでも関心のあるみなさんに.

「統計概念の可視化いろいろ」

R-psychologist による統計概念の可視化いろいろ.

  1. Understanding and Interpreting Correlations - an Interactive Visualization」※相関係数の可視化.相関係数を変化させたときの共通分散をオイラー図で示す.
  2. Interpreting Cohen's d effect size - an interactive visualization」※効果量(Cohen's d)の可視化.d の大小による確率密度関数の被覆度や検定に必要なサンプルサイズの変化を示す.
  3. Understanding Statistical Power and Significance Testing - an interactive visualization」※統計的検定の検出力,type-I error, type-II error, サンプルサイズ,効果量(Cohen's d)の関係の可視化.
  4. Interpreting Confidence Intervals - an interactive visualization」※信頼区間の可視化.

いずれも統計基礎概念の教育ツールとして役立つだろう.