Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「統計量が同一になるデータセットを生成する」

ACM SIGCHI Conference on Human Factors in Computing Systems 2017.

Same Stats, Different Graphs: Generating Datasets with Varied Appearance and Identical Statistics through Simulated Annealing.

https://www.autodeskresearch.com/publications/samestats

平均や分散(標準偏差)や相関係数などの統計量がまったく同じなのにデータセットの “形状” がまったく異なる事例は,かつて1973年に統計学者フランク・アンスコムが発表した有名な “アンスコムのカルテット” がある:Francis J. Anscombe (1973) Graphs in statistical analysis. The American Statistician, 27(1):17-21. (pdf).単に統計量を計算しただけでは,データセットの “かたち” のちがいを見落としてしまうという教訓はグラフィック統計学の重要性を示唆する.では,アンスコムの事例のように,統計量を変化させないという制約条件のもとで,異なる “形状” をもつデータセットをどのように生成すればいいのか.上の最新論文ではシミュレーテッド・アニーリングのアルゴリズムを用いてこの問題を解決した.上のサイトにはgif動画も公開されている.こういう “統計学” は楽しいな.

〈統計の落とし穴と蜘蛛の糸〉ウェブ再公開

 → https://www.yodosha.co.jp/smart-lab-life/statics_pitfalls/index.html

羊土社のオンライン雑誌〈実験科学online〉上で2014年2月号から2015年4月号まで掲載されたワタクシの連載記事〈統計の落とし穴と蜘蛛の糸〉は,すでに書籍化されている:三中信宏みなか先生といっしょに 統計学の王国を歩いてみよう:情報の海と推論の山を越える翼をアナタに!』(2015年6月5日第1刷刊行|2017年3月15日第2刷刊行,羊土社,東京,191 pp., 本体価格2,300円, ISBN:9784758120586目次版元ページコンパニオン・サイト).このたび同社の新設サイト〈Smart Lab Life〉にて全コンテンツが順次公開されることになりました.

[追記]2018年2月2日までに全12回の連載記事がすべて公開されました.

「統計的有意性とP値に関するASA声明」

アメリ統計学会が2016年に出した「p値」に関する声明文:

ASA Statement on Statistical Significance and P-values

http://amstat.tandfonline.com/doi/pdf/10.1080/00031305.2016.1154108 [pdf]

が翻訳され,「統計的有意性とP値に関するASA声明」[佐藤俊哉訳]として日本計量生物学会ウェブサイトで公開されました:

日本計量生物学会

http://biometrics.gr.jp/


統計的有意性とP値に関するASA声明

http://biometrics.gr.jp/news/all/ASA.pdf [pdf]

統計分析に少しでも関心のあるみなさんに.

「統計概念の可視化いろいろ」

R-psychologist による統計概念の可視化いろいろ.

  1. Understanding and Interpreting Correlations - an Interactive Visualization」※相関係数の可視化.相関係数を変化させたときの共通分散をオイラー図で示す.
  2. Interpreting Cohen's d effect size - an interactive visualization」※効果量(Cohen's d)の可視化.d の大小による確率密度関数の被覆度や検定に必要なサンプルサイズの変化を示す.
  3. Understanding Statistical Power and Significance Testing - an interactive visualization」※統計的検定の検出力,type-I error, type-II error, サンプルサイズ,効果量(Cohen's d)の関係の可視化.
  4. Interpreting Confidence Intervals - an interactive visualization」※信頼区間の可視化.

いずれも統計基礎概念の教育ツールとして役立つだろう.

〈統計学へのお誘い本リスト(19-November-2016版)〉

  1. 門前でまだ迷っている人のための誘惑本

  2. 入門する気になった人のための本

  3. ヴィジュアル系統計学入門書

  4. Rを片手に統計修行とプログラミング勤行

  5. すでに入門してしまった人のための次なる本(線形モデルを中心に)

  6. ややイノチ懸け系な数理統計学

  7. たまにはベイズもいかが?

  8. 統計学科学史と科学哲学,そしてこれから

  9. なお余力がある人は統計科学の最前線へどうぞ!

    • 甘利俊一・竹内 啓・竹村彰通・伊庭幸人(編)〈シリーズ・統計科学のフロンティア[全12巻]〉(2002年~2005年[完結],岩波書店版元ページ
    • 甘利俊一,麻生英樹,伊庭幸人(編)〈シリーズ・確率と情報の科学[第I期・全15巻]〉(2008年~[刊行中],岩波書店版元ページ
    • 岩波データサイエンス刊行委員会(編)『岩波データサイエンス (第I期・全6巻)』(2015年10月刊行開始,岩波書店,東京 → 版元ページ

  旧リスト → Version 13-February-2016

         Version 21-May-2015

         Version 27-April-2015

         Version 24-April-2014

         Version 26-February-2014

         Version 7-January-2014

         Version 12-November-2013

         Version 7-October-2013

         Version 24-October-2012

         Version 21-June-2012

         Version 6-September-2011

         Version 8-October-2010

         Version 26-April-2010

         Version 17-October-2008