Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

『Rによるデータサイエンス:データ解析の基礎から最新手法まで』

金明哲

(2007年10月25日刊行,森北出版,ISBN:9784627096011

「第I部」の約60ページは〈R〉への導入である.本書のセールス・ポイントはむしろ230ページもある「第II部」にあるといえる.本書の基本テーマであるデータ・マイニングに必要な各種の統計解析が説明されている.最初は主成分分析やクラスター分析など広く使われているものが多いが,後半になると樹木モデルやカーネル法あるいはアソシエーション分析という他の本ではほとんど見ない手法も出てくる.

著者サイト版元ページ.著者サイトでは,〈R〉のソースプログラムと正誤表が公開されている.また,版元ページでは,「まえがき」とともに「詳細目次」を見ることができる.

【目次】

まえがき i

第I部 Rとデータマイニングの基礎 1

 第1章:データマイニングとR 言語 2

 第2章:データの入出力と編集 16

 第3章:データの演算と固有値,基本統計量 33

 第4章:データの視覚化 43

第II部 Rによるデータ解析・データマイニング 65

 第1章:主成分分析 66

 第2章:因子分析 78

 第3章:対応分析 87

 第4章:多次元尺度法 97

 第5章:クラスター分析 107

 第6章:自己組織化マップ 127

 第7章:線形回帰分析 134

 第8章:非線形回帰分析 148

 第9章:線形判別分析 164

 第10章:非線形判別分析 173

 第11章:生存分析 183

 第12章:時系列 200

 第13章:樹木モデル 229

 第14章:ニューラルネットワーク 247

 第15章:カーネル法サポートベクターマシン 256

 第16章:集団学習 266

 第17章:アソシエーション分析 276


索引[関数とパッケージ] 294

索引[記号,英文,和文] 299