Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「本日の質問(4月21日)」

今日の講義では,先週の「統計学概論」の続きを話し,後半は「データの視覚化」という新しい話題に入りました.統計ソフトウェア〈R〉のデモが意外に時間がかかってしまいました.〈R〉を初めて体験する方がほとんどだと思いますが,フリーのツールを用いて,データの散布図行列や三次元表示がここまで描けてしまうことに驚かれたことでしょう.

質問されたことですが,〈R〉や〈R commander〉のインストール方法などについての情報は別途流しましょう.

今日の講義に関しては次のような質問がありました:

【質問】データが膨大になる場合は,視覚化すること自体が難しいと思われるが,どうなのでしょうか?

確かに,大量のデータをうまく視覚化するというのは,未解決問題を含む大きなテーマです.しかし,単一の変量に関して“たくさん”のデータがあるという状況でしたら,今日講義したようなベーシックなグラフ(散布図など)を用いれば,十分に直感的把握をすることができます.複数の変量に関する大量データについては通常は簡単に解析できません.多変量解析という研究分野があり,この講義でも最後の方で言及したいと思います.