Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

2008-01-01から1年間の記事一覧

「第1回レポートの締切」

先日出した第1回レポートの締切は本日です.すでに届いた分につきましては受領メールを返信しました.レポートを送信したのに私からの受領メールを受け取っていない場合は,不着事故の可能性が高いですので再送信してください.

「これからの講義予定」

しばらく更新が途絶えてしまい,申し訳ありませんでした.この講義も後半に入りましたので,これまでの総括と今後の講義予定をお知らせします.すでに終わった分については下記の通りです: 10 月9 日(木) ガイダンス/Rの紹介とデモ/データ視覚化 10 月…

「第1回レポートの出題と提出」

この講義では定期試験に代えて2回のレポートを出します.第1回目のレポートは12月11日(木)の講義時間に配布しましたが,あわせて私のサイト〈租界R〉でもpdfとして公開しています.レポート提出の要領は下記の通りです: ※レポートの提出方法と締切は下…

『Special Section on Microsoft Excel 2007』

計算統計学の専門誌 Computational Statistics & Data Analysis が Microsoft Excel 2007 を用いた統計計算の“実情”についての特集を組んでいます.所収論文の英文アブストラクトをざっと見るだけでも,Excelを使って統計計算することの問題点のありかは見え…

『Rデータ自由自在』

P・スペクター[石田基広・石田和枝訳] (2008年10月24日刊行, シュプリンガー・ジャパン, x+182 pp., 本体価格3,500円, ISBN:9784431100478 → 版元ページ) Rまわりのデータの扱いに特化した新刊で,RへのデータのインポートやRからのエクスポート…

「二週続きの休講」

すでに教務から掲示されているかと思いますが,来週(10月30日)はアルゼンチン出張のため,そしてその翌週(11月6日)は神戸での国際ワークショップのためそれぞれ休講します.11月13日(木)から講義再開ということになります.

「第3回講義のハンドアウト公開」

本日の第3回目の講義では,パラメトリック統計学に関連する確率分布,すなわち確率変数(変量)の確率密度関数とその期待値として計算される位置パラメーターと分散パラメーターについて講義しました.とくに,パラメトリック統計理論の中核ともいえる正規分…

「R version 2.8.0 のリリース」

予告されていたように,Rの最新バージョン「R-2.8.0」が10月20日に公開されました.実行ファイルとソースコードは下記の CRAN サイトからダウンロードできます: R version 2.8.0 http://cran.r-project.org/ ご参考まで. 追記)Mac OSX の実行ファイルは…

「科学哲学の参考書」

「科学哲学の適当な参考書はないでしょうか?」という質問がありました.私が第2回の講義で説明した推論様式としての“アブダクション”については,拙著『系統樹思考の世界』(→紹介ページ,ISBN:4061498495)の第1章をごらんください(宣伝宣伝). もっと…

「生物統計学の日本語参考書」

すでに何人かの受講者から,「統計学の参考書は?」という質問を受けています.また,講義の内容に関して「もっと“数理的”な話をしてほしい」という要望も届いています(もちろん「数式イヤ」というもっと声量の大きな反応も聞こえています).私が教壇に立…

「第2回講義のハンドアウト公開」

第2回目の講義では,統計学概論と銘打って,統計的な「ものの見方」について,統計学を取り巻く科学哲学・科学史を含む広範な文脈とともに解説しました.とくに,素朴統計学的な認知心理は,ユーザーとして統計ツールを実際に操作する際に,われわれが無意識…

「これからの講義日程」

第二回目以降の講義内容の大まかな予定は下記の通りです: 10 月9 日(木) ガイダンス/統計学概論(統計学的思考) 10 月16 日(木) 統計学概論(続)/分散概念の段階的導出 10 月23 日(木) 統計言語〈R〉紹介/確率分布のグラフ/データの散布図 10 …

「〈R〉への道」

〈R〉に関心のある受講生は,下記のようなサイトを参考にして,ダウンロード&インストールをしてみて下さい.まずはじめに,〈R〉はフリーのソフトウェアですので,自分のコンピュータ環境(Windows, MacOS, Linux)に合わせて,ダウンロードしインストー…

「なぜ〈R〉か?」

今回の講義では,スライドによるプレゼンとともに,フリーウェアの統計言語〈R〉とそのGUIを与える〈Rコマンダー〉を用いた計算デモンストレーションを併用して,できるだけ「計算してみる統計学」を実践したいと思います.受講生のみなさんも,もし自分の…

「初日の講義とハンドアウト公開」

第1回目の講義では,全体の流れを説明した上で,データを「見る」こと(いきなり「計算」するのではなく)の大切さについて,いくつかのデータを示しながら話しました.次回の講義では,そのあたりの直感的な統計センスに軸足を置きながら,統計学概論に入る…

「明日はガイダンスなど」

明日10月9日(木)は初回の講義ですが,これからの講義日程とガイダンス(成績評価のしかた)などについて話をします.きっと時間があまるはずですので,その後は引き続き「統計学概論」になだれこむでしょう. スライドを使ったプレゼンテーションが主体に…

「開講にあたって」

今月10月9日(木)から、東京大学教養学部第四学期の専門科目(理学部)の一つとして「生物統計学」を開講します(科目番号「40002」,毎週木曜第五限,16:20~17:50,521教室)。このブログは、本講義に関わる連絡のために開設しました。講義に関連する質問…

「次回(7月7日)の講義は多変量解析」

前回は二変量に関する共分散と相関係数について話しましたが,次回はその延長上にある「多変量解析」について講義します.多くの変量の挙動を同時に“見る”ことはふつうはできません.ここでも「データの視覚化」をどのようにうまく実行するかがポイントにな…

「学生による授業評価(依頼)」

次の講義のときにもアナウンスしますが,いまの期間(6月12日~7月23日)は「学生による授業評価」が実施されています.すでにご存知の方も多いと思いますが,各受講生による授業評価の方法について確認します: 携帯電話から〈東京農大モバイル授業評価〉ロ…

「質問への回答」

これまで講義ごとに質問票を回収してきましたが,いくつかについてはこのブログで回答しました.それぞれの講義日ごとにまとめましたので,下記の一覧からたどってください: 質問回答

「次回(6月30日)の講義は共分散と相関係数」

6月30日の講義は「共分散(covariance)」と「相関係数(correlation coefficient)」の話をします. これまでの講義は,単一の確率変数(変量)に関する統計学でした.しかし,現実には二つ以上の変量の挙動を同時に分析する必要があります.次回の講義では…

「本日の質問(6月23日)」

今日は,統計モデリングの一般論について解説しました.モデル選択の原理について話をした上で,これまでの線形モデル(LM)を出発点として,一般化線形モデル(GLM),さらには一般化加法モデル(GAM)への拡張,さらには混合効果モデルを組み込ん…

「7月14日(月)は休講;7月17日(木)に補講」

本日の講義の冒頭で連絡しましたが: 【休講】7月14日(月) ※理由:東大農学部学生の見学旅行に同行するため その補講日と時間帯・教室は下記の通り確定しました: 【補講】7月17日(木),14:40~16:10,212教室(112の真上) 以上.

「6月23日の講義内容」

これまで数回にわたって,実験計画法にともなう分散分析と多重比較というテーマで講義をしてきました.その背景には「線形モデル」というパラメトリック統計学の重要ポイントがあります.明日23日の講義では,統計モデルに焦点を当て,すでに具体的に説明し…

「これまでのハンドアウト公開」

更新がすっかり滞ってしまいました.これから改心します. リクエストがありましたので,これまで講義で配布したハンドアウトをpdfで公開しました.私の統計学ページ: 租界Rの門前にて http://cse.niaes.affrc.go.jp/minaka/R/R-top.html の下の方に,講義…

「本日の質問(6月16日)」

今日の講義では,処理平均の差に関する多重比較の原理とさまざまな補正法について説明しました. 質問です: 【質問】帰無仮説や対立仮説や検定統計量の意味が結局わかりません. データをとる目的は対象に関するある性質を推論することにあります.ある実験…

「本日の質問(6月9日)」

今日は実験計画に関わる線形モデルと分散分析に関する最後の講義でした.分割区法(split-plot)と細分区法(strip-plot)について解説しました.実験計画法の中でもレイアウトが複雑な手法だったので,何をどのように無作為化したのかがわかりづらかったか…

「本日の質問(6月2日)」

今日は,乱塊法の分散分析を1要因と2要因について説明した.数値計算については,R Commander のデモを併用しました.複数の要因間の交互作用についてはわかってもらえたでしょうか. 【質問】交互作用と誤差をどう分けるのか,聞いていたのだがいまひとつ…

「本日の質問(5月26日)」

前回に続いて,今回は完全無作為化法による実験計画について説明しました.実験区レイアウトに沿って線形統計モデルを立て,データのばらつきを要因効果と誤差効果に分割します.要因効果の有無は分散分析によって検定します.次に乱塊法について説明し,ブ…

「本日の質問(5月19日)」

今回の講義では,まずはじめに正規分布とそれから派生する確率分布の解説をしました.確率密度関数の数式を見せつつ,「これを見てはいけない」というのはムリがあったかもしれません.後半は実験計画法の概論です.反復実験と無作為化の意味について話をし…