Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「生物統計学質問集(11月14日)」

  • #TodaiStat 先週の乱塊法の講義に関する質問への回答です. posted at 06:41:46
  • #TodaiStat 【質問】「乱塊法を使わねばならない状況がよくわかりません」/【回答】完全無作為化法は何も事前情報がないときに背景撹乱要因の影響を偶然誤差として解釈します.一方,乱塊法は事前情報に基いてブロックを設定し,偶然誤差とは別に,ブロック効果をモデルに組み込みます. posted at 06:46:10
  • #TokeiStat 【回答】(承前)したがって,乱塊法が使える状況では,完全無作為化法よりも偶然誤差がより小さくなるので,分析の精度がより高くなります. posted at 06:47:42
  • #TodaiStat 【質問】「無作為化する意味がイマイチわかりません」/【回答】実験結果に影響を与えそうな要因があるとき,データへの体系的な介入があると “交絡” のような致命的バイアスがありえます.それを回避する方法が無作為化です. posted at 06:50:16
  • #TodaiStat 【質問】「乱塊法の実例で,平方和の分割と “並行的” に自由度が分割されるという説明がわかりません」/【回答】完全無作為化法の説明では,偏差・平方和・自由度が要因ごとに分割される過程を説明しましたが,それと同様のことが乱塊法でも成り立つということです. posted at 06:52:59
  • #TodaiStat 【質問】「二要因乱塊法における主効果と交互作用効果はデータからどのように計算するのですか?」/【回答】要因数が増えても,乱塊法はつねにデータのばらつきを処理効果+ブロック効果+誤差効果で説明します.多要因の場合は,処理効果を主効果と交互作用効果に細分します. posted at 06:58:52
  • #TodaiStat 【回答】(承前)主効果と交互作用効果への細分については,まず主効果ごとに平方和をそれぞれ切り取り,交互作用効果は処理効果全体から主効果の総和を引いた残差として求めます. posted at 07:00:29
  • #TodaiStat 【質問】「講義では反復をブロックとして分けましたが,それ以外のブロックの作り方もありますか?」/【回答】乱塊法には,分割区法(split-plot)とかネスト法(nested ANOVA)のようなさまざまな応用バージョンがあります. posted at 07:04:31
  • #TodaiStat 【質問】「背景要因の作用方向が二次元的に直交しているときのブロックの作り方は?」/【回答】その場合は,ブロックも二次元的に切り分ける必要があるでしょう. posted at 07:07:17
  • #TodaiStat 【質問】「ブロック効果が有意になったとき,実験そのものに問題があったということでは?」/【回答】ブロック効果の有無は分散分析してみて初めてわかることで,事前には予測できないです.また,どのような実験をするかによっても,ブロック効果はあったりなかったりします. posted at 07:11:03
  • #TodaiStat 【回答】そのような背景撹乱があったとしても,ブロック効果を統計モデルに明示的に含めておけば,調べようとする実験要因の効果の判定には問題はないと考えるわけです.もっと条件のいい(ブロック間差の少ない)場所が使えるかどうかは別問題ですから. posted at 07:13:53
  • #TodaiStat 【質問】「要因間の交互作用があるかどうかを判定する数基準とは?」/【回答】分散分析で交互作用が “有意” になれば「あり」と言うしかありません.しかし,分散分析は「その交互作用とは何者か」に答える手法ではないのもまた事実です. posted at 07:15:53
  • #TodaiStat 【質問】「要因の数が増えるとともに交互作用の解釈が難しくなるのでは?」/【回答】確かに N 要因の間の交互作用は組合せの場合の数の総和になりますので,分散分析はどんどん複雑になります.事後の解釈を考えると過度に複雑な実験計画は考えものですね. posted at 07:19:08
  • #TodaiStat 【質問】「処理とブロックとの交互作用は考えなくていいのですか?」/【回答】処理とブロックの交互作用を考えることもあります.ワタクシはブロックは特殊な “要因” なので,他の実験要因とは別格に扱って交互作用は考えません.この点は,モデル選択論の回に解説します. posted at 07:23:15
  • #TodaiStat 【質問】「誤差偏差が “残りカス” をかき集めたものだとしたら,ちゃんと「誤差」としての意味はあるのですか?」/【回答】前提になる統計モデルはデータから計算されるその “残りカス” が互いに独立な等分散正規分布にしたがうことを前提としています. posted at 07:37:16
  • #TodaiStat 【質問】「信頼区間はどのようにして計算するのですか?」/【回答】標本平均間の有意差は t 検定で調べられますが,多重比較の場合は補正があります.分散分析の水準間差に関する信頼区間はその補正をこみにして計算します. posted at 07:49:14
  • #TodaiStat 【質問】「この授業に沿った内容を網羅した参考書はありませんか?」/【回答】来年あたり「紙の本」として出版されるかも.農業環境技術研究所ウェブマガジンで公開している連載〈農業環境のための統計学tinyurl.com/kdh32uf をどーぞ. posted at 08:36:04
  • #TodaiStat 【回答】(承前)実験計画法の講義でワタクシが用いた実例の出典は:K A Gomez & A A Gomez 1984. Statistical Procedures for Agricultural Research, 2nd Edition です. posted at 08:38:52
  • #TodaiStat 【回答】(承前)IRRI の研究者 K A Gomez & A A Gomez の Statistical Procedures for Agricultural Research は pdf がダウンロード可 tinyurl.com/mxlzyoe posted at 08:41:10
  • #TodaiStat 【質問】「スクリプト deviation.R で用いているデータ yields.txt を公開してもらえませんか?」/【回答】このデータは生態学者 Michael J. Crawley の大著『The R Book』に含まれています. posted at 08:57:47
  • #TodaiStat 【回答】(承前)Michael J. Crawley 2007. The R Book tinyurl.com/kx6toh4 のデータファイルのダウンロード先 tinyurl.com/k82s45y に yields.txt があります. posted at 08:59:53
  • #TodaiStat 【回答】(承前)The R Book の「yields.txt」の URL tinyurl.com/m44dfrf R の練習用にご利用ください. posted at 09:01:27
  • #TodaiStat 講義で用いた偏差分割デモンストレーションを RPubs に公開しました: tinyurl.com/k7twcxw データ yields.txt の読み込みは URL 経由ですのでネット接続して試してください. posted at 09:37:15