Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「確率変数の独立性」

11月1日の質問から:

(X-μ)/σ=rcosθ,(Y-μ)/σ=rsinθとおくと,XとYが独立でなくなると思うのですが,それでいいのですか?

確率変数(変量)の「独立性(independence)」については詳しく説明しませんでした.ふたつの変量XとYがあって,それぞれの確率密度関数をf(x),f(y)とします.XとYが「統計学的に独立である」というのは,言葉で言えば,「一方の変量の確率が他方の変量の確率にまったく影響しない」ということです.

独立性の条件を式で書けば,二変量(X,Y)の確率密度関数*1

f(x)・f(y)

となります.要するに,変量ペアの確率は,各変量の密度関数の「積」で与えられるということです*2

高校で確率・統計を勉強したときに,「独立事象」に関する問題を解いたことがきっとあると思います.二つの事象AとBが「独立」である条件式は,その確率Pr(A & B)=Pr(A)・Pr(B)となることでした.それと同じことだと考えてください*3

上の質問に戻りますと,変量の「独立性」は確率に関わる密度関数の性質であって,変数の値に関わる変数変換とは無関係です.

さらに言えば,正規分布の全確率が1になるという証明の過程がこの質問の発端だったわけですが,元の変量XとYが独立であれば,最終的に上の極座標変換の変量rとθの確率密度関数は別々に因数分解されました.したがって,変数変換後のrとθは統計学的に「独立」ということになります.

*1:本来であれば,ここで「多変量同時確率分布」の話をしなければならないのですが,それはスキップしています

*2:多変量同時確率分布の言葉で言えば,同時確率密度関数が各変量ごとに“因数化”されることが独立性の条件であるということです.

*3:一般には,Pr(A & B)=Pr(A)・Pr(B|A)となり,条件付き確率Pr(B|A)が必要になります.事象の独立性とは Pr(B|A)=Pr(B) となることだと言い換えることもできます.