Inleiding tot de R-statistiek

統計学全般に関する備忘メモの書庫(三中信宏)

「共分散の意味」

前回の講義に関して:

正の共分散のときなぜ右上がりの分布になるのか.負の共分散のときなぜ右下がりの分布になるのか,わからないです.

という質問がありました.多変量の確率分布では共分散(covariance)が重要な意味をもっているので,ここで補足説明しておきます.

二変量XとYの共分散 cov[X,Y]の定義式は:

cov[X,Y]=E[(X-E(X))(Y-E(Y))]

です.X=Yであれば上式は通常の分散E[(X-E(X))2] ですから,説明は不要ですね.

上の式が共分散になるのはX≠Yのときで,X-E(X)とY-E(Y)はそれぞれ変量XとYの偏差をあらわしています.したがって,偏差の積(X-E(X))(Y-E(Y))の符号が「正」になるのは各偏差が同符号のときであり,逆に「負」になるのは各偏差が異符号のときであることがわかります.変量Xが正の偏差を持つのに連動してYも正の偏差をもつ(あるいはその逆にどちらも連動して負の偏差をもつ)とき偏差積は「正」となり,一方の変量の偏差の正負と逆の符号を他方の変量がもつならば偏差積は「負」になります.偏差積が「正」であれば両変量の増減は一致し,「負」であれば増減は逆になるということです.

このようにして,二つの変量の共変動(covariation)の様相は偏差の符号の関係(つまりは偏差積の符号)をみればわかりますので,その期待値E[(X-E(X))(Y-E(Y))]をとることにより,その全体的傾向をつかもう--というのが共分散概念が目指しているものです.