協方差的定義,EX是隨機變量x的數學期望,同樣的,EXY是XY的數學期望,這個比較麻煩。建議妳看看概率論CoV (x,y) = exy-ex * ey。
協方差的定義,EX是隨機變量x的數學期望,EXY是XY的數學期望,比較麻煩。建議妳看壹看概率論。
例如:
Xi 1.1.93
易5.0 10.4 14.6
e(X)=(1.1+1.9+3)/3 = 2
e(Y)=(5.0+10.4+14.6)/3 = 10
e(XY)=(1.1×5.0+1.9×10.4+3×14.6)/3 = 23.02
Cov(X,Y)= E(XY)-E(X)E(Y)= 23.02-2×10 = 3.02
另外,我們還可以計算:d(x)= e(x ^ 2)-e ^ 2(x)=(1.1.2+1.9 ^ 2+3 ^ 2)/3-4 = 4.60-4 = 0。
d(y)=e(y^2)-e^2(y)=(5^2+10.4^2+14.6^2)/3-100=15.44σy = 3.93
x和y的相關系數:
r(X,Y)=Cov(X,Y)/(σXσY)= 3.02/(0.77×3.93)= 0.9979
說明這組數據x和y的相關性很好!
擴展數據:
協方差在概率論和統計學中用來衡量兩個變量的總誤差。方差是協方差的特例,即兩個變量相同時。
協方差表示兩個變量的總誤差,不同於只有壹個變量誤差的方差。如果兩個變量的趨勢壹致,即其中壹個大於自己的期望,另壹個大於自己的期望,那麽兩個變量之間的協方差為正。
如果兩個變量的趨勢相反,即其中壹個大於其期望值,另壹個小於其期望值,則兩個變量之間的協方差為負。
如果兩個隨機變量X和Y是相互獨立的,那麽E[(X-E(X))(Y-E(Y))]=0,所以如果上面的數學期望不為零,那麽X和Y不是相互獨立的,即它們之間存在壹定的關系。
協方差和方差之間有以下關系:
D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
D(X-Y)=D(X)+D(Y)-2Cov(X,Y)
協方差與期望值有以下關系:
Cov(X,Y)=E(XY)-E(X)E(Y).
協方差的屬性:
(1)Cov(X,Y)=Cov(Y,X);
(2)Cov(aX,bY)=abCov(X,y),(a,b為常數);
(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y).
從協方差的定義可以看出,Cov(X,X)=D(X),Cov(Y,Y)=D(Y)。
協方差作為描述X和Y相關程度的量,在相同的物理維度下發揮壹定的作用,但同樣的兩個量采用不同的維度,使得它們的協方差在數值上表現出很大的差異。為此,引入了以下概念:
定義
稱為隨機變量X和Y的皮爾遜相關系數..
方差是概率論和統計方差度量隨機變量或壹組數據時,對離散程度的度量。概率論中的方差用於衡量隨機變量與其數學期望(即均值)之間的偏差。統計學中的方差(樣本方差)是每個樣本值與所有樣本值的平均值之差的平方值的平均值。在許多實際問題中,研究方差即偏離度具有重要意義。
方差是對源數據和期望值之間差異的度量。
方差在統計描述和概率分布中有不同的定義和公式。
在統計描述中,方差用於計算每個變量(觀察值)與總體均值之間的差異。為了避免平均和偏差為零和平均平方和偏差受樣本大小影響的現象,用平均平方和的平均偏差來描述變量的變異程度。人口方差計算公式:
對於人口方差?是壹個變量。人口是平均的嗎?是案例總數。
在實際工作中,當總體均值難以獲得時,用樣本統計量來代替總體參數。校正後,計算樣本方差的公式為:s 2 = ∑ (x-?)^2 / (n-1)
S 2是樣本方差,x是變量。是樣本平均值,n是樣本數。
參考資料:
百度百科-協方差