樣本中數據與樣本平均值之差的平方和的平均值稱為樣本方差;樣本方差的算術平方根稱為樣本標準差。樣本方差和樣本標準差都是對樣本波動的度量。樣本方差或標準差越大,樣本數據波動越大。
數學上壹般用e {[x-E(X)] 2}來度量隨機變量X對其均值E(X)的偏離程度,稱為X的方差。
定義
設X為隨機變量,若e {[x-e (x)] 2}存在,則e {[x-e (x)] 2}稱為X的方差,記為D(X)或DX。即d (x) = e {[x-e (x)] 2},σ (x) = d (x) 0.5(與x同維)稱為標準差或均方差。
從方差的定義可以得出以下常用的計算公式:
D(X)=E(X^2)-[E(X)]^2
方差的幾個重要性質(假設每個方差都存在)。
(1)設c為常數,則D(c)=0。
(2)如果X是隨機變量,C是常數,那麽D (CX) = C 2D (X)。
(3)設X和Y是兩個獨立的隨機變量,則D(X+Y)=D(X)+D(Y)。
(4)d(X)= 0的充要條件是X以1的概率取常數值c,即P{X=c}=1,其中e (x) = c。
標準偏差(標準差)
每個數據與平均值的距離(平均值的偏差)的平均值,即偏差平方和的平方根。用σ表示。所以標準差也是壹個平均值。
標準差可以反映數據集的分散程度。如果平均值相同,標準差可能不相同。
例如,A組和B組的六名學生都參加了相同的語文考試。A組得分為95,85,75,65,55,45,B組得分為73,72,765,438+0,69,68,67。兩組的平均分都是70,但是A組的標準差是17.08,B組的標準差是2.16,說明A組的學生差距比B組的學生大很多..