當噪聲符合正態分布n (0,δ2)時,因變量符合正態分布n (ax (I)+b,δ2),其中預測函數y = ax (I)+b。
這個結論可以從正態分布的概率密度函數得到。也就是說,當噪聲符合正態分布時,其因變量也必須符合正態分布。
對於線性回歸模型,當因變量服從正態分布,誤差項滿足高斯-馬爾可夫條件(零均值、等方差、不相關)時,回歸參數的最小二乘估計是壹致最小方差無偏估計。
在用線性回歸模型擬合數據之前,要求數據應符合或近似符合正態分布,否則得到的擬合函數是不正確的。
如果樣本本身不符合正態分布或近似服從正態分布,則應采用其他擬合方法。例如,對於服從二項分布的樣本數據,可以采用logistics線性回歸。
線性回歸是廣義線性模型,其函數指標簇為高斯分布。p(y;η) = b(y)exp(η T T(y)?壹個(η)).
η = ?
T(y) = y
a(η) =?^2 /2= η^2 /2
b(y) = (1/ √ 2π)exp(?y^2 /2)
目標函數h(x) = E(y|x) =?= η = θ T x
所以線性回歸的假設是噪聲服從正態分布,即因變量服從正態分布。