結果的統計顯著性是對結果的真實程度(能代表總體)的壹種估計方法。在專業上,P值是結果可靠性的遞減指標。P值越大,我們越不能認為樣本中變量的相關性是總體中變量相關性的可靠指標。p值是觀測結果被認為有效的誤差概率,即壹般具有代表性。比如p=0.05,說明樣本中有5%的變量可能是偶然引起的。即假設總體中任何變量之間不存在相關性,我們重復類似的實驗,發現20個實驗左右有壹個實驗,我們研究的變量的相關性會等於或強於我們的實驗結果。(這並不意味著如果變量之間存在相關性,我們可以得到相同的結果5%或95%次。當總體中變量之間存在相關性時,重復研究並找到相關性的可能性與設計的統計有效性有關。在許多研究領域中,p值0.05通常被認為是可接受誤差的邊界水平。
在最終結論中判斷什麽水平的顯著性是統計上顯著的,並且不可避免地是任意的。換句話說,結果無效和被拒絕的水平的選擇是任意的。在實踐中,最終的決定通常取決於數據集比較和分析過程中的結果是先驗的還是僅僅是成對的>:比較取決於總體數據集中結論壹致的支持證據的數量以及該研究領域的以往實踐。壹般很多科學領域的P值≤0.05的結果被認為是統計顯著性的邊界,但這種顯著性水平也包含了很高的出錯可能性。結果0.05≥p & gt;0.01被認為具有統計學意義,0.01≥p≥0.001被認為具有高度統計學意義。但需要註意的是,這種分類只是基於研究的不規則判斷套路。
所有的檢驗統計量都是正態分布的嗎?不完全是,但大部分檢驗都與它們有直接或間接的關系,可以由正態分布導出,如t檢驗、f檢驗或卡方檢驗。這些檢驗壹般要求被分析變量在總體中呈正態分布,即滿足所謂的正態假設。很多觀測變量確實是正態分布的,這也是為什麽正態分布是現實世界的基本特征。當人們用基於正態分布的檢驗來分析非正態分布變量的數據時,問題就出現了(參見非參數和方差分析的正態檢驗)。在這種條件下有兩種方法:壹種是使用替代非參數檢驗(即非分布檢驗),但這種方法不方便,因為從它提供的結論形式來看,這種方法在統計上是低效的,也是不靈活的。另壹種方法是,當樣本量確定足夠大時,通常可以采用基於正態分布的檢驗。後壹種方法是基於壹個非常重要的原理,在基於法方程的整體測試中起著極其重要的作用。即隨著樣本量的增加,樣本分布的形狀趨於正態,即使所研究變量的分布是非正態的。