當前位置:偏方大全网 - 藥品查詢 - 10.假設檢驗

10.假設檢驗

假設性測試問題測試總體統計數據。假設檢驗根據介紹中的方法有兩種結論,在零假設中必須是等號。

拒絕,接受:這說明我們有足夠的證據證明它是正確的。

不能拒絕,拒絕:不能說接受,因為裏面有等號。我們的證據證明,我們的總體統計數據會圍繞該值而不是這個值波動,因為可能會有壹些微小的幹擾因素,但不會影響我們的結論。所以,只能說我們沒有足夠的證據拒絕。

類比機器學習的分類問題,我們有

類型1錯誤:當空抵押為真時,它被拒絕。

Type2error:當零假設為假時,得出不能拒絕的結論。

定義

=出錯概率,也就是我們經常用來檢驗的顯著性水平。

誤差概率

註意:其實2類錯誤很少討論,但是為了完整和容易理解還是寫出來比較好。

例:20人接種疫苗,8人兩年內未感染病毒。問接種疫苗後兩年內未感染病毒的人數超過5人的概率。

問題建立

畫出以上條件,我們的決策空間如下圖所示:

1型錯誤分析

其實我們可以換個角度看這個問題。這個問題等價於以n = 20,p=0.25的概率抽樣,抽樣服從二項分布。其實這個時候,我們是以真理為標桿來看問題的。如果得到8次以上,說明兩年內沒有8人以上感染病毒,才能得到p = 0.25的結論。所以我們的決定是拒絕,所以根據上表,是真的,但是決定是拒絕,代表1型錯誤。

= P(類型1錯誤)= P( ) =

第二類錯誤分析

根據上表,它是假的,也就是說它是真的,但問題是根據上面的分析,它代表p & gt0.25而事實上,這是無法計算的,除非P有壹個特定的值,假設p=0.7,那麽類型2誤差為

= P(第二類誤差)= P(

更壹般的情況:正態分布分析

1型和2型誤差可以通過增加樣本量來減小。

舉例:假設在上面的例子中,n=100,觀察到兩年內有36人未感染病毒,假設檢驗了兩年內有50人未感染病毒的概率。

由於樣本量大,二項分布可以近似為正態分布。如果為真,則平均值和方差為

所以36人對應。

對於2型誤差,如果備擇假設為0,方差保持不變,均值變為。

所以36人對應。

在我們可以計算出Type 1誤差(Type 2很少考慮這個誤差)之後,下壹步就是做決定了。很顯然,很自然的會想到設置壹個截斷值,這是統計學中經典的顯著性水平= 0.01.05。

假設我們預設的顯著性水平是0.01,也就是說如果是真的,那麽我只有0.0039的概率Z大於2.66,也就是36人以上沒有感染病毒。這個金額比我預想的要小,所以我選擇了拒絕(有點像歸謬法的想法)

根據2中的分析,我們需要預設壹個。如果Type 1誤差小於這個值,我們選擇拒絕,否則無法拒絕。對於從我們的觀測中得到的1型誤差的值,我們稱之為P值。

定義:P值是拒絕的最低顯著性水平。

實際上,根據上面的分析,這句話也相當於得到所示統計量顯著的結論所需的1型錯誤的最小概率。

模式1

模式2

壹般來說,第壹種方法往往更便於查表,因為預置值可以直接找到z、t、f等統計量的分割線。,但第二種方法會更直觀,更通用,不會根據z,t,f等的不同測試而變化。,而是壹個固定值。但簡而言之,這兩種方法很常見,也很重要。

  • 上一篇:熱傷風癥狀吃什麽藥
  • 下一篇:2023年江蘇省城鎮醫療保險報銷有哪些範圍
  • copyright 2024偏方大全网