統計學是關於認識客觀現象總體數量特征和數量關系的科學。
它是通過搜集、整理、分析統計資料,認識客觀現象數量規律性的方法論科學。
由於統計學的定量研究具有客觀、準確和可檢驗的特點,所以統計方法就成為實證研究的最重要的方法,廣泛適用於自然、社會、經濟、科學技術各個領域的分析研究。
擴展資料:
統計學是壹門很古老的科學,壹般認為其學理研究始於古希臘的亞裏士多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了“城邦政情”、“政治算數”和“統計分析科學”三個發展階段。
所謂“數理統計”並非獨立於統計學的新學科,確切地說,它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的壹個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的範疇,而是屬於數學的範疇。
統計學(statistics):收集、處理、分析、解釋數據並從數據中得出結論的科學。
描述統計(descriptive statistics):研究數據收集、處理和描述的統計學方法。
推斷統計(inferential statistics):研究如何利用樣本數據來推斷總體特征的統計學方法。
變量(variable):每次觀察會得到不同結果的某種特征。
分類變量(categorical variable):觀測結果表現為某種類別的變量。
順序變量(rank variable):又稱有序分類變量,觀測結果表現為某種有序類別的變量。
數值型變量(metric variable):又稱定量變量,觀測結果表現為數字的變量。
均值(mean):均值也就是平均數,有時特指算術平均數,這是相對其他方式計算的均值,求法是先將所有數字加起來,然後除以數字的個數,這是測量集中趨勢,或者說平均數的壹種方法。
中位數(median):也就是選取中間的數,要找中位數,首先需要從小到大排序,排序後,再看中間的數字是什麽。
眾數(mode):眾數也就是數據集中出現頻率最多的數字。
任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋梁或是核能發電計劃結構的可靠性。
即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變量所導致,但是這個顯著性可能與大眾的直覺相悖。人們需要壹些統計的技巧(或懷疑)以面對每天日常生活中透過引用統計數據所獲得的資訊。
在具體進行取樣時,必須根據研究目的的不同,選擇不同的取樣方法。
①單純隨機取樣法先把每個個體編號,然後用抽簽的方式從總體中抽取樣本。這種方法適用於個體間差異較小、所需抽選的個體數較少或個體的分布比較集中的研究對象。
②分區隨機取樣法將總體隨機地分成若幹部分,然後再從每壹部分隨機抽選若幹個體組成樣本。這種抽樣法可以更有組織地進行,而且中選的個體在總體的分布比單純隨機取樣更均勻。
③系統取樣法先有系統地將總體分成若幹組,然後隨機地從第壹組決定壹個起點,如每組15個元素,決定從第壹組的第13個元素選起,那麽以後選定的單位即28,43,58,73等等。
④分層取樣法根據對總體特性的了解,把總體分成若幹層次或類型組,然後從各個層次中按壹定比例隨機抽選。這種方法的代表性好,但若層次劃分得不正確,也不能獲得有高度代表性的樣本。
參考資料:
百度百科——統計學