??? 數理統計學是數學的一個分支學科,研究怎樣去有效地收集,整理和分析帶有隨機性的數據,以對所觀察的問題作出推斷或預測,直至為采取一定的決策和行動提供依據與建議。
??? 眾所周知,概率論是數理統計學的理論基礎,所以數理統計學是伴隨著概率論的發展而發展起來的。當人們認識到必須把數據看成是來自具有一定概率分布的總體,所研究的對象是這個總體而不能局限于數據本身之日,也就是數理統計學誕生之時。(確切時間至今難定論)
??? 從現有資料看,19世紀中葉以前已出現了若干重要工作,特別是C.F.高斯和A.M.勒讓德關于觀測數據誤差分析和最小二乘法的研究。到19世紀末,經過包括K.皮爾森在內的一些學者的努力,這門學科已經開始形成。
??? 數理統計學發展成一門成熟的學科,則是20世紀上半葉的事,它很大程度上要歸功于K.皮爾森,R.A.費希爾等學者的工作。特別是費希爾的貢獻,對這門學科的建立起了決定性的作用。1946年,H.克拉默發表的《統計學數學方法》,是第一部嚴謹且比較系統的數理統計學著作,可以把它作為數理統計學進入成熟階段的標志。
??? 數理統計學的發展大致可分為三個時期:
??? 一. 20世紀以前
??? 這個時期又可分為兩段
??? (1)萌芽階段:
??? 這一階段的工作沒有超出描述性統計的范圍。不過此時概率論方面有較多的發展,為以后數理統計學的建立作了準備。某些現在還很常用的統計方法,如直方圖法、符號檢驗法等在這個時期已被使用。T.貝吐斯在1763年發表的《論有關機遇問題的求解》對后世統計思想起了很大影響。
??? (2)幼年階段:
??? 高斯等關于觀測數據誤差分析和最小二乘法的工作,經過以后馬爾可夫等學者的發展,成為數理統計學中的一個重要方法。這個時期的最重要的發展,在于確定了這樣一種觀點,即數據來自服從一定概率分布的總體,而統計問題就是用數據去推斷這個分布中的未知方面。這種觀點加強了推斷的地位,而使統計學擺脫了單純描述的性質。
??? 這一階段標志性的研究成果有:
??? 高斯等的工作揭示了正態分布的重要性,即在實際問題遇見的幾乎所有的連續隨機變量,都可以滿意地用正態分布去刻畫;
??? 英國學者K.皮爾森引進了一個以他名字命名的分布族,它包含了正態分布及現在已知的一些重要的偏態分布,即皮爾森分布族,它可以概括實用上常見的分布。特別是,他還引進了一種方法——矩估計法來估計他引進的分布族中的參數,此方法至今仍是一種重要的參數估計方法。
??? 德國大地測量學者F.赫爾梅特1875年在研究正態分布總體的樣本方差時,發現了在統計上十分重要的分布。
??? 英國生物統計學家F.高爾頓等關于回歸分析的先驅性工作以及時間序列分析方面的一些工作。
??? 二. 20世紀初至二次世界大戰結束
??? 這是數理統計學蓬勃發展達到成熟的時期,許多重要的基本觀點和方法,以及數理統計學的主要分支學科,都在這個時期建立和發展起來了。這個時期的成就包含了至今仍在廣泛使用的大多數統計方法,并占據了教科書中主要篇幅。在其發展中,以英國統計學家、生物學家R.A.費希爾為代表的英國學派起了主導作用。
??? K.皮爾森在1900年提出了檢驗擬合優度的統計量,并證明其極限分布(在原假設成立時)是分布。此結果為大樣本統計先驅性工作;
??? 皮爾森的學生,英國醫生W.S.戈賽特(筆名“學生”)于1908年導出了分布—正態總體下統計量的精確分布,開了小樣本理論的先河。它是在統計量的分布屬于皮爾森分布族假定下導出的;
??? 比皮爾森略晚的費希爾(1890-1962)對現代數理統計的形成和發展作出了最大的貢獻,其重要成就是:
??? 系統地發展了正態總體下種種統計量的抽樣分布(20年代),這標志著相關分析、回歸分析和多元分析等分支的初步建立;
??? 建立了以最大似然估計為中心的點估計理論(1912-1925);
??? 與F.耶茨合作創立了實驗設計,并發展了與這種設計相適應的數據分析方法——方差分析法(20-30年代);
??? 引進“信任推斷法”,對某些困難的統計問題,提供了簡單可行的解法。
??? 在假設檢驗理論中作出重要貢獻的有:
??? 美國學者J.奈曼,K.皮爾森的兒子E.S.皮爾森。他們在1928-1938年間發表的一系列文章的要旨是把假設檢驗問題作為一個數學最優化問題來處理。在一定意義上,他們的工作是以后瓦爾德建立的統計決策理論的先驅。
??? 奈曼爾在1934-1937年間建立的置信區間估計理論,基于概論的頻率解釋,并與假設檢驗理論有密切聯系。
??? 在狹義多元分析(多元正態總體的統計分析)中作出重要貢獻的有:
??? 費希爾,J.維夏特,許寶騄,后者在1940年前后對這一領域以及線性模型的統計推斷理論方面都作了奠基性的工作。
??? H.克拉默在1946年發表的著作《統計學數學方法》對以上所述的成就的主要部分作了扼要的總結,宣告了統計學發展史上這一重要時期的結束。
??? 三.戰后時期
??? 這一時期數理統計學在應用和理論兩方面繼續獲得很大的發展,由于經濟和軍事技術的快速發展,特別是電子計算機的出現,使數理統計學的應用達到了前所未有的規模,最顯著的例子是大批生產工業產品時使用統計質量管理的方法,它對日本戰后的經濟恢復和發展起了不少的作用。
??? 與戰前不同,戰后統計理論是沿著縱深的方向和使用更復雜的數學工具的方向發展,最大似然估計和非參數統計的大樣本理論,戰前只有初步結果,現已達到了完善的地步。
??? 瓦爾德在1950年創立了統計決策理論,它從人與大自然進行博弈的觀點出發,企圖把形形色色的統計問題歸并在一個統一的模式之下。這種理論對戰后數理統計各分支的發展產生了程度不等的影響,大大地改變了參數估計這個分支的面貌。
??? 戰后數理統計的發展中,一個引人注目的現象是貝葉斯學派的崛起。50年代以來,傳統的統計學發展趨于成熟并得到大量應用后,其固有的弱點開始顯露,并逐漸為人們所認識。貝葉斯統計在理論上的進展以及在應用上的方便與效益,使其觀點為更多的人所了解,傳統學派與貝葉斯學派之間的爭論,其最后結局要取決于它們在應用中的表現,這會影響到未來統計學的面貌。
??? 計算機的廣泛應用,使人們有可能從各個角度對數據進行透徹的分析,從中提出更多的信息,而不必總是依賴一定的數學模型。有的學者把這方面的工作稱為“數據分析”,并認為是數理統計發展中的一個生長點。從另一方面看,這在一定程度上降低了模型(即理論)的作用。有的學者已表現出忽視模型的傾向,它可能加劇在數理統計學發展中理論與應用分家的趨勢。總的來說,電子計算機的廣泛應用為數理統計學提供了巨大的機會,也提出了一些很有意義的研究課題。