為什么t-分布函數在光譜學測量中至關重要

William Sealy Gosset, Wikipedia.org
William Sealy Gosset和健力士
William Sealy Gosset是一名統計學家,其在都柏林的健力士啤酒廠擔任啤酒釀造師。他關心的是從各種大麥(啤酒的重要原料)中獲得佳產量。當他不得不從少到三粒大麥中得出有意義的統計學結論時,他在工作中遇到小樣本量問題。
在1908年發表的論文《平均數的概率誤差》中,他這樣描述了這個問題:
“隨著實驗次數的減少,從實驗樣本中發現的標準偏差的值本身會受到越來越大的誤差影響,直到以這種方式得出的判斷可能會*產生誤導。”
Gosset開發了后來被稱為“學生t-分布函數”的方法(之所以這樣命名,是因為他以筆名“學生”發表了這篇論文),并且公布了可用于極小樣本量的數值表。該分布比正態分布更寬、更短,并允許更多的偏離測量值。隨著測量次數的增加,分布情況趨向于呈現經典的正態分布曲線。
t-分布函數
t-分布函數給出的置信區間表達式為:
uc=x?+/-Tx
式中:
x?:測量值的平均值
TX:t-分布函數的值。根據以下公式計算:
Tx=(t(f,P)x s/N1/2
式中:
t:取自公布表格的值,該值取決于f(測量的樣本數-1)和P(期望的置信度)。
s:測量系列的標準偏差
N:采用的測量次數
在光譜學中使用t-分布函數
讓我們以一個組件中鉻的真實成分結果為例,描述使用t-分布函數計算置信區間的過程。
10次讀數的平均值:18.54%
標準差:0.1%。
我們將選擇95%置信度,因此必須使用的數字是:
N:10(10次讀數)
s:0.1%(標準偏差取自上表)
t:2.262(針對置信區間為95%和樣本量為10,取自公布的表格,f=n-1)
因此:
Tx=(2·262 × 0·1%)/3·162=0·072%
我們可用其作為我們的置信區間:
uc=x+/- Tx
x:18.54(測量結果的平均值,取自上表)
uc(95.9)=18.54%+/- 0.07%
這表明我們有約95%的置信度,認為鉻的真實值介于18.47%到18.61%之間。
有趣的是,t-分布函數給出一個小于標準偏差的置信區間,這意味著我們的光譜學測量實際上比標準統計學方法所顯示的結果更。
當然,如需使用這種方法,您必須在光譜儀中讀取單個樣本的多個讀數。
想了解更多?
我們將在《指南:尋找真值》中討論如何準確計算光譜學測量的置信區間。在本文中,我們通過實際光譜學測量的示例,向您闡明在您沒有估計測量結果真實誤差所需的所有信息的情況下應采取的舉措。請在這里下載您的副本。