logo821.gif (10572 bytes) 首頁          新增資料與公告

最新消息:

使用設施與溫室的真正意義

 

 

生醫研究之統計方法

首頁
上一層
BSE LAB 介紹
授課資料
人文關懷
無官御史台
智能生物產業
蘭花產業
蘭界感言篇
活動公告區
Orchids Cultivation

 

 

標準差與標準偏差

 

中興大學 生物系統工程研究室 陳加忠

 
 

在許多醫學研究數據中,標準差(standard deviation, SD)與標準偏差(the estimated standard error of the mean, SEM),常常被使用以代表數據的特性與解釋統計分析結果。然而後者常常被誤用。

Source Lee et al., 2015, Standard deviation and standard error of the mean, Korean J. of Anesthesiology, 68(3):220-223.

 

        一堆數據如果其沿著一個特定值而均勻分佈,此稱為常態分佈。常態分佈是進行參數統計分析的基本條件。代表數據有向中央集中之趨勢。然而要代表這個分佈的形狀,只有一個"平均值"此數據還是不足。在醫學文獻,除了平均值(mean),還需要標準差與標準偏差值。

        醫學研究中對一個族群(population)進行研究,然後自此族群(母群)取出樣本以進行假設試驗。只要取樣過程是不偏,而且有足夠的樣本數目,取樣樣本也是常態分佈。對所有常態分佈的數據,樣本分佈特性可由平均值與變異量代表。變異量之數值為標準差,代表觀察值與平均值之差異性。如果數據的散佈都是接近平均值,代表此變異量減少。但是變異數(Variance)其單位與平均值不同,因此以標準差與平均值比較是更有意義。

        樣本:X1X2--Xn,根本數目n

平均值= /n

變異數(Variance) = 2/n-1

SD =

因此常態分佈以平均值與標準差表示是更有意義。在常態分佈圖上,68.7%的觀察值是落在平均值±1個標準差值之範圍。95.4%數據位於平均值±兩個標準差之範圍。因此許多文獻都是報導平均值與標準差值。

在醫學研究文獻中,樣本代表一系列來自母群觀察的數值。因為試驗過程無法對母群進行全面試驗,因此自母群中取樣進行試驗十分重要。在研究進行之前,要針對研究計劃以估算所需樣本數目,所抽樣之樣本只是整體母群的一小部份,因此樣本平均值僅是母群平均值的一個評估值。

對母群內進行取樣研究,每次試驗此樣本群內的數據並不相同。例如第一組取樣30個,第二組也取樣30個,第三組取樣30個。自第一組至第三組,每組數據的平均值與標準差值都不相同。不同組的樣本數值,稱為樣本分佈,也是一個常態分佈。每一個樣本分佈其標準差可以加以計算,稱為標準偏差。標準偏差值由母群的變異量與取樣的樣本數目所決定。母群的變異量大,樣本分佈的變異量也大。但是只要樣本數目增加,樣本平均值更接近母群平均值,標準偏差值更小。標準偏差用來代表樣本平均值接近的程度。但是實際上,往往每一次只有自母群取樣一個樣本。因此標準偏差則由標準差與樣本數目加以估算。

標準偏差 =標準差/

一個母群平均值之評估方法往往使用信賴區間此概念。最常使用為95%的信賴區間。例如95%之信賴區間,為 EQ \x\to(X)  ±1.96*標準偏差。用來代表母群平均值95%機率下會出現在那些範圍。換言之,平均值自100個樣本所計算之數值,有95個數據在此範圍,5個數據在範圍之外。以統計方法比較不同組的數據群,研究人員估計各樣本之母群,並且檢查是否相同。這個情況下,標準偏差用以代表樣本之變異,用以估計母群之平均值。藉由預先設定之顯著水準(Pre-set significate level),評估樣本在誤差範圍內能否代表母群。

標準偏差值一定小於標準差值,標準偏差值來自標準差值除以開根號之數據數目。因此研究人員偏愛以標準偏差值描述其樣本。如果兩組數據之數目相同,以標準偏差或標準差之比較結果是相同。然而樣本數目十分重要。合理的樣本數目才能得到合理之統計推論。例如母群變異數如果極大,標準差值一定變大。如果樣本數目增大,標準偏差值變小,此情況下使用標準偏差進行統計推定(descriptive statistics),容易造成推論錯誤。這在醫學研究上十分常見,因為醫學研究先天就存在內在與外在的個別差異。

本文作者檢查Korean Journal of Anesthesiology 61-6期共有36篇實驗研究,發現許多不當使用標準差與標準偏差之個案。例如進行統計推論,只有一篇使用95%信賴區間,但未述明樣本數目。36篇論文,只有一篇研究曾進行常態分配檢定。所有36篇論文使用標準差值,樣本數目或百分比以描述統計結果。但是在圖形(figures)並未標誌平均值,標準差或四分區間(interquartile range),16篇論文使用樣本數或百分比,但是未使用信賴區間。有兩篇論文使用信賴區間,有一篇論文是錯誤使用,作者建議在論文評審過程必需加留意,以免妨礙數據正確判讀。

《評論》

標準差反應了數據常態分配下之變異,標準偏差代表一個取樣樣本分配下樣本平均值之差異。使用標準差與常態分配測試與描述樣本特性有相關。但是使用標準偏差與信賴區間,只要樣本數目合理估計,更合理進行統計檢定。以標準偏差配合樣本數目,對於統計結果之報導更為有用。