在生物醫藥統計分析中,不同組別間的差異分析是最常用,也是使用最多的統計方法。
因變量為連續變量,且符合正態分布的數據要分析不同組別間的差異時,在SPSS中用到的統計方法是:獨立樣本T檢驗與單因素方差分析。
下面來看今天的實際案例:以下是45名患者的年齡數據,以及他們的血型分組和MRS分組。血型分為A/B/AB/O型,MRS分為生存和死亡2組(圖1),這里我們已經檢驗了年齡在血型和MRS分組上的正態性,均是符合正態的,具體方法在之前的文章里有詳細講解,這里不再贅述。注意一定要符合正態分布的數據才能使用我們今天所講的這2種方法。
1. 獨立樣本t檢驗
獨立樣本t檢驗,適用于符合正態分布的連續型因變量,在只有2種不同分組的組別上比較差異,也就是這里的年齡在不同MRS分組上是否存在顯著的差異。
操作步驟:
①點擊“分析”-“比較平均值”-“獨立樣本t檢驗”(圖2)
②在彈出的窗口中,將“年齡”選入“檢驗變量”框內,將“MRS”分組選入“分組變量”欄內,并點擊“定義組”設置分組編碼(圖3),設置好后,點擊確定。
③結果分析
由上表可以看出:MRS存活組的年齡為:54.32±8.84,MRS死亡組的年齡為58.70±14.28,而統計量則看上圖中萊文方差等同性檢驗的顯著性,如果這個顯著>0.05,則采用上圖中藍色的T和P,反之則采用綠色。這里0.008<0.05,所以我們采用綠色的T和P值。t=-1.242,P=0.222>0.05,說明存活組的年齡和死亡組的年齡之間的差異不顯著。
2. 獨立樣本t檢驗
單因素方差分析,適用于符合正態分布的連續型因變量,在有大于2種以上不同分組的組別上比較差異,也就是這里的年齡在不同血型分組上是否存在顯著的差異。
操作步驟:
①點擊“分析”-“比較平均值”-“單因素ANOVA檢驗”(圖5)
②在彈出的窗口中,將“年齡”選入右側“因變量列表”,再將“血型”選入右側“因子”框內(圖6),再點擊右側“選項”按鈕,勾選“描述性”和“方差齊性檢驗”(圖7),最后點擊確定
③結果分析
由上圖可以看出:4組不同血型的年齡描述,均值,標準差在描述表里,就不再贅述,ANOVA表里看出,統計量F=7.882,P=0.000<0.05,說明四種血型的年齡差異顯著,但是具體是哪組和哪組之間的差異顯著,我們這里就需要4組之間兩兩多重比較,而兩兩比較之前需要看上圖中方差齊性檢驗表中的顯著性,若大于0.05,則選用LSD多種比較,否則選用塔姆黑尼(T2),具體操作為,在上面的圖6界面中,點擊右側“事后比較”,在彈出的界面中,勾選“塔姆黑尼”,后再次運算。
由上面的多重比較表可以看出:A型血組的患者的年齡顯著高于B和O,而B、O與AB之間的差異不顯著,從大到小排序就為A>AB>B>O。這樣比較后各組之間的差異就非常清楚了。
以上就是今天所講的2種參數類變量的差異分析方法,是最基礎也是最常用的。當然除了這2種方法以外,還有更多復雜的方法,例如SPSS多因素方差,或者重復測量的方差分析,這些我們將會在今后的文章中逐一講解!