以下是一些具體的例子來說明如何選擇合適的非參數檢驗方法:
一、定性數據的情況
例子:一家市場調研公司想了解消費者對三種不同品牌手機的滿意度(非常滿意、滿意、一般、不滿意、非常不滿意)是否與消費者的年齡組(18-25 歲、26-35 歲、36-45 歲、45 歲以上)有關。
分析與方法選擇:這里的數據是定性數據,即滿意度和年齡組都是分類變量。此時可以選擇卡方檢驗來判斷手機品牌滿意度與年齡組之間是否存在關聯。通過計算觀察頻數與期望頻數的差異,來確定不同年齡組對不同品牌手機的滿意度是否存在顯著差異。
二、定量數據且不滿足參數檢驗假設的兩組獨立樣本情況
例子:某學校想比較兩種教學方法對學生數學成績的提升效果。收集了兩組學生分別采用不同教學方法后的數學成績數據,但成績數據不呈正態分布。
分析與方法選擇:由于數據是定量數據但不滿足正態分布假設,且是兩組獨立樣本,所以可以選擇 Wilcoxon 秩和檢驗(Mann-Whitney U 檢驗)。將兩組成績數據混合后進行排序,得到每個數據的秩次,然后計算兩組的秩和。通過比較秩和的大小來判斷兩種教學方法對學生數學成績的提升效果是否有差異。
三、定量數據且不滿足參數檢驗假設的多組獨立樣本情況
例子:一家醫院研究三種不同藥物對某種疾病的治療效果,測量患者的康復時間。數據顯示康復時間不服從正態分布。
分析與方法選擇:這是多組獨立樣本的定量數據且不滿足正態分布假設,適合使用 Kruskal-Wallis 檢驗。將三組患者的康復時間數據混合后進行排序,計算每組的秩和。通過比較各組秩和的差異來判斷三種藥物的治療效果是否有顯著不同。
四、小樣本且配對的情況
例子:一項小型醫學實驗中,對 10 名患者在治療前后分別進行某項生理指標的測量,想知道治療是否有效果。
分析與方法選擇:這是小樣本且配對的數據情況。可以選擇 Wilcoxon 符號秩檢驗。先計算每個患者治療前后指標的差值,然后對差值進行排序并賦予秩次。根據正秩和與負秩和的大小來判斷治療前后生理指標是否有顯著變化,從而確定治療是否有效。
五、存在異常值的定量數據情況
例子:某公司分析員工的月績效獎金數據,發現其中有個別極高或極低的異常值。想比較兩個部門的績效獎金是否有差異。
分析與方法選擇:由于存在異常值,且數據可能不滿足正態分布假設,選擇 Wilcoxon 秩和檢驗較為合適。不考慮具體的數值大小,只對兩個部門的績效獎金數據進行排序并計算秩和,從而避免異常值對結果的影響,判斷兩個部門的績效獎金水平是否有顯著差異。