二十個常見的統計錯誤,與實務寫作時的考量。

 

整理:蔡依橙

 

 

 

 

前陣子,MedCalc 的作者 Frank,在 Facebook 頁面分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。

 

 

這是刊登在 Croatian Medical Journal,也就是「克羅埃西亞醫學雜誌」的文章,看內容與分類,應該是 2004 年時,克羅埃西亞也想提升他們的醫學發表,所以雜誌找了統計專家分享一下在生物醫學雜誌領域,常見的統計錯誤。

 

我認真的看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分,去閱讀原文。接著,分享一些我看完之後的想法。

 

 

二十個常見的統計錯誤

 

  1. 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
  2. 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
  3. 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
  4. 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
  5. 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
  6. 只報告 p 值,卻沒提到差值以及臨床意義。
  7. 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
  8. 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
  9. 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
  10. 多組比較的 p 值校正問題。
  11. 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
  12. 報告檢驗數值時,沒有定義 normal 與 abnormal。
  13. 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
  14. 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
  15. 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
  16. 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
  17. 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
  18. 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
  19. 沒有用臨床能理解的方式來報告最終結果。
  20. 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。

 

 

我的一些想法

 

由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。

 

但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。

 

以我們自己發表,以及過去協助同學的經驗來說,我會認為 2 / 7 / 10 / 14 / 15,是初學者也必須理解並避開的,其他的,則是開始發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。

 

  • 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。
  • 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
  • 多組比較的 p 值校正問題。
  • 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
  • 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。

 

實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。

 

也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。

 

對於初學者如何起步,實務的協助,我們根據內科系臨床研究、外科系臨床研究以及統合分析等三個領域,規劃了三種課程,歡迎有興趣的朋友可以參考。

 

 

不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以「初學者起步」為核心的規劃。

 

因為要找到優質講師跟專業助教的時間不容易,並非隨時各種課程都有開班,有時一年也只能開一次或兩次,若有興趣,歡迎儘速把握機會。

 

 

新思惟近期課程

 

 

本篇發表於 醫學研究 並標籤為 , , , , , , , , , 。將永久鏈結加入書籤。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *