整理:蔡依橙
前陣子,MedCalc 的作者 Frank,在 Facebook 頁面分享了一篇跟統計相關的文章,叫做「生物醫學研究文章中,連你都可以發現的 20 個統計錯誤」,很有意思。
- MedCalc 粉絲頁的貼文
- Twenty Statistical Errors Even YOU Can Find in Biomedical Research Articles / Croatian Medical Journal
這是刊登在 Croatian Medical Journal,也就是「克羅埃西亞醫學雜誌」的文章,看內容與分類,應該是 2004 年時,克羅埃西亞也想提升他們的醫學發表,所以雜誌找了統計專家分享一下在生物醫學雜誌領域,常見的統計錯誤。
我認真的看完後,覺得蠻不錯的,於是把這 20 個統計錯誤的標題翻成中文,協助大家節省時間,如果剛好有興趣的,可再針對該部分,去閱讀原文。接著,分享一些我看完之後的想法。
二十個常見的統計錯誤
- 數值報告時,提供了不必要的精確。例如 60 公斤體重,硬要寫成 60.18 公斤。
- 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。像是 CRP 不以數值去統計,而分成低、中、高三組,卻沒說明為什麼這樣分。
- 配對資料,只報告各組平均,卻沒報告其改變。也就是只報告治療前血壓、治療後血壓,卻沒報告有多少人上升、多少人下降、平均下降多少。
- 描述性統計的誤用,尤其該用 median (interquartile range) 的,硬是用成 mean +- SD。
- 使用 standard error of the mean (SEM) 描述量測的精確度,而非 95% CI。
- 只報告 p 值,卻沒提到差值以及臨床意義。
- 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
- 使用線性迴歸,卻沒有先確定資料之間是真的有線性關係。
- 沒有使用全部的資料,然後又沒把去掉的資料「為什麼被去掉」說清楚。
- 多組比較的 p 值校正問題。
- 在隨機分組研究時,過於詳盡地比較了兩組受試者的基本資料,像是性別比例、年齡、體重、血壓等等,而且資料好得太奇怪。
- 報告檢驗數值時,沒有定義 normal 與 abnormal。
- 計算 sensitivity 與 specificity 時,沒有說明一些介在灰色地帶的檢查結果,如何呈現與去除。
- 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
- 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
- 在報告數據與解讀時,搞不清楚 units of observation 是什麼,例如心臟病的觀察研究,在 1000 個患者中有 18 位心臟病發,那 units of observation 就是 18。但如果這個研究是以診斷正確率為主,那 sample size 就是 1000。
- 把不顯著的統計,或 low power,解讀成 negative,而非 inconclusive。
- 分不清楚解釋性研究與實務性研究,前者為 explanatory / efficacy / laboratory,後者為 pragmatic / effectiveness / real world。嘗試兩種混著做,結果兩邊都做不好。
- 沒有用臨床能理解的方式來報告最終結果。
- 把統計的顯著性,當成臨床的重要性。例如:癌症用新藥治療,統計上很顯著的好,但追蹤了五年,患者只延長了七天的壽命。這就是統計有顯著,但臨床意義不大的例子。
我的一些想法
由統計專業人的角度,來看生物醫學發表,是很有警惕意義的,能讓準備發表的朋友,仔細看看自己是不是也犯了相關的錯誤。
但另一個角度看,作者也提到,這些錯誤在幾乎一半的生物醫學論文上反覆出現!這就代表,其實生物醫學論文要刊登,並不代表我們什麼錯都不能犯,相反地,這 20 個錯誤裡頭,有些就算犯了,也還是能被刊登。
以我們自己發表,以及過去協助同學的經驗來說,我會認為 2 / 7 / 10 / 14 / 15,是初學者也必須理解並避開的,其他的,則是開始發表起步了之後,陸陸續續去注意,在往更高分期刊挑戰時,逐漸進步就行。
- 將連續變項分組,變成次序變項,但沒有說明為什麼這樣分。
- 誤用統計方式。尤其常見的是混淆有母數跟無母數統計方法。
- 多組比較的 p 值校正問題。
- 使用圖片與表格,只是為了儲存數據,而非以協助讀者理解為出發點。
- 畫出來的數據圖,視覺主觀上給人的印象,竟然跟數據本身不同。
實務上,3 分以下的醫學期刊,幾乎沒有專門的統計查核,你只要能通過「一般同行」的統計知識審查就行。
也就是說,我是一個放射科醫師,剛開始起步,投稿到放射科 3 分以下期刊,文章中的統計,只要「一般有在做研究的放射科醫師」覺得可以就行,不見得要到「統計專家看過並挑不出毛病」。
對於初學者如何起步,實務的協助,我們根據內科系臨床研究、外科系臨床研究以及統合分析等三個領域,規劃了三種課程,歡迎有興趣的朋友可以參考。
- 醫學論文與寫作工作坊(內科系臨床研究)
- 臨床研究與發表工作坊(外科系臨床研究)
- 統合分析工作坊
不只是說說而已,我們會舉實例,說明其意義、如何避開,在互動實作過程,實際由各位在自己的電腦上操作,從數據到軟體,從統計到繪圖,一次搞定,並避開常見錯誤,是真正以「初學者起步」為核心的規劃。
因為要找到優質講師跟專業助教的時間不容易,並非隨時各種課程都有開班,有時一年也只能開一次或兩次,若有興趣,歡迎儘速把握機會。
新思惟近期課程