正文:近年來,人工智能(AI)在醫(yī)療領(lǐng)域的應(yīng)用受到越來越多的關(guān)注。特別是 ChatGPT 等聊天機(jī)器人,被許多醫(yī)院希望作為輔助工具,以提升醫(yī)生的診斷效率。然而,最新發(fā)布的一項(xiàng)研究顯示,使用 ChatGPT 并未顯著提高醫(yī)生的診斷能力。這項(xiàng)研究發(fā)表于《JAMA Network Open》期刊,揭示了 AI 在醫(yī)療診斷中的潛力及其局限性。

圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney

研究中,參與者為50名醫(yī)生,包括26名主治醫(yī)生和24名住院醫(yī)生。他們被要求在一個(gè)小時(shí)內(nèi),根據(jù)六個(gè)真實(shí)的病例進(jìn)行診斷。為了評(píng)估 ChatGPT 的輔助效果,研究人員將醫(yī)生分成兩組,一組可以使用 ChatGPT 和傳統(tǒng)醫(yī)療資源,另一組則只能依靠傳統(tǒng)資源,如臨床信息平臺(tái) UpToDate。

結(jié)果顯示,使用 ChatGPT 的醫(yī)生在診斷方面的得分為76%,而僅依賴傳統(tǒng)資源的醫(yī)生得分為74%。相比之下,ChatGPT 獨(dú)自完成診斷的得分高達(dá)90%。盡管 ChatGPT 在獨(dú)立工作時(shí)表現(xiàn)出色,但其與醫(yī)生的結(jié)合并未帶來明顯的提高,令研究團(tuán)隊(duì)感到意外。

研究的共同第一作者、斯坦福臨床卓越研究中心的博士后研究員埃桑?高(Ethan Goh)表示,這項(xiàng)研究的設(shè)計(jì)并未在真實(shí)的臨床環(huán)境中進(jìn)行,而是基于模擬數(shù)據(jù),因此結(jié)果的適用性受到限制。他指出,醫(yī)生在面對(duì)實(shí)際患者時(shí)的復(fù)雜性無法在實(shí)驗(yàn)中完全體現(xiàn)。

雖然研究表明,ChatGPT 在診斷時(shí)的表現(xiàn)優(yōu)于部分醫(yī)生,但這并不意味著 AI 可以取代醫(yī)生的決策。相反,Goh 強(qiáng)調(diào),在使用 AI 工具時(shí),醫(yī)生仍需保持監(jiān)督和判斷。此外,醫(yī)生在診斷時(shí)可能會(huì)出現(xiàn)固執(zhí)的傾向,已經(jīng)形成的初步診斷可能會(huì)影響他們對(duì) AI 建議的接受程度,這也是未來研究需要關(guān)注的方向。

在醫(yī)療診斷的過程結(jié)束后,醫(yī)生還需要回答一系列新問題,例如 “如何進(jìn)行正確的治療步驟?” 和 “需要進(jìn)行哪些測試以指導(dǎo)患者下一步的行動(dòng)?” 這表明 AI 在醫(yī)療領(lǐng)域的應(yīng)用仍有廣闊的前景,但仍需深入探索其在實(shí)際臨床中的有效性和適用性。

劃重點(diǎn):

?? 研究顯示,使用 ChatGPT 的醫(yī)生在診斷方面僅略高于傳統(tǒng)方法的醫(yī)生,未顯著提高效果。

?? ChatGPT 獨(dú)立診斷的得分為90%,表現(xiàn)出色,但仍需醫(yī)生的監(jiān)督和判斷。

?? 未來需要更多研究來探討如何優(yōu)化 AI 在醫(yī)療診斷中的應(yīng)用,以提高其有效性。