AI 來襲:當「狼」叩響醫(yī)療之門
「我的三觀崩塌了」,當年的天下第一棋士柯潔,被 Google DeepMind 的 AlphaGo 打敗后如是說。當經(jīng)歷了 12 月 20 日在美中愛瑞腫瘤醫(yī)院的「人機大賽」,MDT(多學科診療)團隊與多個醫(yī)療 AI 模型的多輪較量后,我想我也能充分理解柯潔當時的感受。
8 個副高以上的醫(yī)生,都在頂級三甲醫(yī)院磨練多年,組成的 MDT 團隊,與豆包、百川、小荷、ChatGPT01、Google Gemini 五個國內(nèi)外知名 AI 模型,在完全相同的條件下進行了多輪較量,包含問診、體檢、實驗室及影像學檢查、診斷與鑒別診斷、治療計劃制訂、療效評估及后續(xù)治療等多個環(huán)節(jié),輪番交手,層層遞進。本來覺得信手拈來的勝利,結(jié)果卻大大出乎意料。AI 醫(yī)療的強勁表現(xiàn),讓醫(yī)生完全沒有了賽前想象白衣勝雪的瀟灑。從熱身比賽的結(jié)果看(如圖),之后的比賽恐怕得打起十二萬分的精神來應對 AI 的挑戰(zhàn)。
目睹所有過程的我,也是醫(yī)生的我,和參賽的其他醫(yī)生一樣心情失落,感受尤為強烈。六大門派圍攻光明頂,我感覺自己才是被打敗的魔教。晚餐一桌醫(yī)生完全沒有往日歡快的氣氛,盡管誰都不明說,但總感覺一股沉郁的氣氛漂浮在房間內(nèi)。
從比賽結(jié)果看,奪冠的 ChatGPTo1 各方面綜合能力均衡,遠超其他 AI 模型,在各輪比賽均穩(wěn)定、高效輸出,在總結(jié)歸納的條理性以及邏輯閉環(huán)的嚴密性等方面表現(xiàn)驚艷,在提供腫瘤診治的同時關(guān)注患者營養(yǎng)、心理支持,并可以通過文字表達人文關(guān)懷,充分彰顯了人工智能于數(shù)據(jù)處理和分析的強勁實力。銅牌選手 MDT 戰(zhàn)隊憑借深厚專業(yè)素養(yǎng)、豐富臨床經(jīng)驗和多學科協(xié)作優(yōu)勢,在面對復雜的腫瘤病例時,在病情的綜合分析上盡顯專業(yè)深度,能夠有條不紊地逐層推進,在精準診斷、治療決策方面明顯優(yōu)于 AI 模型,通過綜合考量患者獲益與風險,并結(jié)合最新的文獻與研究數(shù)據(jù),為患者的后續(xù)治療提出了創(chuàng)新性的前沿治療方案,算是勉強維護了人類的尊嚴。
在行文風格上,AI 更像是嘮叨的大伯,事無巨細逐一道來,講究的是滿漢全席全無遺漏;MDT 團隊更像干練的小叔,講究簡單明了,直擊要害,另外私家菜館還經(jīng)常有創(chuàng)新菜品,例如經(jīng)常在診療過程中常常結(jié)合最新發(fā)表的文獻。某種程度上也許人類需要打字,人類的天性忽略了面面俱到的完善陳述。然而滿漢全席看上去繁瑣絮叨,15-30 秒就上齊了菜品;私家菜館盡管廚師眾多,菜品干練,卻需要 AI 的 30-50 倍的時間。尤其是到了熱身賽的后程階段,人類的疲乏已經(jīng)顯而易見,我卻看到 AI 三下五除二出了答案,然后抄起雙手端在胸前,冷冷地看著人類的余勇可賈。
AI 的這種冷靜是優(yōu)點,也許就是缺點。醫(yī)療應該是有溫度專業(yè)。熱身賽之后組織方、評委專家和 MDT 戰(zhàn)隊以及 AI 戰(zhàn)隊的參賽人員共同就比賽流程和評審規(guī)則展開了深入探討。關(guān)于比賽評分標準的設(shè)計遺憾顯而易見,評分標準主要傾向于對邏輯推理合理性和內(nèi)容輸出完整性的評價,而對于分期準確和治療方案的創(chuàng)新價值沒有給予應當?shù)臋?quán)重側(cè)重。此外作為人類,醫(yī)患之間在相互交流情緒的流轉(zhuǎn),關(guān)心、傾訴,人文關(guān)懷不是用簡單話術(shù)就可以替代,而需要更多心靈感應。更多的時候,好的醫(yī)患關(guān)系是并肩戰(zhàn)斗的親人,這種體會是冷靜的 AI 無法做到的。其中一個細節(jié),在某個階段可能需要穿刺,AI 醫(yī)生只會面無表情地吐出「去穿刺」的決策,人類醫(yī)生,我們的 MDT 團隊卻貼心地考慮到了「如果病人不同意穿刺」之后的種種應對。另一個細節(jié)是,人類醫(yī)生經(jīng)常在診療過程中呈現(xiàn)的直覺和靈感,是 AI 身上不大能看到的。例如比賽中病人后期出現(xiàn)的腸道疑似病變,與肝部轉(zhuǎn)移灶的臨近關(guān)系,可以去考慮病理取材的優(yōu)先順序和檢查次數(shù),讓病人經(jīng)歷更少的痛苦。但 AI 考慮更多的是準確性和完善性,會導致更多的有創(chuàng)檢查和更多更久的時間。畢竟在時間變量面前,效率也是必須要時刻考慮的問題,某種程度上比準確完善性更加重要。
類似情況在 AI 圍棋發(fā)展到現(xiàn)在也能看到。在 AI 圍棋橫行天下之際,大概率你不會再看不到秀策與幻庵因碩的「耳赤一手」,也不能再體會吳清源和木谷實十番棋的蕩氣回腸了。圍棋復盤既往的高手國手棋圣棋神,恐怕也要在 AI 老師面前恭聽教誨。對于人類來說,少了更多的趣味和快樂。但這種現(xiàn)象 AI 在可窮盡的圍棋著法中也許可行,也許可接受,然而因為人體的奧秘和醫(yī)療的面向還存在眾多的未知領(lǐng)域,目前投喂式的 AI 訓練未必可以到達未知世界,我相信人類具備的溫暖在臨床醫(yī)療中還是會長久存在和必要。
整體來說,MDT 團隊和在本次比賽中表現(xiàn)突出的 ChatGPT o1 模型相比,還算得上旗鼓相當,能力各有側(cè)重。AI 模型在數(shù)據(jù)處理時效性、邏輯閉環(huán)與歸納總結(jié)方面更勝一籌,而 MDT 團隊則在臨床創(chuàng)新性和專業(yè)深度上更具優(yōu)勢。這種差異進一步表明,未來的比賽規(guī)則應更合理地調(diào)整評分權(quán)重,以全面反映雙方的特點。不過從發(fā)展角度看,AI 戰(zhàn)勝人類恐怕是遲早的事情。本次熱身賽中 ChatGPT O1 表現(xiàn)已經(jīng)足夠驚艷,然后前兩天 OpenAI 又推出 o3 模型系列,在 ARC-AGI(通用人工智能評估基準)上取得了驚人的高達 87.5% 的分數(shù),而人類才 85%,進化速度讓人瞠目結(jié)舌。我們彷佛可以看到硅基生命踏著碳基生命昂首闊步的前進步伐!
回到現(xiàn)實,我們也不必太過悲觀,總究還是需要活在當下。預測一下 AI 醫(yī)療今后的走向也許更有意義。當人類多學科的智慧深度與 AI 的高效全面、善于總結(jié)的優(yōu)勢相互有機結(jié)合時,必將腫瘤臨床診治提升到一個全新的高度,這是毫無疑問的。因此,擁抱 AI 是我們每一個醫(yī)生都應該有的態(tài)度,深度結(jié)合是不得不走的路,否則就會被時代的洪流所淘汰。我們需要探討的是如何結(jié)合,在我看來,無非是一個誰領(lǐng)導誰的問題。
DeepMind 初代 alphaGo 的時候,通過大量棋譜學習,人類不停投喂數(shù)據(jù)和資料并不斷訓練,已經(jīng)可以讓韓國大棋士李世石一敗涂地,但好賴人類利用盲點和 Bug 贏過一局。等到進化到 alphaZero 的時候,AI 已經(jīng)不需要人類投喂,自我訓練對局,創(chuàng)造出 AI 自有的定式走法,「金角銀邊草肚皮」已經(jīng)不是不可顛覆的法則,在這個階段,人類還沒意識到 AI 的進化高度,自信滿滿的柯潔迎戰(zhàn) AI,結(jié)果只能在落敗后抱頭痛哭。而我們知道,圍棋的頂尖高手,基本都是人類智商的天花板。但不妨礙柯潔把 AI 當作學習工具,還可以繼續(xù)提高自己的棋力,而達到?jīng)]有 AI 之前的高度。
諸如此類,在醫(yī)療 AI 上,相對低階的年輕醫(yī)生可以更加倚重 AI 去學習和提高,把臨床水平向科學規(guī)范先進方向前進,為廣大患者帶來更精準、更優(yōu)質(zhì)、更人性化的醫(yī)療服務(wù);相對高階醫(yī)生,應該利用好 AI 工具,向更多的未知領(lǐng)域出發(fā)。2024 年度諾貝爾化學獎獲得者 Demis Hassabis 和 John M. Jumper,他們利用 AlphaFold 構(gòu)建了全新蛋白質(zhì)結(jié)構(gòu),為人類在醫(yī)學領(lǐng)域打開了一扇新的天窗,就是最好的例證。畢竟在醫(yī)學領(lǐng)域還存在太多的未知。而如果抱殘守缺,不思進取,在日益強大的 AI 面前,所有的謬誤和錯漏會在陽光下無地自容。
本文寫畢當天,我又參加了抖音集團小荷健康聯(lián)合中國信通院、人民衛(wèi)生出版社舉辦的「醫(yī)療大模型真實場景診療能力評測暨面向用戶的人工智能+診療服務(wù)研討會」,大部分評委的感受與我們類似,AI 作為真實醫(yī)療基本達到了大約高年住院醫(yī)的水平,尤其是在問診初期部分。人們寄望于 AI 理解世界、感受世界,乃至創(chuàng)造世界,當下只能說 AI 在理解世界的階段,離感受世界還有相當距離,但目睹 AI 的進化速度,即便是創(chuàng)造世界也會是不久的將來。當下的 AI 還不是一個好醫(yī)生,但一個好醫(yī)生必須用好 AI。「沉舟側(cè)畔千帆過,病樹前頭萬木春」,AI 的到來不可避免,醫(yī)療也概莫能外,既然如此,伸頭一刀,縮頭也是一刀,還不如打開大門,擁抱一個新的世界。
作者:北京美中愛瑞腫瘤醫(yī)院徐仲煌院長