AI新星系列報道之三|王本友:讓通用醫療人工智能惠及全球
醫療人工智能:全球科技紅利與未來醫療的希望
與通用人工智能(AGI)類似,通用醫療人工智能(Generalist Medical AI - GMAI)致力于構建一個通用的醫療基礎模型,該模型無需依賴大量任務特定數據,僅需少量數據即可適配多種醫療下游任務。GMAI的應用場景廣泛,涵蓋醫療咨詢、老人康養陪伴、家庭醫生、健康管理、醫生助理、臨床決策支持、醫療搜索引擎、輔助診斷等。
面對國家老齡化趨勢帶來的醫療壓力方面,通用醫療人工智能展現出巨大潛力。當前,國內醫務工作者負擔沉重,而民眾對醫療服務的期待與日俱增。通用醫療人工智能的應用,有望通過智能化手段提升效率和質量,緩解這一矛盾。
此外,GMAI的普及有望解決醫療資源分布不均問題。通過人工智能技術輔助改善落后地區的醫療條件,有望使非洲等地區的居民也能享受到與香港、日本等地相當的醫療服務,從而促進全球人口的醫療平權。
?
醫療大模型的初次嘗試
王教授團隊敏銳地捕捉到醫療行業中需求和資源分配的矛盾,將目光投向醫療領域。王教授指出,許多領域的專家精通某一專業,通常需要上萬小時的實踐,這種“經驗積累”對于人類來說是有限的。但大模型卻可以通過計算能力和數據處理來“模擬”無數小時的經驗積累,并實現知識的快速迭代。
這種優勢使得大模型在醫療等領域的應用前景廣闊。它能夠快速處理和分析海量數據,為醫生和患者提供更精準的決策支持。2023年2月,王教授團隊在深圳市大數據研究院和香港中文大學(深圳)的支持下,發布了全球首個垂直領域類ChatGPT大模型——華佗GPT。香港中文大學(深圳)副校長羅智泉院士在中華醫院信息網絡大會(CHINC)上正式發布這一成果,在國內外引起強烈反響,標志著醫療領域大模型應用的序幕正式拉開。
?
醫療大模型的技術探索
華佗大模型以其技術創新和卓越表現成為醫療AI領域的標桿。這些技術優勢不僅重塑了醫療AI的邊界,也為未來智能醫療的發展奠定了堅實基礎。
1、大規模醫療知識注入
由深圳市大數據研究院和香港中文大學(深圳)聯合開發的第二代華佗GPT成功通過了2023年十月份的國家執業藥師考試。二代華佗GPT將海量醫學數據整合到通用語言模型中,以提升其在醫療領域的專業性。通過統一數據格式和領域適應,模型(如HuatuoGPT-II)在中醫等復雜領域表現優異,甚至超越ChatGPT等主流模型,展現了強大的專業能力和泛化性能。

2023年開發的華佗GPT-II通過當年10月份的國家執業藥劑師考試
?
2、支持影像的多模態大模型
在醫療場景中,CT、MRI等影像理解至關重要,診斷皮膚病等情況也需要視覺能力。然而,現有醫療大模型普遍缺乏影像處理能力,限制了其在診斷中的應用。華佗GPT-Vision的發布填補了這一空白。其具備了卓越的視覺理解能力,不僅能夠理解和分析醫療影像,還能完成自動生成影像報告、輔助醫生發現潛在病癥等任務。這使得它在醫療影像處理上具備了更大的應用潛力。
開源版本的華佗GPT多模態醫療大模型在Huggingface平臺上的每月下載量最高值已突破20萬次。值得一提的是,從王本友團隊畢業的博士生陳志鴻,在斯坦福大學博士后的工作經歷之后,于硅谷獲得一筆不菲的融資,開啟了他在大模型醫療影像領域的創業之路,深圳播種的醫療大模型種子也在太平洋對岸的硅谷開枝散葉。

2024年七月份,華佗GPT的多模態版本在主流的MMMU多模態評測集的健康醫療賽道(MMMU Health & Medicine)上,華佗GPT在所有35個模型中取得了總排名第二(僅次于GPT-4v),開源模型中排名第一的優異表現
?
3、慢思考長推理的醫療大模型
HautuoGPT-o1首次將o1技術深度應用于醫療場景,顯著提升了醫學問題解答的準確性和可靠性,同時展示了o1技術在多領域廣泛應用的潛力。其獨特的“慢思考”能力,模擬了醫生在真實問診中的思維方式,通過不斷反思和修正診斷結論,為患者提供盡可能準確的診斷意見。此外,該模型實現了思維過程可視化,增強了模型可解釋性,幫助醫生在處理復雜病例時獲取更多診斷信息和靈感。

?HuatuoGPT-o1在發布一個月內獲得了巨大關注量,累計近1000stars
?
醫療大模型的應用探索
在深圳市龍崗區政府的大力支持下,王本友教授聯合龍崗區衛健局、國家健康醫療大數據研究院(深圳)、深圳市大數據研究院,成功將華佗GPT應用于導診場景。該應用不涉及具體的處方或診斷,具有更好的容錯性,有效提升了患者就醫體驗和醫療資源利用效率。
華佗GPT通過線上對話形式,為患者提供個性化導診服務,顯著降低了"掛錯號、找錯醫生"的發生率。其創新的語音輸入功能使老年群體也能便捷使用。
目前,華佗GPT已在龍崗區12家醫院上線使用,實現了龍崗各大區屬公立醫院區域全覆蓋。該系統面向龍崗區500萬人口12家公立醫院提供院前就診綜合性服務,截至目前使用人次達30萬,交互次數達52萬余次。是全國首個實現的全域多家醫院大模型部署聯調應用落地,是率先實現基于醫院本地知識庫與醫療大模型的深度融合,率先實現大模型在區域平臺快速應用落地的典型方案。華佗GPT還被納入《深圳市龍崗區創建人工智能全域全時應用示范區的行動方案(2024—2025年)》。
?
王本友教授指出,面對人口老齡化和醫療資源緊張的雙重挑戰,華佗GPT等AI醫療模型的應用將有效緩解醫療壓力。通過大模型的智能調控,可實現醫療資源的優化配置,提升診療效率,為患者提供更精準、及時的醫療服務。這一實踐不僅推動了醫療服務的智能化轉型,也為AI技術在醫療領域的深度應用提供了寶貴經驗。
?
?
讓醫療大模型惠及全球80億人口
目前醫療大模型的開發主要集中在中文和英文等主流語言。但在不使用這些語言的欠發達地區,其應用依然受限。針對這一問題,王本友教授團隊發布了Apollo系列多語言醫療大模型。Apollo通過收集不同語言的醫療語料,注入不同語言特定的醫療知識。值得一提的是,Apollo-2模型采用混合專家架構,成功將特定語言的醫療文化知識隔離于特定參數內,這一創新成果已獲得ICLR 2025的認可并收錄于相關論文中。

王本友教授開發的醫療大模型Apollo 2覆蓋到全球50中語言,可以惠及全球八十億人口
2023年8月,王教授的團隊與沙特阿拉伯的阿卜杜拉國王科技大學(KAUST)開啟了深度合作,攜手打造了專為阿拉伯語量身定制的大語言模型——AceGPT。AceGPT憑借其卓越的性能,迅速在全球范圍內嶄露頭角,成為目前全球最頂尖的阿拉伯語大模型。
華佗GPT和Apollo的問世猶如在醫療行業厚重的大門上輕輕撕開了一道小口,透出了一絲變革的曙光。隨著技術的持續精進與應用場景的不斷拓展,通用醫療人工智能將在未來對醫療行業掀起一場意義深遠的變革浪潮。應用場景將從龍崗區起步,逐步擴展至整個深圳,進而輻射至全國乃至全球,成為推動醫療行業變革的關鍵力量,為全球醫療事業的發展注入強大動力。
?
通用醫療人工智能的實踐路徑
當前,通用醫療人工智能的發展面臨兩大主要挑戰:一是數據壁壘問題,醫療機構之間的數據難以共享,跨醫院、跨區域的數據流通渠道尚未建立;二是應用場景對準確率的高要求,尤其是在處理復雜或罕見病例時,任何小錯誤都可能導致系統無法在實際醫療中應用。針對這些挑戰,王教授提出,通過醫療教育可能是實現通用醫療人工智能的關鍵途徑。具體來說,可以構建一個以AI模擬患者為核心的循環系統。AI首先應扮演“患者”的角色,而不是醫生。通過讓醫生或醫學生與AI患者進行交互診斷,積累經驗,再用這些經驗來訓練AI醫生。逐步在各個科室和醫院中建立標準化患者模型和評估體系,形成完整的數據集。同時,醫療教育帶來的醫生社區可以提供大量可靠的反饋和標注,形成一個持續優化的數據閉環。
通過這種方式積累的高質量醫患交互數據、評估標準和大量標注,可以幫助訓練更加可靠的醫療AI模型。這些模型將深度整合醫療專業知識和大模型的智能策略,并建立嚴格的質量控制體系。通過密集的人工標注和驗證,確保大模型輸出的可靠性和可信度。這種將專業知識與人工智能技術相結合的策略,不僅能讓AI更好地理解復雜的醫療情況,還能在實際應用中更加可靠和安全,為通用醫療人工智能的實用化提供一條穩健的發展路徑。簡而言之,通過讓AI先當“患者”,幫助醫生積累經驗,再用這些經驗訓練AI醫生,逐步建立起一個高質量的數據循環系統,推動醫療AI的落地和應用。
?
青年教授簡介

王本友,香港中文大學(深圳)助理教授和校長青年教授。主要研究方向為大語言模型和自然語言處理(NLP)。迄今為止,他曾獲得了SIGIR 2017最佳論文提名獎、NAACL 2019最佳可解釋NLP論文、NLPCC 2022最佳論文和歐盟瑪麗居里獎學金,擔任了EMNLP 2023的Website Chair和NLPCC 2023的Publicity Chair。其團隊開發了華佗GPT大模型,華佗GPT是首個垂直大語言模型,也是首個通過當年國家藥劑師考試的大模型,迄今有超過40萬次訪問,已部署在龍崗區全部12家公立醫院。在HuggingFace的累計模型下載量近百萬,GitHub的star數量逾萬次。
王本友教授的研究還得到了國內頭部企業的支持,包括華為火花獎、華為AI百校計劃、騰訊犀牛鳥計劃、滴滴蓋亞學者計劃等。相關研究工作得到了國內外諸多機構包括Meta、Google、微軟、AIlen AI、IBM、CMU、耶魯、UC Berkeley、商湯、字節、華為、阿里等使用或借鑒。
憑借在大模型領域的卓越貢獻,王本友教授團隊在全球范圍內獲得了廣泛認可。根據大模型權威網站Huggingface的排名,香港中文大學(深圳)王本友教授團隊在全球高校中排名第14位。