Nature Communications | 可用于臨床診斷的人工智能胃癌病理輔助診斷系統
中國解放軍總醫院、中國醫學(xué)科學(xué)院腫瘤醫院、北京協(xié)和醫院聯(lián)合透徹影像開(kāi)展的人工智能胃癌病理輔助診斷多中心研究成果「Clini...
中國解放軍總醫院、中國醫學(xué)科學(xué)院腫瘤醫院、北京協(xié)和醫院聯(lián)合透徹影像開(kāi)展的人工智能胃癌病理輔助診斷多中心研究成果「Clinically applicable histopathological diagnosis system for gastric cancer detection using deep learning」,在NatureCommunications發(fā)表,這是中國研究團隊在病理人工智能領(lǐng)域發(fā)表的頂級學(xué)術(shù)成果,也是全球首個(gè)可應用在復雜器官臨床病理診斷的人工智能系統。
胃癌是威脅人類(lèi)健康的惡性腫瘤之一,作為疾病診斷的“金標準”,病理診斷在早期篩查和精準診斷發(fā)揮著(zhù)重要的作用,準確的病理學(xué)診斷能夠顯著(zhù)地降低胃癌的死亡率。在全球范圍內,由于病理醫師人數的嚴重缺乏,加之胃部活檢和手術(shù)標本的樣本量大,胃部病理的診斷工作為病理科帶來(lái)了巨大的壓力,這一矛盾在胃癌發(fā)病率較高的亞洲愈加凸顯。為了滿(mǎn)足臨床治療的需求,快速提供診斷結果,病理醫生承擔著(zhù)超負荷的診斷工作量,誤診的發(fā)生在所難免。
隨著(zhù)數字病理技術(shù)的不斷普及,人工智能系統開(kāi)始被應用到病理輔助診斷中。由于病理影像具有文件體積大、信息豐富、切片制備與掃描多樣性強等特點(diǎn),因此病理圖像的自動(dòng)化分析難度遠高于自然圖像。雖然近些年來(lái)病理人工智能領(lǐng)域取得了一定的研究進(jìn)展,但是均無(wú)法達到臨床應用的標準。
可用于臨床診斷的病理輔助診斷系統,需要滿(mǎn)足以下幾個(gè)條件:(1)深度學(xué)習模型要能夠經(jīng)受住多款病理切片掃描儀所獲得數千張連續樣本的測試,敏感度應當接近100%,特異性超過(guò)80%。(2)通過(guò)人工智能系統的輔助,病理醫生在不延長(cháng)診斷時(shí)效的基礎上,能夠提高診斷的準確率。通過(guò)對模型的深入分析,我們可以知曉人工智能的優(yōu)勢與劣勢,從而讓病理醫生建立與人工智能的基礎信任。(3)人工智能輔助診斷系統需要經(jīng)過(guò)來(lái)自多家醫院病理切片的多中心驗證,以確保系統在不同醫院運行時(shí)的穩定性。
圖1. 深度學(xué)習模型訓練與測試框架
圖2. 基于iPad和Apple Pencil的標注工具
12名資深病理醫師參與了本研究的標注,其中10名主治/副主任醫師進(jìn)行一審和二審,所有樣本由石懷銀主任與宋志剛主任進(jìn)行最終的審核。整套標注流程在基于iPad和Apple Pencil的標注工具Thorough WisdomTM| 透徹匯智進(jìn)行,深度學(xué)習模型建立后,研究人員使用分布式病理輔助診斷系統Thorough InsightsTM| 透徹洞察進(jìn)行了解放軍總醫院(3212張)、醫科院腫瘤醫院(987張)與北京協(xié)和醫院(595張)臨床連續樣本的大規模測試。
圖3. 深度學(xué)習模型在解放軍總醫院數據上的表現
基于圖像分割技術(shù)的深度神經(jīng)網(wǎng)絡(luò )在解放軍總醫院的連續胃部樣本上達到了99.6%的敏感度和84.3%的特異性,僅有一張陽(yáng)性切片預測概率低于嚴格的閾值,根據雙閾值策略,被劃入待審核樣本,交予病理醫師審核。在所有樣本上,人工智能系統均能夠以較高的敏感度提示出癌變區域,從而防止漏診的發(fā)生。通過(guò)對比模型在三款病理切片掃描儀上的表現,可以看到模型均表現出極高的敏感度和超過(guò)80%的特異性。這表明系統具有良好的兼容性,在采用不同品牌的掃描儀的醫院終端均可以使用。
人工智能系統不僅可以作為輔助病理醫師的工具,而且可以提供有效的第二意見(jiàn)。在病理診斷中,疑難樣本通常會(huì )使用免疫組化在進(jìn)行更深入的診斷。深度學(xué)習模型在這些樣本上能夠達到超過(guò)80%的準確率,并正確提示出了高風(fēng)險區域,指導病理醫師執行免疫組化等進(jìn)一步診斷。
圖4. 多中心測試結果
經(jīng)過(guò)多中心測試,深度學(xué)習模型在醫科院腫瘤醫院與北京協(xié)和醫院的樣本上,能夠達到接近100%的敏感度和超過(guò)93%的特異性,穩定性卓越。
為了驗證人工智能系統在臨床診斷中的表現,研究團隊邀請了12名初級病理醫生參與了人機協(xié)同測試。12名醫生被隨機分為顯微鏡組、數字切片組與人工智能輔助組,并施加了不同強度的壓力(不限制診斷時(shí)間 vs. 限制一個(gè)小時(shí)的診斷時(shí)間)。研究發(fā)現,加入時(shí)間約束后,顯微鏡組與數字切片組的醫生均呈現出漏診率的增加,而人工智能的輔助顯著(zhù)提升了醫生診斷的穩定性,診斷敏感度得以保障。
圖5. 人機協(xié)同實(shí)驗
對于發(fā)展中國家,由于病理醫師數目有限,人工智能系統能夠在有限的診斷時(shí)間內,保障診斷質(zhì)量。對于發(fā)達國家,系統能夠精確定位可疑區域,有效防止漏診的發(fā)生。目前,人工智能輔助診斷系統已在解放軍總醫院病理科大規模應用,未來(lái)將會(huì )成為病理診斷常規輔助工具,惠及越來(lái)越多的病理醫師。本研究所提出的方法論,適用于所有器官病理人工智能系統的建立,能夠幫助研究人員加速智慧病理的研發(fā)進(jìn)程,進(jìn)而造福更多的患者。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
