點(diǎn)內科技:基于3D深度學(xué)習自動(dòng)預測肺腺癌EGFR突變狀態(tài),預測精準度超過(guò)傳統影像組學(xué)
點(diǎn)內科技與多單位聯(lián)合研究成果《基于3D深度學(xué)習自動(dòng)預測肺腺癌EGFR突變狀態(tài)》登上Cancer Medicine封面。
2019年7月,國際期刊CancerMedicine以封面文章的形式,刊登了點(diǎn)內科技、復旦大學(xué)附屬華東醫院、上海交通大學(xué)等多單位的最新聯(lián)合研究成果,《基于3D深度學(xué)習自動(dòng)預測肺腺癌EGFR突變狀態(tài)》,研究顯示預測精準度超過(guò)傳統影像組學(xué)。
基于3D深度學(xué)習自動(dòng)預測肺腺癌EGFR突變狀態(tài),預測精準度超過(guò)傳統影像組學(xué)
肺癌是腫瘤相關(guān)死亡的首因[1],肺癌患者中80%為非小細胞肺癌(NSCLC),腺癌為其最常見(jiàn)的病理類(lèi)型[2]。近數十年來(lái)基于基因組學(xué)而發(fā)展的針對驅動(dòng)基因的靶向治療,如靶向特定表皮生長(cháng)因子受體(EGFR)突變的酪氨酸激酶抑制劑(TKI)吉非替尼、靶向ALK基因的TKI 克唑替尼等,已成為肺癌精準醫學(xué)不可或缺的重要組分[3]。然而,對于無(wú)EGFR突變或非ALK陽(yáng)性的肺癌患者,靶向治療卻并無(wú)臨床獲益,有時(shí)還可能導致PFS縮短以及不必要的醫療支出[4],因此,選擇靶向藥物前需要提前明確驅動(dòng)基因狀態(tài)。此外,EGFR TKI治療期間可能出現EGFR T790突變而導致耐藥,出現病情進(jìn)展,因此,也需要動(dòng)態(tài)監測相關(guān)基因的突變狀態(tài)以調整治療藥物[5]。
對活檢或外科手術(shù)切除后的樣本進(jìn)行突變檢測是明確EGFR突變類(lèi)型的標準手段,但取樣的侵入性、為監測治療所必須的反復取樣等問(wèn)題,以及DNA質(zhì)量不佳、腫瘤異質(zhì)性、患者床位周轉時(shí)間、檢測費用等諸多難題限制了分子檢測的推廣,也一定程度上影響了肺癌精準醫療在臨床實(shí)踐中的推廣規模[6-9]。
腫瘤的表型源于特定的基因型,因此,通過(guò)甄別特定表型來(lái)預測基因型是一種潛在可行的手段。已有研究顯示,特定的影像組學(xué)特征與EGFR突變類(lèi)型相關(guān)[10,11]。然而,傳統影像組學(xué)面臨諸多挑戰,如在檢測、分隔、提取特征等過(guò)程中大量依賴(lài)手工操作,費時(shí)費力;不同讀片者之間的可復制性較低。
近年來(lái)以深度卷積神經(jīng)網(wǎng)絡(luò )為代表的深度學(xué)習在醫學(xué)圖像計算方面顯示出令人難以置信的優(yōu)越表現,并在很大程度上降低了人工操作的必要性。此前,點(diǎn)內科技聯(lián)合復旦大學(xué)附屬華東醫院和上海交通大學(xué)SJTU-UCLA機器感知與推理聯(lián)合研究中心等利用3D深度學(xué)習技術(shù),成功證明了3D深度學(xué)習在預測肺腺癌侵襲性方面的有效性和效能,準確率高達88%[12]。受其鼓舞,點(diǎn)內科技再次與華東醫院李銘、Hua Yanqing團隊、以及上海交通大學(xué)SJTU-UCLA機器感知與推理聯(lián)合研究中心、上海第十人民醫院、同濟大學(xué)同濟醫院等合作,探索了3D深度學(xué)習在基于CT影像預測EGFR突變方面的潛能。研究結果近期發(fā)表于 Cancer Medicine (IF=3.2,TowardautomaticpredictionofEGFR mutationstatusinpulmonaryadenocarcinomawith3Ddeeplearning),華東醫院李銘、滑炎卿教授為論文的共同通訊作者,華東醫院趙偉和上海交大楊健程為共同第一作者。
研究流程
研究的影像數據來(lái)自華東醫院CT數據庫(HdH數據庫579例,包括訓練集348例、開(kāi)發(fā)集116例和測試集115例)。為測試所建模型的通用性,從獨立的腫瘤公共影像庫TCIA選取37例肺結節也作為測試集。全部病例均由人工進(jìn)行定位、分割和標記EGFR突變/野生型狀態(tài)。通過(guò)訓練集采用3D DenseNets深度學(xué)習方法訓練,采用強大的數據擴增技術(shù)mixup以提升規范化/正則化(regularization),通過(guò)有監督的端到端學(xué)習模型完成擬合。與此同時(shí),對全部影像數據進(jìn)行傳統的影像組學(xué)分析,與3D深度學(xué)習對照,計算成對關(guān)聯(lián)系數分析二者的關(guān)聯(lián)性。
結果顯示,3D深度學(xué)習在預測EGFR突變狀態(tài)方面明顯優(yōu)于傳統的影像組學(xué)方法(P=0.021),3D深度學(xué)習對HdH數據庫測試集和公共測試集測試的AUC分別為75.8%和75.0%(表1)。更重要的是,不同于傳統影像組學(xué)要求人工對感興趣的病灶部位進(jìn)行分割,非常耗時(shí)耗力,3D深度學(xué)習的興趣部位與肺結節病變部位有良好的一致性。
研究者對提取的401個(gè)傳統影像組學(xué)特征(上圖A)與從3D DenseNets提取的114個(gè)深度學(xué)習影像組學(xué)特征(上圖C)進(jìn)行分析發(fā)現,3D深度學(xué)習方法提取的特征較通過(guò)人工提取的特征更具代表性,因此聚類(lèi)分析的結果更佳。研究首次用矩陣的方法進(jìn)一步比較了深度學(xué)習特征與傳統影像組學(xué)特征(上圖B),分析發(fā)現,深度學(xué)習特征與傳統影像學(xué)之間存在著(zhù)強關(guān)聯(lián),從分類(lèi)性能的ROC曲線(xiàn)方面,深度學(xué)習特征的敏感性和特異性更高,這說(shuō)明深度學(xué)習通過(guò)增強的影像組學(xué)方式,從魯棒性(robustness)、緊密度(compactness)和表達能力(expressiveness)方面可以發(fā)揮強大的預測效能。
深度學(xué)習系統在各數據庫的預測表現匯總
研究者發(fā)展的這一深度學(xué)習體系實(shí)現了非侵入性、自動(dòng)預測肺腺癌EGFR突變型,從而通過(guò)明確EGFR靶向治療的獲益人群,輔助肺腺癌的臨床治療決策。研發(fā)過(guò)程中整合了近期關(guān)于深度監督學(xué)習的一些進(jìn)展,比如深度連接、mixup技術(shù)等,從而顯著(zhù)降低了過(guò)度擬合等風(fēng)險。由于這一方法因無(wú)需對肺結節進(jìn)行精細的分隔,因此非常節省勞動(dòng)力,同時(shí),因為采用的學(xué)習算法的增強特性,可望獲得更加穩定的表現。
研究者稱(chēng),未來(lái)還需進(jìn)一步對成果進(jìn)行驗證,比如本研究EGFR突變是通過(guò)ARMS-PCR檢測的,未來(lái)還需對有二代測序的EGFR突變數據的樣本進(jìn)行驗證;目前的模型僅納入了CT影像信息,未來(lái)還需整合更多的臨床信息如病理、血檢驗結果、蛋白組學(xué)等。
2019年7月刊 CancerMedicine封面
關(guān)于點(diǎn)內科技
點(diǎn)內科技成立于2016年4月,是一家創(chuàng )新型高科技企業(yè),總部位于中國上海。公司核心管理團隊均來(lái)自世界500強制藥及醫療設備企業(yè);核心技術(shù)團隊實(shí)力雄厚,多位核心研究人員為國家中組部千人計劃成員和美國科學(xué)家榮譽(yù)協(xié)會(huì )( Sigma ⅪSociety)會(huì )員。
此外,公司匯聚了一批人工智能行業(yè)、深度學(xué)習領(lǐng)域及醫療行業(yè)的資深專(zhuān)家學(xué)者,通過(guò)國內肺部專(zhuān)科醫院和大三甲醫院近50000例肺部CT數據的訓練,將人工智能與大數據技術(shù)緊密結合,利用部署在地面端的人工智能輔助診斷系統和云端的智能引擎系統,為醫生提供針對肺部結節的早期輔助診斷和治療建議的產(chǎn)品。
2017年,參加“2017天池醫療AI大賽——肺部結節智能診斷大賽”,點(diǎn)內科技從來(lái)自全球的2887支隊伍中脫穎而出,獲得大賽第一名。
2018年8月,點(diǎn)內科技順利獲得國家CFDA醫療器械注冊證(二類(lèi))。同年,點(diǎn)內科技作為肺結節輔助診斷處理軟件(AI類(lèi))送檢企業(yè),參與中檢院主導的肺部結節標準數據庫建立以及AI產(chǎn)品相關(guān)標準制定,或將成為國內首批獲準CFDA三類(lèi)注冊證的AI企業(yè)。
【參考文獻】
1.Bray F, Ferlay J, Soerjomataram I, Siegel RL, Torre LA, JemalA. Global cancer statistics 2018: GLOBOCAN estimates of incidenceand mortality worldwide for 36 cancers in 185 countries. CACancer J Clin. 2018;68(6):394-424.
2.Ettinger DS, Wood DE, Aisner DL, et al. Cell lung cancer, Version5.2017, NCCN Clinical Practice Guidelines in Oncology. J NatlCompr Canc Netw. 2017;15(4):504-535.
3.NCCN臨床實(shí)踐指南:非小細胞肺癌(2019.V4)
4.Mok TS, Wu Y-L, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma. N Engl J Med.2009;361(10):947-957.
5.中國臨床腫瘤學(xué)會(huì )腫瘤生物標志物專(zhuān)家委員會(huì )《中國非小細胞肺癌患者EGFR T790M基因突變檢測專(zhuān)家共識》制定專(zhuān)家組 中國非小細胞肺癌患者EGFR T790M基因突變檢測專(zhuān)家共識 中華醫學(xué)雜志2018,98(32:2544-51)
6.Bedard PL, Hansen AR, Ratain MJ, Siu LL. Tumour heterogeneity in the clinic. Nature. 2013;501(7467):355-364.
7.Lindeman NI, Cagle PT, Beasley MB, et al. Molecular testing guideline for selection of lung cancer patients for EGFR and ALK tyrosine kinase inhibitors: guideline from the College of American Pathologists, International Association for the Study of Lung Cancer, and Association for Molecular Pathology. J Mol Diagn. 2013;15(4):415-453.
8.Kim TO, Oh IJ, Kho BG, et al. Feasibility of re-biopsy and EGFRmutation analysis in patients with non-small cell lung cancer.Thorac Cancer. 2018;9(7):856-864.
9.Kobayashi K, Naoki K, Manabe T, et al. Comparison of detection methods of EGFR T790M mutations using plasma, serum, and tumor tissue in EGFR-TKI-resistant non-small cell lung cancer.OncoTargets Ther. 2018;11:3335-3343.
10.Yip S, Kim J, Coroller TP, et al. Associations between somatic mutations and metabolic imaging phenotypes in non‐small cell lungcancer. J Nucl Med. 2017;58(4):569-576.
11.Rios Velazquez E, Parmar C, Liu Y, et al. Somatic mutations drive distinct imaging phenotypes in lung cancer. Can Res. 2017;77(14):3922-3930.
12.Zhao W, Yang J, Sun Y, et al.3D Deep Learning from CT Scans Predicts Tumor Invasiveness ofSubcentimeter Pulmonary Adenocarcinomas. Cancer Res. 2018 Dec 15;78(24):6881-6889.
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
