透徹影像王書(shū)浩:用AI“復制”大腦,彌補病理醫生的9萬(wàn)缺口
按照行業(yè)需求,國內臨床需要配備10萬(wàn)名病理醫生,但注冊在案僅1.2萬(wàn)人。
2018年全球新增癌癥診斷病例約1910萬(wàn),死亡病例約960萬(wàn);約1/5男性和1/6女性在一生中會(huì )罹患癌癥,1/8男性和1/11女性因癌癥而死亡——這組驚人的數據,來(lái)自于WTO下屬“國際癌癥研究機構”公布的最新全球癌癥數據報告,調查范圍覆蓋全球185萬(wàn)個(gè)國家和地區,涉及36種癌癥的發(fā)病率和死亡率。
“談癌色變”已經(jīng)成為了一種常態(tài)。而在臨床中,癌癥的診斷、治療也依舊是醫學(xué)難題。
癌癥診斷急缺病理醫生,但AI可以“復制”大腦
在一些醫療影視劇中,借助CT、X光等手段,醫生總是能夠發(fā)現腫瘤的存在,然后會(huì )進(jìn)行手術(shù)切除。不過(guò),癌癥診斷就這么簡(jiǎn)單嗎?當然不是。這其中的關(guān)鍵在于“病理診斷”。
“病理不一樣,癌的形態(tài)在這里可能成千上萬(wàn)種,識別方面要復雜得多。”透徹影像聯(lián)合創(chuàng )始人兼技術(shù)總監王書(shū)浩稱(chēng)。
圖 | 透徹影像聯(lián)合創(chuàng )始人兼技術(shù)總監王書(shū)浩
作為一種篩查手段,CT、X光是合格的,但論起診斷,“相比于病理切片,CT片、X光片是灰階圖像,信息量比較小。”
一般情況下,癌的確診需要經(jīng)過(guò)病理診斷,所需要識別的內容比CT、X光要復雜許多。而在醫學(xué)界,病理被稱(chēng)為“金標準”,病理醫生則被稱(chēng)為“醫生的醫生”,是腫瘤類(lèi)疾病的最終裁決者。
在中國,每年約有近億張病理切片的診斷需求,與此相對的,是病理醫生的“急缺”,培訓周期長(cháng)、勞動(dòng)報酬低等成為阻礙病理科新生力量增長(cháng)的主要原因。
“按照行業(yè)需求,國內臨床需要10萬(wàn)名病理醫生,然而注冊在案的僅有1.2萬(wàn)名,缺口太大。”王書(shū)浩表示。并且這1.2萬(wàn)名病理醫生的水平也存在一定的差距,對于當前的癌癥診斷無(wú)疑是雪上加霜。
這個(gè)缺口如何進(jìn)行填補?王書(shū)浩提出一個(gè)比較通俗的比喻,“AI類(lèi)似于將一個(gè)人的大腦‘復制’,并且復制多份。”
“這樣做可以帶來(lái)三個(gè)好處:第一,AI識別的水平高于病理醫生平均水平,相當于我們可以將高水平的診斷‘復制’到許多醫院;第二,AI能夠查閱每個(gè)角落,不會(huì )產(chǎn)生疲勞,不易漏診;第三,相比于人類(lèi)醫生,AI更為客觀(guān)。”
數據積累、模型識別、分布式計算“并駕齊驅”,推動(dòng)病理科智能化
一般情況下,所有算法模型的第一步都是從數據采集開(kāi)始,繼而搭建并訓練模型,最后在應用場(chǎng)景落地。這其中,數據采集對于多數初創(chuàng )公司而言就是一件較為困難的事情,中間涉及到數據多樣性、標注準確率、倫理等多方多面,尤其是以醫療為代表的一干行業(yè)。
針對這一問(wèn)題,除了與醫院合作之外,既有開(kāi)源數據是不少公司的選擇。不過(guò),“基于既有的開(kāi)源數據集進(jìn)行建模,然后產(chǎn)品就可以面世,我覺(jué)得這是很荒唐的。”王書(shū)浩表示,“產(chǎn)品需要與客戶(hù)進(jìn)行溝通、開(kāi)展需求調研。另外,既有開(kāi)源數據集存在數據量小、質(zhì)量低、標注不準確、與應用場(chǎng)景差異大等問(wèn)題,基于這類(lèi)數據集進(jìn)行建模,無(wú)法產(chǎn)出合格的產(chǎn)品。”
在數據采集方面,透徹影像的做法是跟醫院緊密合作。王書(shū)浩認識到數據是AI的入口,早在草創(chuàng )之初,透徹影像就打磨了一款為醫生設計的標注系統“ThoroughWisdom”。
醫生只需在PC端或是iPad端大致圈出病變區域,透徹影像的算法就會(huì )自動(dòng)完美勾勒出病變范圍。另外,“運用這套系統為我們積累的數據也已經(jīng)得到了數家頂級三甲醫院倫理委員會(huì )的許可。”王書(shū)浩稱(chēng)。
與該系統并駕齊驅的是透徹影像基于這些數據所開(kāi)發(fā)的診斷系統“ThoroughInsights”。系統將基于算法模型自動(dòng)圈出病變區域,并給出病變概率分布與癌占比等信息,病理醫生可以此為依據進(jìn)一步作針對性的檢查,從而提升效率。
圖 | 301醫院病理科副主任宋志剛正在使用“ThoroughInsights”
“兩套產(chǎn)品是聯(lián)動(dòng)的,如果醫生發(fā)現Insights模型對某些罕見(jiàn)案例的診斷效果不佳,會(huì )請主任進(jìn)一步確認,找出識別或預測有誤的根源,進(jìn)而在Wisdom系統中增加類(lèi)似案例的數據,繼續進(jìn)行標注,幫助系統不斷迭代。”王書(shū)浩表示。目前,透徹影像的項目重點(diǎn)集中在消化道癌癥、肺癌、前列腺癌、淋巴結清掃等方面。
這里有一個(gè)有趣的現象,在數字化變革愈加受到醫院推崇的現在,作為醫療重要一環(huán)的病理科卻是數字化進(jìn)度最緩慢的科室之一,背后的原因在于病理圖像的“大”,且一直以來(lái)沒(méi)有足夠的推動(dòng)力。
相比于2000 x 2000像素的X光片、512 x 512 x 截面數像素的CT片,病理圖像的大小通常為100kx 200k像素,以GB為存儲單位。對于普通計算機而言,病理圖像的存儲和運算都是有難度的。
因此發(fā)展至今,醫生觀(guān)察病理切片依舊依賴(lài)于顯微鏡,而電腦的唯一用處只是撰寫(xiě)病理觀(guān)察報告。這種模式下,在大型三甲醫院,平均每位病理醫生每天需要觀(guān)察200至300張病理切片,并撰寫(xiě)上百份的報告。
與此同時(shí),病理科也在經(jīng)歷從傳統病理到數字病理的轉型。數字病理將玻片電子化,所獲得的數字切片既可以在計算機上存儲和瀏覽,又可以通過(guò)網(wǎng)絡(luò )進(jìn)行傳輸。“一直以來(lái),教學(xué)講課和遠程診斷的數字切片需求量不足以成為病理科數字化的推動(dòng)力,而AI則對數字病理的普及有著(zhù)極大的推動(dòng)作用。如果病理切片掃描之后,能夠被計算機分析,得出輔助診斷結果,病理醫生們會(huì )非常愿意將之數字化。”王書(shū)浩稱(chēng)。
不過(guò)這種操作的背后也需要給力的系統,透徹影像的做法是打造分布式病理影像存儲和分析系統“ThoroughCore”,將病理圖像進(jìn)行“切分”、“分析”和“整合”。簡(jiǎn)單來(lái)說(shuō),系統中的每個(gè)GPU都將成為一個(gè)工作節點(diǎn),被切分的病理圖像塊將被分配至各個(gè)GPU計算,基于并行計算各自得出的結果將在最后被“整合”,從而生成最終結果,供病理醫生查看。基于“ThoroughCore”的核心算法,“ThoroughInsights”系統預測一張病理圖像僅需要不到20秒的時(shí)間。
最后
透徹影像的產(chǎn)品在這一年多來(lái)不斷穩定迭代優(yōu)化。今年1月初,他們針對胃癌的測試版系統已經(jīng)落地301醫院,公測版也已于本月發(fā)布,“我們會(huì )在4月份發(fā)布正式版產(chǎn)品。”王書(shū)浩說(shuō)道。
此外,病理診斷分為細胞病理診斷和組織病理診斷,而透徹影像也分別圍繞單個(gè)業(yè)務(wù)成立了公司。其中,北京公司專(zhuān)注于組織病理診斷,而專(zhuān)注于細胞病理診斷的公司則落戶(hù)南京,并成為南京圖靈人工智能研究院9大“人工智能+”簽約孵化項目之一,該研究院由圖靈獎唯一一位華裔獲獎?wù)咭ζ谥窃菏縿?chuàng )立。
【鎂客·請講】專(zhuān)注于報道科技創(chuàng )新項目;我們敞開(kāi)心扉面對每一位創(chuàng )業(yè)者,力求為您呈現一群鮮活、有性格的品牌和人物;我們傾聽(tīng)創(chuàng )業(yè)故事和人生經(jīng)歷、探討商業(yè)模式和行業(yè)趨勢、對接資本市場(chǎng)和供需雙方,以期為產(chǎn)業(yè)發(fā)展注入新的活力。
歡迎做客【鎂客·請講】,欄目合作請發(fā)送郵件至:post@im2maker.com
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
