蛋白質(zhì)的新“折疊”!DeepMind重磅推出家族新成員AlphaFold
通過(guò)阿爾法折疊,提前十年檢測老年癡呆就容易多了。
人工智能領(lǐng)域第一大家族,來(lái)自DeepMind的Alpha家族最喜歡做的事情就是出其不意。
它們所有的小確幸都是,意料之中、精彩尤甚。
比如之前一戰成名的AlphaGo、后續傲嬌的AlphaZero,以及這兩天剛剛加入家族戰隊的AlphaFold,中文封號為,阿爾法折疊。
生物醫學(xué)領(lǐng)域,一向都是冷靜與熱情并存,而這位AI新寵兒AlphaFold的性格雖然還不明朗,但至少目前看來(lái),勢必會(huì )引發(fā)生物醫學(xué)領(lǐng)域新一輪的研究加速。
“小奇妙”阿爾法折疊
據DeepMind介紹,阿爾法折疊這項成果的重大意義就在于,你給它一段基因序列(生物學(xué)上稱(chēng)其為蛋白質(zhì)一級結構),在電腦上跑一下,就可以成功對這種蛋白質(zhì)建模。
看似簡(jiǎn)單,但意義非凡。
在過(guò)去五十年,和阿爾法折疊起到相同功能的技術(shù)有冷凍電子顯微鏡、核磁共振或X射線(xiàn)晶體學(xué)等實(shí)驗技術(shù)。單看儀器,它們就需要高昂的價(jià)格,但最重要的是,其實(shí)驗成本也很高,需要專(zhuān)人做大量的實(shí)驗,器材損耗不說(shuō),實(shí)驗用料就要花費數萬(wàn)美元。
花錢(qián)不說(shuō),最主要的是,整個(gè)過(guò)程太慢,需要耗費研究者幾年甚至數十年的光陰。
有了阿爾法折疊就不一樣了,生物學(xué)家再也不用在實(shí)驗器材面前耗費數十年的光陰,只需要簡(jiǎn)單錄入數據就好。
當然,阿爾法折疊的好處不僅這么點(diǎn),最終它還是惠及到我們普羅大眾的身上。
以老年癡呆癥(學(xué)名為阿爾茨海默氏癥)為例,它在人體的潛伏期長(cháng)達十幾年之久,且病因復雜,以目前的醫學(xué)技術(shù),臨床上甚至很難在發(fā)病前幾年檢測出這一疾病。
在生物學(xué)研究上,科學(xué)家普遍認為蛋白質(zhì)的變化是引發(fā)老年癡呆的病因。換句話(huà)說(shuō),老年癡呆患者的某一部分蛋白質(zhì)長(cháng)得一定和正常人不一樣。但是由于我們的研究速度太慢,所以生物學(xué)家不知道身體中所有的蛋白質(zhì)形態(tài),因此檢測哪一部分不一樣就難如登天。
想象一下,通過(guò)阿爾法折疊,提前十年檢測老年癡呆就容易多了,只要通過(guò)電腦看下蛋白質(zhì)長(cháng)得是否有差異就可以了。
人工智能對蛋白質(zhì)結構的“深度寵愛(ài)”
這一次,讓阿爾法折疊一戰成名的還是一項比賽。
在1994年,為了促進(jìn)研究和衡量最新方法在提高預測準確性方面的進(jìn)展,蛋白質(zhì)結構預測技術(shù)關(guān)鍵評估社區范圍實(shí)驗(CASP)的雙年度全球競賽被設立。演變至今,其比賽結果已經(jīng)成為行業(yè)標準。
雖然沒(méi)有AlphaGo當年成名那么壯觀(guān),但作為阿爾法家族的一員,阿爾法折疊一出手就是不凡。在今年的CASP比賽上,它不出所料的成功拿到了第一。
據DeepMind官網(wǎng)上的介紹,基于深度神經(jīng)網(wǎng)絡(luò ),他們設計了兩種方法以用來(lái)構建完整而精確的蛋白質(zhì)結構。
首先,他們先采集氨基酸對之間的距離和連接這些氨基酸的化學(xué)鍵之間的角度數據,接著(zhù)將這些數據設計成用以評估蛋白質(zhì)結構準確度的分析工具。
使用這一分析工具,研究團隊想出第一種方法,就是在現有蛋白質(zhì)數據庫里找到最匹配的蛋白質(zhì),如果找不到,他們就基于最接近的搜索結構上,用新的基因片段不斷替換,以創(chuàng )造出匹配要求的新結構。
而這第二種方法要更簡(jiǎn)單一些。據他們介紹,研究人員主要用的就是梯度下降 -a數學(xué)技術(shù),它的精度相較于第一種會(huì )更高一些。相較于第一種方式,這種技術(shù)一步就可以預測整個(gè)蛋白質(zhì)鏈,而不用經(jīng)歷組裝的過(guò)程,整個(gè)過(guò)程更簡(jiǎn)單。
DeepMind沒(méi)有公布更多細節,但經(jīng)過(guò)這樣“簡(jiǎn)單”的設計,奇跡就這樣發(fā)生了。
最后,科普來(lái)了
在人體內,蛋白質(zhì)是一種神奇的存在。
眾所周知,蛋白質(zhì)是構成人體結構的主要成分,其含量?jì)H次于水,約占一個(gè)人體重的五分之一。我們身體所要執行的幾乎所有功能,包括肌肉的收縮與拉伸、身體對光線(xiàn)的感知和食物的轉化,都需要蛋白質(zhì)在其中起關(guān)鍵作用。
而科學(xué)家指出,蛋白質(zhì)的結構很大程度上決定了一種蛋白質(zhì)的特性,因此研究蛋白質(zhì)3D結構的重要性就顯而易見(jiàn)了。在我們的身體里,這樣的案例比比皆是,如構成我們免疫系統的抗體蛋白質(zhì)是“Y形”的;膠原蛋白的形狀像繩索;用于基因編輯的CRISPR和Cas9,它們則像剪刀一樣。
但是純粹從基因序列只能夠找出蛋白質(zhì)的三維形狀是一項復雜的任務(wù),按照傳統的研究方法,科學(xué)家需要從一級結構、二級結構來(lái)一層層研究,花費幾十年甚至千百年才能夠完全建立蛋白質(zhì)的形態(tài)模型。
而阿爾法折疊的出現,讓生物學(xué)家省去了不少功夫。
在DeepMind官網(wǎng)上,他們是這么介紹這一重大成果的面世的:“我們很高興與大家分享DeepMind在展示人工智能研究如何推動(dòng)和加速新科學(xué)發(fā)現方面的第一個(gè)重要里程碑。DeepMind匯集了來(lái)自結構生物學(xué)、物理學(xué)和機器學(xué)習領(lǐng)域的專(zhuān)家們,通過(guò)跨學(xué)科方式將尖端技術(shù)運用其中,設計出了僅根據其基因序列就可以預測蛋白質(zhì)3D結構的AlphaFold。”
相關(guān)信息參見(jiàn)DeepMind官網(wǎng),點(diǎn)擊閱讀原文獲取鏈接。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
