北大課題組改進(jìn)ECC測序法,利用信息冗余大幅增加測序精度
ECC編碼和解碼策略已被廣泛應用在信息通訊和存儲等其它領(lǐng)域中。
近日,北京大學(xué)黃巖誼教授課題組在DNA測序方法的研究上取得重要突破,該團隊在此前熒光發(fā)生測序技術(shù)基礎上發(fā)展了一種全新概念的測序方法——糾錯編碼(簡(jiǎn)稱(chēng)ECC)測序法。據了解,ECC測序法采取一種獨特的邊合成邊測序(SBS)策略,利用多輪測序過(guò)程中產(chǎn)生的簡(jiǎn)并序列間的信息冗余,大幅度增加了測序精度。
其中,DNA測序是指分析特定DNA片段的堿基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)與鳥(niǎo)嘌呤的(G)排列方式。值得注意的是,快速的DNA測序方法將會(huì )極大推動(dòng)生物學(xué)和醫學(xué)的研究和發(fā)現,因此,在保證測序的速率基礎上,如何提高和確保DNA測序過(guò)程的精度也是研究的關(guān)鍵。
據悉,ECC測序法以熒光發(fā)生測序技術(shù)為基礎,其中,熒光發(fā)生測序技術(shù)的巧妙之處在于在DNA互補鏈合成時(shí)可以釋放同所延伸核苷酸數目相等的熒光分子,利用這一反應可以實(shí)現低錯誤率的SBS。
A、C、T、G4種堿基,抽象成圖中4個(gè)不同顏色不同結構的鏤空立方體,可以通過(guò)3種正交的方式解構為兩兩組合。在ECC測序中,每個(gè)堿基均通過(guò)3次“投影”進(jìn)行了測量,再通過(guò)3個(gè)投影重構出原來(lái)的序列。
在ECC測序法中,序列信息的冗余來(lái)自“對偶堿基熒光發(fā)生”SBS測序流程,該流程通過(guò)對測序試劑按對偶堿基分為兩兩匹配的三組,并對待測DNA序列進(jìn)行三輪獨立測序,繼而產(chǎn)生三條互相正交的簡(jiǎn)并序列編碼。
而這三條編碼可互為校驗,后續不但能夠通過(guò)解碼推導出真實(shí)堿基序列信息,而且具備對單輪測序錯誤位點(diǎn)的校正能力。
目前,ECC編碼和解碼策略已被廣泛應用在信息通訊和存儲等其它領(lǐng)域中,并被證實(shí)可以有效檢測和糾正數據傳輸或存儲時(shí)發(fā)生的錯誤。此次黃巖誼團隊在測序技術(shù)中首次引入冗余編碼概念,將進(jìn)一步推動(dòng)通信和存儲技術(shù)的發(fā)展。據了解,相關(guān)研究成果已經(jīng)公布在《自然》雜志上。
最后,記得關(guān)注微信公眾號:鎂客網(wǎng)(im2maker),更多干貨在等你!
硬科技產(chǎn)業(yè)媒體
關(guān)注技術(shù)驅動(dòng)創(chuàng )新
