作為人類所需的食物、藥物、衣物和燃料,千百年來,植物在我們的日常生活中扮演著關(guān)鍵角色。如今,隨著分子技術(shù)的發(fā)展,全世界越來越多的科學(xué)家們將關(guān)注的焦點放在研究植物遺傳的多樣性和育種培養(yǎng)上。
根據(jù)最新估計,目前科學(xué)界已知植物的物種大約有40萬種,但迄今為止,科學(xué)界只測序了約600株植物品系(約225種種類)的基因組。既然植物研究在我們的生活中扮演著如此重要的角色,為何只有這么少的種類得到了測序?究其原因,與植物基因組大小多樣和復(fù)雜程度不無關(guān)系。
基因組大小多樣化
植物基因組的大小非常多樣,從61Mb的螺旋貍藻 (Genlisea tuberosa)到152Gb的重樓百合(Paris japonica),后者幾乎是人類基因組的50倍。此外,植物還表現(xiàn)出多種倍性(染色體拷貝),從二倍體——兩個拷貝,如擬南芥(Arabidopsis thaliana),到十倍體——十個拷貝,如草莓(Fragaria iturupensis)。由于傳統(tǒng)的短讀長技術(shù)通常產(chǎn)生150~300bp的讀長長度,這種大型基因組在本質(zhì)上難以使用傳統(tǒng)技術(shù)進行測序。
重復(fù)區(qū)域和結(jié)構(gòu)變異
植物還可以表現(xiàn)出具有高比例重復(fù)DNA的超大基因組。一些物種(例如玉米)呈現(xiàn)出超過80%的重復(fù)DNA,這些DNA重復(fù)序列可以復(fù)制并插入新的染色體位置,因而在基因組進化中發(fā)揮重要作用。也正是如此,準(zhǔn)確定位和表征這些轉(zhuǎn)座因子可以為植物進化和適應(yīng)提供新的信息,對遺傳操作具有重要作用。
當(dāng)前的短讀長測序方法,由于讀長長度無法跨越完整的DNA重復(fù)區(qū)域,由其產(chǎn)生的大多數(shù)現(xiàn)有基因組組裝均顯示對應(yīng)重復(fù)區(qū)域和結(jié)構(gòu)變異存在著許多不完整的間隙。
植物本身的問題
由于高水平的次級代謝物如多糖和多酚,想要從植物細胞中獲得純的、高質(zhì)量的高分子量DNA相當(dāng)困難。這些污染物的存在是導(dǎo)致低測序產(chǎn)率的最常見原因之一,并且會對下游分析產(chǎn)生很大影響。目前并沒有一種通用的涵蓋所有植物物種、組織、或在不同條件下都能使用的實驗方案。科學(xué)家們往往需要多次測序樣本來進行測試,不斷優(yōu)化和調(diào)整方案,這也導(dǎo)致了實驗成本的提高。
納米孔測序技術(shù)
為了解決這些問題,生成高質(zhì)量、高度連續(xù)的植物基因組,為植物保護和育種提供新的機會,科學(xué)家們將目光轉(zhuǎn)向了更新一代的測序方法——納米孔測序。納米孔測序由英國公司Oxford Nanopore Technologies研發(fā),其提供的長讀長能夠跨越高度重復(fù)和含有結(jié)構(gòu)變異的區(qū)域,提供更連續(xù)的基因組組裝[1]。納米孔能夠測序處理呈現(xiàn)給它的DNA片段的整個長度,并且已經(jīng)可以做到常規(guī)處理數(shù)千kb的完整片段,目前為止最長的單一讀長超過了2 Mb[2]。這種超長讀長無疑能夠簡化基因組的組裝過程,提供更完整、更連續(xù)的基因組。因此,研究人員現(xiàn)在正在使用納米孔技術(shù)對植物參考基因組進行從頭測序和分析。
眾所周知,郁金香是荷蘭的代名詞,每年的出口量為20億株。因此,理解郁金香的基因組,提高育種和養(yǎng)殖對農(nóng)業(yè)經(jīng)濟有著巨大的影響。然而,郁金香的基因組非常的龐大。它大小約為34 Gb,是人類基因組的10倍,并且包含大量的重復(fù)區(qū)域,對傳統(tǒng)的短讀長測序和組裝可以說是巨大的挑戰(zhàn)。為了應(yīng)對這個挑戰(zhàn),荷蘭Future Genomics Technologies的Jansen博士轉(zhuǎn)向了納米孔長讀長技術(shù),帶領(lǐng)研究團隊利用Oxford Nanopore Technologies研發(fā)的測序儀MinION和PromethION對郁金香基因組(Tulipa gesneriana)進行測序[3]。他們總共生成了203 Gb的數(shù)據(jù),約為6倍的基因組覆蓋率。在完成測序后,他們面臨的又一挑戰(zhàn)是將這些序列重新組裝成基因組。傳統(tǒng)的基因組組裝工具需要將每一條讀長與其它所有讀長比對,在大型基因組的組裝中,這不但增加了計算量,也大大延長了電腦CPU的耗時。研究小組為此研發(fā)了一種名為“Tulipa-julia”的組裝工具,只利用納米孔長讀長數(shù)據(jù)上獨特的、以及含有信息量的部分來進行比對。由于基因組龐大,目前比對工作仍在進行中。但Jansen博士表示,他們初步獲得的結(jié)果已證明納米孔長讀長在大基因組測序中的價值。并且,高通量測序設(shè)備PromethION能夠穩(wěn)定地產(chǎn)生大量的數(shù)據(jù),使他們能夠更輕易地測序任何基因組。
在20世紀(jì)50年代,Barbara McClintock首次注意了到植物中DNA甲基化的作用,并將其描述為一種可以在活躍和非活動形式之間切換的新型移動元素。現(xiàn)在已知植物中的DNA甲基化發(fā)生在CG、CHG和CHH(其中H可以是A,C或T)的環(huán)境中[4]。這些甲基化堿基在基因表達中起關(guān)鍵作用,因此在農(nóng)業(yè)研究和植物育種計劃中具有越來越重要的意義。例如,在不同的壓力因素中(如鹽度,缺水和殺蟲劑),甲基化顯示出差異性反應(yīng)。與傳統(tǒng)的測序技術(shù)不同,基于納米孔的測序允許同時和直接檢測DNA甲基化和其他堿基類似物以及DNA序列,為所研究的基因組提供更為詳細的表征[5,6]。
另外,使用傳統(tǒng)的短讀長序列,大多數(shù)真核基因組測序項目僅限于結(jié)合每個染色體拷貝的數(shù)據(jù)來產(chǎn)生單個單倍體的共有序列。納米孔技術(shù)提供的長序列讀長現(xiàn)在使單倍型分析更加可行——即使對于多倍體物種也是如此[7,8]。遠程單倍型分析信息可以提供植物進化和馴化的新見解,并可能推動和改善未來作物的生產(chǎn)。
從實地到實驗室測序的
不同選擇方案
納米孔長讀長測序是Oxford Nanopore Technologies公司研發(fā)的新一代的測序技術(shù)。其當(dāng)家明星產(chǎn)品MinION是世界上第一款掌上納米孔DNA/RNA測序儀。它是一款便攜式、實時、長讀長和低成本的設(shè)備。啟動套裝包含測序試劑和兩張測序芯片,價格不到人民幣1萬元。MinION由一個USB接口連接到筆記本電腦上啟動,現(xiàn)在還可以使用新開發(fā)的MinION伴侶——MinIT,一個預(yù)配置過的小型電腦分析儀,省去對筆記本電腦的需求。
來自J. Craig Venter研究所的團隊在單個MinION測序芯片上,在短短四天內(nèi)以1000美元的成本為模型生物擬南芥(Arabidopsis thaliana)創(chuàng)建了高度連續(xù)的基因組組裝。該組裝顯示出比現(xiàn)有的“金標(biāo)準(zhǔn)”參考基因組更高的連續(xù)性,且基本準(zhǔn)確度相同。該項目的首席研究員托德·邁克爾教授對此表示,長讀納米孔組裝揭示了我們在短讀技術(shù)中看不到的微觀變異[1]。
此外,Oxford Nanopore Technologies還推出了更高通量的臺式設(shè)備GridION X5和PromethION,以及更袖珍的適合單次使用的Flongle,以適應(yīng)對不同大小基因組以及更高覆蓋率和樣本量的要求。GridION數(shù)據(jù)產(chǎn)量是MinION的5倍,而高通量、高樣本量的PromethION數(shù)據(jù)產(chǎn)量約為MinION的300倍,可以獨立或同時使用48個測序芯片,48小時可產(chǎn)生數(shù)據(jù)15 Tb,可以為如種子銀行或者轉(zhuǎn)基因系之類大型或多個植物基因組項目提供經(jīng)濟高效的分析。
對需要調(diào)整不同的文庫制備參數(shù),并對多個樣品進行測試的測序方案往往不可避免的增加實驗成本。在啟動大型基因組測序項目之前,可以使用能夠適配于MinION和GridION設(shè)備的單次測序芯片F(xiàn)longle(2018年可加入早期用戶計劃),進行經(jīng)濟有效的樣品優(yōu)化和質(zhì)量檢查。
小 結(jié)
2000年,擬南芥(Arabidopsis thaliana)成為第一個進行基因組測序和組裝的植物。這項具有里程碑意義的成就耗時10年才完成,耗資更是高達1億美元。現(xiàn)在,使用單個MinION測序芯片可以在幾天內(nèi)就完成測序,成本為1000美元。
與傳統(tǒng)的短讀長方法相比,長讀長納米孔測序具有許多優(yōu)勢,使研究人員能夠組裝和探索以前難以處理的植物基因組,為植物進化和育種策略提供新的重要見解。這些進展對于經(jīng)濟有效地應(yīng)對世界上一些最緊迫的挑戰(zhàn)至關(guān)重要,例如在面臨氣候變化帶來的農(nóng)業(yè)威脅,抗蟲害和依賴有限數(shù)量的遺傳同質(zhì)作物物種的同時,可靠地為快速增長的人口提供食物。(文章來源:洋蔥頭 測序中國)