國內在介紹和討論精確醫學時,大多只強調基因組序列分析的重要性,給人造成一種“基因組測序”是精確醫學必由之路的幻象。但事實上,“十八般武藝齊上陣”的策略才是精確醫學真正倡導的。
2015年初,美國國立衛生研究院 (NIH)主任弗朗西斯·柯林斯 (Frans Collins)和美國曾任國立癌癥研究所所長的哈羅德·瓦慕斯 (Harold Varmus)在介紹美國的精確醫學計劃時,這樣寫到:“項目參與者被要求同意對其進行全面地生物學分析(包括細胞種類、蛋白質、代謝分子、RNA以及DNA;當經費允許時可進行全基因組測序)和行為分析,并與其電子健康檔案相聯”。
1、系統生物學是精確醫學的“抓手”
“精確醫學”并非美國總統奧巴馬首創。早在2011年,美國國家研究理事會就發布了相關的戰略研究報告:《邁向精確醫學——構建生物醫學研究的知識網絡和新的疾病分類法》 (Toward Precision Medicine: Building a Knowledge Network for Biomedical Research and a New Taxonomy)(以下簡稱“邁向精確醫學”),明確提出了“精確醫學”的概念及其核心內涵。該報告認為,“要建立這樣一種醫學模式:將個體的臨床信息和分子特征來構建一個巨大的‘疾病知識網絡’,并通過這種知識網絡來支持精確診斷和個體化治療”。該疾病知識網絡的特點是,把個體的基因組、蛋白質組以及代謝組等各種分子數據與臨床信息、社會行為和環境等不同層級、不同維度的數據進行整合,其目的是“獲取決定個體健康狀態的極端復雜的影響因子或發病機理”。換句話說,“精確醫學”的主要任務是為每一個體構造一個整合了各種相關信息的知識網絡。
筆者認為,精確醫學所強調的多種數據整合策略正是體現了生命科學領域新興交叉學科“系統生物學” (Systems Biology)的精髓:首先是要把生物系統內基因、蛋白質等不同種類的分子組成成份整合在一起進行研究;其次,對于多細胞生物而言,系統生物學還要實現從分子到細胞、組織、個體的各個層次的整合。系統生物學的指導思想是整體論和系統論,認為生物體是高度復雜的龐大系統,不能只考慮局部,某一類分子,甚至不能僅考慮一個層次,需要從多層次和多因素相互作用的全局性角度進行整合研究,才能完整地認識和揭示生命的復雜生理和病理活動。
2、為什么要系統獲取人體信息?
雖然機體內遺傳信息的傳遞基本遵循“中心法則”,從DNA傳遞到RNA,再到蛋白質;但是,其傳遞過程不是“高保真”的,通常伴有不同程度的“噪音”。例如,對結直腸癌組織的基因組和蛋白質組的比較研究表明,腫瘤細胞有些蛋白質上的氨基酸變異并沒有對應的基因組序列變異。顯然,僅僅進行基因組測序是難以了解很多在轉錄水平和蛋白質水平才出現的新變化。已有大量研究工作對DNA甲基化修飾和組蛋白翻譯后修飾等表觀遺傳變化與腫瘤發生發展的關系進行了揭示。因此,要研究腫瘤的發生發展,不僅需要檢測基因組的序列變異,還需要檢測表觀遺傳學信息。這些工作提示,生物體不同分子層次之間不是一種線性關系,一個層次上的信息不能全部地反映出其它層次的性質和變化,在每一個層次的研究都是有必要的。
生物復雜系統最主要的特點是,每個活動都是眾多不同的基因、蛋白質、代謝小分子之間相互作用的結果;生物體內找不到“單干戶”,全是“工作團隊”。需要強調的是,這種觀點引出了整體論與還原論在看待生物分子功能時的重要區別。整體論者認為,生物分子的功能不是確定不變的,而是取決于具體環境下與其發生相互作用的其它分子。與之相反,還原論者認為,每個特定的生物分子具有某種固定不變的生物學功能;就如同曾經在中國上世紀70年代末流行的印度電影《流浪者》的一句名言,“法官的兒子永遠是法官,賊的兒子永遠是賊”。
決定論觀點在腫瘤研究中特別盛行:人們通常把研究中找到的腫瘤相關基因賦予一個具有明確功能指向的稱謂,要么是促進腫瘤生長的“癌基因” (oncogene),如前面提到的KRAS基因;要么是抑制腫瘤生長的“抑癌基因” (tumor-suppressing gene),如大名鼎鼎的p53基因。筆者實驗室在不久前的一項研究中發現,p53基因與某些基因共同工作時確實表現為抑制腫瘤生長;但令人吃驚的是,如果將實驗條件進行特定改變,同一個細胞內的p53基因將與另外一些合作伙伴在一起促進腫瘤的生長,而抑制p53的活性將抑制腫瘤的生長;此時p53基因的表現就像一個標準的癌基因。顯然,各種生物分子間相互作用的信息也難以簡單地從基因組序列的測定中獲取,要依靠轉錄組、蛋白質組和相互作用組等不同組學層次的分析與數據整合。
3、不可忽略的環境因素
人體的體內和體表存在大量的細菌。有研究者甚至把腸道菌群基因組稱為“人體第二基因組”。據估計,人體腸道菌群基因組的基因總數大約是人類基因組的100倍,有近300萬個基因。可以說,只有把腸道菌群基因組和人類基因組結合在一起,才算是完整的人體遺傳全景圖。近年來,越來越多的研究工作表明,腸道菌群作為人體復雜系統的一個重要組成部分,廣泛參與了機體的各種生理和病理活動。例如,有研究指出,腸道菌群中一種名為核粒梭菌 (Fusobacterium nucleatum)的細菌能促進結直腸癌的形成。顯然,要想完整地認識和有效地解決復雜性疾病,不僅需要研究人體自身的基因、蛋白質、細胞和組織,而且對隱藏在機體內腸道菌群的研究也不可或缺。在“邁向精確醫學”的報告中,作者也專門強調了這一點:“對人體微生物菌群及其功能認識的不斷深入,將幫助我們實現疾病分類,研制針對人體及人體寄生病菌的藥物”。
遺傳因素作為內因,在腫瘤和糖尿病等復雜性疾病的發生發展過程中發揮了重要作用。但環境作為外因也不可忽略,有時候其重要性甚至會超過機體的內因。不久前美國科學家通過計算方法,比較了作為內因的干細胞分裂能力與環境等外部因素在不同類型腫瘤發生中貢獻大小。其結論是,內在風險因素只占整個癌癥風險的10~30%,而外部風險因素則在癌癥形成中起到了主要作用。作為針對復雜性疾病的精確醫學,環境等外部因素顯然也是需要進行整合研究的主要內容。在“邁向精確醫學”的報告中,作者以“暴露組” (Exposome)為例,介紹了在人一生不同階段可能對其有致病影響的暴露因素,包括物理環境、居住條件、生活習慣和社會因素等;這些都是精確醫學不能忽略的內容。
4、美國精確醫學的研究策略
為落實奧巴馬總統2015年初提出的精確醫學計劃——建立100萬美國志愿者人群的精確醫學隊列并采集相關信息,美國政府提出了一個“精確醫學先導專項” (The Precision Medicine Initiative,PMI)。2015年9月,該專項的工作小組向美國國立衛生研究院提供了一個研究報告,詳細分析了如何實施這項任務:“為了成功實施‘精確醫學先導隊列項目’ (PMI Cohort Program,PMI-CP),需要采用成熟的以及全新的方法和技術來進行數據采集和管理”;其核心數據集包括電子健康檔案、健康保險信息、問卷調查表、可穿戴設備健康信息采集以及生物學數據(各種組學數據、腸道菌群數據)等5大類型。
從以上對兩份美國精確醫學報告的介紹來看,美國人正是把整合型研究策略作為開展相關研究工作的“抓手”。這種整合型策略注重從個體有關層次盡可能完整地獲取數據,包括個體的微觀層次(基因組、轉錄組、蛋白質組、代謝組等)、個體的宏觀層次(分子影像、行為方式、電子健康檔案等)、個體的外部層次(腸道菌群、物理環境、社會條件等);然后對這些不同層次的數據利用各種信息分析技術進行整合,形成一個各個信息層之間不同類型數據有著高度連接的疾病知識網絡;“理想情況下,每個信息層與其它所有各信息層之間都形成連接:使得‘征兆和癥狀’與基因突變相連,基因突變與代謝缺陷相連,暴露組與表觀基因組相連,等等”。因此,采用整合型研究策略建構“疾病知識網絡”,就是“Precision Medicine” 的第二個特征。(生物谷 Bioon.com)