基因測序的市場規模有多大?說出來嚇你一跳,1.1萬億!根據前瞻產業研究院的數據顯示,基因測序市場規模年均復合增速達到21.2%,到2018年預計將會突破1.1萬億的市場規模。
目前基因檢測行業正處于爆發的臨界點,而撬動基因測序市場持續高增長的,就是精準醫學的深入,以及醫療大數據的不斷應用。
放眼世界,看精準醫學和醫療大數據
2016年3月,科技部公布了“精準醫學研究”國家重點專項,精準醫學研究上升到國家戰略高度。“精準醫學研究”中的“精準醫學大數據管理和共享技術平臺”,將作為國家唯一的精準醫學大數據平臺,通過匯聚和整合跨機構、跨部門的醫學大數據,解決我國精準醫學最關鍵的中國人組學等數據缺失問題,建設支撐我國精準醫學研究和臨床應用的國際一流的精準醫學大數據平臺。
中國政府高瞻遠矚,幾乎與世界發達國家同步開啟精準醫學研究。讓我們放眼看世界,了解一下其他國家和地區精準醫學的舉措。
1. 2012年,英國啟動十萬人基因組計劃
2012年12月,英國政府宣布啟動針對癌癥和罕見病患者的英國10萬人基因組計劃(100,000Genomes Project)。通過該計劃,英國政府預期到2017年年底實現以下四個目標:推進基因組醫療整合至英國國家醫療服務體系(NHS),并使英國在該領域引領全球;加速對癌癥和罕見病的了解,從而提升有助于患者的診斷和精準治療;促進基因組領域的私人投資和商業活動;提升公眾對基因組醫療的知識和支持。
2015年年底,英國政府宣布將在未來再追加3.75億美元的經費用于該計劃。2016年6月,英國政府宣布已經完成了9892個基因組測序工作。
2. 2013年,英國首個大數據醫療科研機構揭牌
英國首個綜合運用大數據技術的醫藥衛生科研機構于2013年5月3日在牛津大學正式揭牌,這家機構名為“李嘉誠衛生信息與發現中心”,將致力于用新興信息技術改善醫療衛生與藥物研發現狀。
英國首相卡梅倫在揭牌儀式上說,醫學研究新突破離不開信息獲取與共享,該中心的成立有望為英國醫學研究和醫療服務帶來革命性變化,它將促進醫療數據分析方面的新進展,幫助科學家更好地理解人類疾病及其治療方法。該中心包括“靶標發現研究所”和“大數據研究所”兩個機構,旨在通過搜集、存儲和分析大量醫療信息,確定新藥物的研發方向,探索特定疾病的新療法。
3. 2014年,韓國啟動后基因組計劃
2014年2月19日,韓國政府宣布正式啟動后基因組計劃,以推動新型基因組技術的發展和商業化。該計劃包括繪制標準人類基因組圖譜、發展韓國的人類基因組分析技術,以及依托基因組的疾病診斷和治療技術等目標。
2015年11月韓國政府宣布以韓國蔚山國家科學技術研究所(UNIST)為依托,開展萬人基因組計劃(10,000 Genome Project)。該計劃的合作者還包括蔚山市、蔚山大學、蔚山大學醫院、哈佛醫學院的個人基因組項目。
4. 2015年,美國總統奧巴馬推出“精準醫學計劃”
2015年1月30日,美國總統奧巴馬推出“精準醫學計劃”,提議在2016財年向該計劃投入2.15億美元,以推動個性化醫療的發展。
奧巴馬當天在白宮舉行的“精準醫學計劃”活動上說,“精準醫學”為實現重大醫學突破創造巨大機遇,為新一代拯救生命的醫學發現鋪平道路,指出“精準醫學”所要做的是,把按基因匹配癌癥療法變得像輸血匹配血型那樣標準化,把找出正確的用藥劑量變得像測量體溫那樣簡單,總之,“每次都給恰當的人在恰當的時間使用恰當的療法”。
“精準醫學計劃”通過整合一些現有臨床研究的數據等方式,收集100萬人的醫療記錄、基因和生活方式等數據;尋找會誘發癌癥的基因;制定相關監管規則;研究如何保護患者隱私和數據安全。
5. 2015年,香港理工大學研發大數據分析平臺揭示癌癥基因關系
2015年6月,香港理工大學癌癥基因組的大數據分析取得重大突破,通過建立一個創新的大數據分析平臺,分析基因之間的相互作用,揭示在癌癥中基因網絡的失控機制。
在該項研究中,研究團隊假設參與相同機制的基因會呈共同表現(即基因之間的表現水平互為關連),并且探討每對基因之間的關系,從而破解癌癥背后的機制。研究團隊還發現診斷及治療慢性骨髓細胞白血病的潛在標靶基因——核磷蛋白(NPM1)及其相關基因,有關研究發現有助確立由核磷蛋白導向的治療策略。
這項研究確立了一個創新的結構性基因共同表現分析平臺,揭示癌癥發病機理,并發展以核磷蛋白導向的治療策略。共同表現分析發現了基因網絡上的失控機制,加深對癌癥生物學的了解,有助確定治療的新方向。這個平臺不但對科學發展有所貢獻,并可隨時應用于其他疾病的診斷、預后和治療研究之上。
6. 2016年,奧巴馬斥資5500萬美元啟動精準醫療公用數據庫
奧巴馬政府于2016年7月中旬宣布財年投入5500萬美金建立精準醫療公用數據庫,即美國政府最新投入建設的“精準醫療組”(Precision Medicine Cohort)數據庫。作為精準醫療計劃(PMI)的重要組成部分,該數據庫將成為有史以來“最大且最具雄心壯志的研究項目。”該數據庫將涵蓋超過100萬位志愿者的詳細健康信息用于疾病的研究與個性化藥物和療法的開始。同時,這一新型數據庫也將幫助美國政府更好地監管快速增長的基因檢測市場。
7. 2016年,法國啟動精準醫療計劃
2016年6月,法國政府宣布投資6.7億歐元啟動基因組和個體化醫療項目,并將其命名為:法國基因組醫療2025 (France GenomicMedicine 2025)。該項目以提高國家醫療診斷和疾病預防能力為整體目標,預計在全國范圍內建立12個基因測序平臺,2個國家數據中心。項目初期將會聚焦癌癥、糖尿病和罕見病。2020以后,項目將會逐步延伸至一般性疾病。
在未來10年,法國政府希望達到以下三個目標:將法國打造成世界基因組醫療領先國家;將基因組醫療整合至患者常規檢測流程,意味著每年需要測23.5萬個基因組;建立起一個國家基因組醫療產業,從而推動國家創新和經濟增長。
除了各國政府在精準醫學和基因大數據上的發力,科技巨頭也在基因大數據領域紛紛布局
醫療大數據可分為四大類:診療數據、研發數據、患者數據以及支付和醫保數據,其中,基因測序產生的大數據主要可歸屬于診療和患者數據,這類數據對于臨床決策支持、疾病預防和管理、新藥研發和基礎研究等方面都有重大意義。科技巨頭們在基因大數據領域動作頻繁,積極布局。
Google(谷歌)
2012年Google就向23andMe投資150萬美元。23andMe由Google聯合創始人謝爾蓋-布林(Sergey Brin)的妻子領導。
2013 年谷歌推出的一項名為 “Google Genomics”的云端服務,旨在幫助大學實驗室和醫院將患者或科研對象的生物基因儲存到云端上,服務的目標是“探討遺傳變異交互”,意味著科研專家能夠訪問數百萬的生物基因,并能輕松簡單的進行對比分析。
谷歌還先后投資了Foundation medicine 和 DNAnexus 兩家公司,前者是一家提供癌癥全基因組測序及分析的公司;谷歌與后者DNAnexus 則一起打造一個巨大的開放式 DNA 數據庫,并將共同接管聯邦政府的國家生物技術信息中心(NCBI)的數據。這些數據將合并進入DNANexus的DNA信息歷史文檔,并儲存于谷歌的云計算服務器,這是谷歌的云計算服務器中最大的第三方數據資料,免費向醫學研究者提供接入服務。
另外,谷歌自身還成立了Calico 公司,利用大數據進行人類衰老及相關疾病方面研究,公司CEO 亞瑟·萊文森(Arthur Levinson)也是蘋果公司董事。2014 年 7 月,google X 實驗室啟動 Baseline Study 項目,大量收集人類基因組標本并利用大數據合成健康人類基因圖譜,為疾病的提早發現及治療提供前提。
IBM(國際商業機器公司)
IBM Watson目前已經在醫療健康、商業、教育、市場、供應鏈、金融服務等領域展開了應用。IBM Watson health板塊中與基因大數據相關的幾個項目包括Watsonfor oncology、Watson for genomics、Watson for drug discovery。
Watson for oncology,基于 Watson 認知計算的腫瘤解決方案。我們相對比較熟悉,因為它是 IBM 旗下 Watson health 首個在中國本土化的項目。在這個項目中,Watson 的作用是建造了一個多學科會診(MDT)的場景,通過來自普外科、腫瘤內科、放療科、放射科、病理科、內鏡中心等科室的專家經驗,提出適合患者的最佳治療方案,繼而由相關學科單獨或多學科聯合執行該治療方案。Watson強大優勢在于其憑借知識庫中290多份醫學期刊,200余種教科書以及一千兩百萬頁的醫學文獻、以及美國國立綜合癌癥網絡(NCCN)發布的臨床指南、紀念斯隆-凱特琳癌癥中心等世界頂級腫瘤學專業國際水準腫瘤治療專業知識來給出診療建議。
Watson for genomics,基于 Watson 認知計算的基因組學解決方案,是11月初由 IBM 和奎斯特診斷公司(Quest Diagnostics)聯合推出的項目,目的是幫助美國腫瘤學家發展個性化醫療。Watson for Genomics將會對匿名患者數據進行篩選,為全球范圍能夠推進研究、揭開抗藥性癌癥背后隱藏模式的科學組織提供可用信息。
Watson for drug discovery,基于 Watson 認知計算的新藥研發解決方案,它是一個新的云平臺,旨在幫助科學家發現新的藥物靶點和替代性的藥物的適應癥。近日,輝瑞與 IBM 達成協議,輝瑞將利用Watson for drug discovery 的機器學習、自然語言處理及其它認知推理能力,用于免疫腫瘤學中的新藥物識別、聯合療法和患者選擇策略。
Microsoft(微軟)
在生物醫學大數據領域,微軟也早已啟動了Microsoft Biology Initiative項目,此項目期望給生物信息學和生物學領域帶來新的技術和工具,項目分為兩個主要部分,即Microsoft Biology Foundation 和 Microsoft Biology Tools。MBF 是一個不依賴任何語言的生物信息學工具包,而 MBT 則是一個工具集,它能幫助生物學和生物信息學研究人員更有效的做出科學發現。相關具體信息和合作伙伴方面目前還沒有更確切的消息來源。
Intel(英特爾)
上月,Intel 聯手博德研究中心(Broad Institute)開展基因組信息整合計劃,該計劃致力于在未來五年內整合現有私人、公眾以及云平臺上的基因組數據以加速生命科學領域研究。除了基本的合作,雙方還希望幫助生物醫藥公司、學術機構以及醫療保險提供者在內的多個使用者打造一個基因組數據共享平臺。
英特爾致力于驅動云計算以及日益智能互聯的世界,充分發揮從云到端的技術領先性,為精準醫療注入計算優勢。今年 6 月,英特爾攜手合作伙伴推出“精準醫療伙伴計劃”,共推中國精準醫療行業健康發展,并力爭在 2020 年實現 24 小時之內完成包括基因序列檢測、數據分析、疾病診斷,以及制定個性化治療方案在內的精準醫療的主要過程,并進而讓精準醫療早日惠及大眾。
Apple(蘋果)
醫療領域是蘋果公司一個“巨大的”機會,牽手 IBM 開展健康醫療大數據合作打造沃森健康云平臺、與醫療機構的合作、以及正在籌備中的世界一流醫療科技團隊,無一不顯示著蘋果在醫療領域的野心和抱負。
蘋果在醫療領域方面的布局,必須提到其建立的三種類型的“Kit”數據平臺。分別是 “HealthKit”、“ResearchKit”以及“CareKit”,跟本文主題最相關的是ResearchKit。運行這個平臺,首先需要用戶提供唾液樣本,創建基因數據后保存在 ResearchKit 的云計算平臺中,醫院和其他研究人員可以連接ResearchKit 平臺獲得大量研究樣本,從而讓一手資料的收集過程不再困難。ResearchKit平臺上已經有不少科研機構開發的 APP 取得了不少成果,比如羅徹斯特大學、賽智生物網絡共同推出的 mPower,可通過小測試、簡單提問、讓患者動動手腳的做法來判斷帕金森癥的病情狀況,至今已有超過 10000 人參與,這是有史以來最大的一次帕金森癥臨床研究。
Amazon(亞馬遜)
亞馬遜云服務(Amazon Web Service, AWS),早在 2006 就推向市場,以 Web 服務的形式 向企業提供 IT 基礎設施服務,現在通常稱為云計算。作為 AWS 公共數據集項目的一部分,合格的研究者現在可以在 AWS 上免費訪問兩個世界上最大的癌癥基因組數據集,即癌癥基因組地圖集(TCGA)和國際腫瘤基因組協作組 (ICGC)。這將使研究人員能夠聚焦于他們的科學研究而不是基礎設施,允許他們在更短的時間內取得更多的成果,最終加快癌癥研究領域的研究和探索步伐。
TCGA 語料庫囊括了從數以千計的癌癥患者處收集來的原始和加工過的基因組、轉錄基因組、和表觀基因組數據,現在在 AWS S3 上對 Cancer Genomics Cloud(CGC)的用戶免費開放。現在在 AWS 上也可使癌癥研究者訪問 2400 多組被持續分析的基因組,這些基因組對應于1100 多位獨特的 ICGC 捐贈者。這些數據也將在 AWS S3 上對那些符合 ICGC 數據共享策略并受到信任的研究者免費開放。
AWS 還托管了國際千人基因組計劃(1000 Genomes Project)龐大數據庫,并免費開放。目前該項目擁有超過 1700 個樣本,高達 200TB 數據量的 DNA 序列,這些數據都可以通過 AWS 免費獲取,用于進行疾病研究。千人基因組計劃的取樣包括來自 26 個種群超過 2600 人的基因組,今年國家衛生研究院將繼續增加其余的基因組樣本到公共數據庫中。
Philips(飛利浦)
IntelliSpace Genomics,即 IntelliSpace 基因組學解決方案,飛利浦醫療眾多 IT 解決方案的一種,其它還包括高級分子影像、心電圖診斷、放射腫瘤學、心血管 IT 解決方案等。飛利浦的 IntelliSpace 基因組學解決方案是一個可配置、可擴展,同時又是安全的醫學信息解決方案,可為醫院的醫生和專家在治療時提供實時可操作的診斷信息。這個平臺使醫生在集成的工作流程中能夠利用最好的臨床專業知識和系統運算能力去回答臨床上的關鍵問題,它無縫銜接了來自多個數據源的數據,包括原始測序數據、最新的電子基因組數據庫、臨床資料和知識數據庫、縱向患者記錄、醫學圖像以及病理數據在內,這和 IBM 的Watson解決方案有些類似。
Facebook(臉書)
Facebook一直在健康科技領域做一些嘗試,并特意強調不是指扎克伯格的野心(扎克伯格夫婦捐贈的450億美元里,選擇疾病治療領域)。毫無疑問的是,Facebook已經證實了在一些不同領域的興趣,包括從最先進的分子診斷方式(基因組檢測)到最大眾化的公共衛生(獻血)等等。今年3月,Facebook推出了類似的基于研究應用“Genes For Good”,用以激發用戶對基因檢測的積極性。參與者使用“Genes for Good”可以參與這項研究、回答與健康有關的問題、并查看與他們健康相關的信息概要。這個正在進行的研究旨在幫助人們了解自己的基因史,以及相較于其他參與者的日常健康習慣。
國外這些科技巨頭圍繞著基因大數據的布局只是部分呈現了這個領域強大的號召力和發展前景,國內也有不少優秀企業都已經啟動了相關的項目和合作計劃,比如阿里巴巴、華為、騰訊、百度等等。基因大數據是海量的,如何共享、規范、管理和利用是關鍵。大數據科學橫跨信息科學、社會科學、網絡科學、系統科學、生物醫學、心理學、經濟學等諸多領域。
如何利用好基因大數據來推動醫學的跨越式發展是我們急需解決的問題。
到目前為止,醫療行業還是采取通用型(one-size-fits-all)方式,但是如果我們能夠根據看護人員和衛生保健專業人員收集到的數據點來評估治療會怎么樣呢?這就是精準醫學,一種基于數據、算法和精準分子工具的新型醫療形式。
在精準醫學方面處于領先地位的加州大學舊金山分校目前正在訓練醫生在診斷和治療的過程中要和他們的病人進行不同的對話,以便于對他們的而社會、環境和經濟等背景情況有所了解。精準醫學將人們對醫療的關注點從識別癥狀到了解并治療疾病機制。另外,精準醫學還在環境和社會因素對健康的影響有所側重。那些了解科技和醫學目標的人能夠為解讀和聯系這些數據點提供平臺,在精準醫學的價值鏈當中創造價值。
精準醫療是增加療效,降低副作用,降低治療費用的重要手段。詹啟敏院士表示,目前的醫療技術很多都已經達到了“天花板”,臨床治療方案的效果已經達到極限。比如,同樣的腫瘤類型和同樣的疾病分期病人,采用相同的治療方案情況下,只有不到50%的病人產生理想療效,50%~70%的病人效果不明顯或者沒有療效。治療過程中有很大的被動和盲目性。
詹啟敏院士表示,精準醫學的發展離不開生物樣本庫、多組學分析平臺及大數據三大平臺的支撐。“誰擁有生物樣本資源誰就掌握了醫學科技的主動權,誰就能占據醫學競爭的制高點。”而多組學分析平臺是大數據的重要來源,包括測序技術、芯片技術以及培養培養組學、大數據、醫學復合型人才團隊等。第三,大數據平臺本身包括數據的搜集、儲存、分析、利用、共享和安全。這些數據包括了社區數據、隊列數據、臨床數據、組學數據還有結構生物學、藥物分子信息等等,大數據在藥物研發里面可以幫助確立新靶點、新結構,研發新藥物,幫助制訂新的診療方案以及確定在診療過程當中新的標準、新的規范和指南。
近年來,資本在精準醫學領域的布局呈現出日趨火熱的態勢,國內精準醫療投資標的超過500家,領域分布于基因測序、PCR、基因芯片、液體活檢、細胞免疫治療、抗體藥物以及腫瘤大數據、抗體相關、精準診斷等。
目前精準醫療正處于絕佳布局良機。一方面精準醫療行業正在蓬勃興起,未來將涌現出更多優秀的投資標的;另一方面,精準醫療目前正處于想象到現實的爆發臨界點,如基因測序成本已經降到1000美元以下,未來還仍將繼續呈下降趨勢,這讓精準醫療的大規模應用指日可待,而大數據技術的發展,也使基因測序數據的處理能力快速顯著提升。