美國于2015年年初提出的“精確醫學”計劃倍受世界各國關注。有消息稱,我國的相關計劃將在今年下半年或明年啟動。對此,中科院上海生命科學研究院吳家睿研究員近期撰文指出,“精確醫學”是一個有著豐富內涵的復雜概念,需要人們認真地思考和小心地解讀。當前,亟需我們明晰的兩個問題是:為何要在此時啟動精確醫學計劃?如何才能達到精確醫學的目標?
吳家睿(中科院上海生命科學研究院生物化學與細胞生物學研究所)
2015年初,美國總統奧巴馬在美國國會做國情咨文報告時表示:“我希望這個消滅了天花、繪制出人類基因組圖譜的國家可以引領一個新時代—— 一個在恰當時機提出正確治療方法的時代。今晚,我將發起一項‘精確醫學’倡議,讓我們向治愈癌癥與糖尿病等疾病更靠近一步,使每個人都可以得到讓我們與家人保持健康所需要的個性化信息”。
這段講話讓“精確醫學”(Precision Medicine, 有時被翻譯為“精準醫療”)迅速成為了新年伊始世界各國關注的熱點。據中國醫師協會官方報紙《醫師報》3月26日報道:北京天壇醫院副院長王擁軍教授日前透露,科技部召開了國家首次精準醫學戰略專家會議,中國精準醫療計劃將在2015年下半年或明年啟動。
顯然,我們有必要思考一下,為什么要在這個時候啟動精確醫學計劃?怎樣才能達到精確醫學的目標?
為什么要啟動精確醫學面對當前生物醫學領域亟需解決的生理和病理的復雜性問題,有人看到了挑戰,有人看到了機會。“精確醫學”正是在生命科學和醫學實踐所處的這樣一個重要轉折點上應運而生。
上世紀90年代初,美國主導的國際人類基因組計劃(Human Genome Project)啟動,目標是測定人類擁有的遺傳信息載體DNA上30億個核苷酸的排列順序。2001年2月,人類基因組草圖發布;2003年4月15日,國際人類基因組計劃負責人、現任美國國立衛生研究院(NIH)主任F. Collins宣布,人類基因組序列圖繪制成功。同日,美、英、日、法、德和中國等六國政府首腦聯合發表聲明,祝賀人類基因組計劃的完成。
人類基因組計劃之所以受到各國政府和科學家的高度重視,是因為人們希望通過這個計劃破譯人類的全部遺傳信息,從而在保障人類健康和抗擊疾病方面提供重大幫助。在2003年宣布人類基因組計劃完成之后,研究人員就立刻啟動了致力于人群水平的遺傳變異研究的“國際人類基因組單體型圖計劃”,要揭示非洲、亞洲及歐洲人群的基因組變異譜圖。
人們對基因組測序技術的臨床應用更是寄予厚望。例如在腫瘤研究領域,NIH在2006年啟動了耗資1億美元的“癌癥基因組圖集”(The Cancer Genome Atlas,TCGA)科研項目,計劃繪制出1萬個腫瘤基因組變異圖譜。2008年,國際癌癥基因組合作體(International Cancer Genome Consortium,ICGC)成立,隨后有16個國家參加了腫瘤基因組變異圖譜的研究計劃;當時該組織的目標是,針對50種不同類型的腫瘤,每種腫瘤采集500份樣品進行基因組測序研究。TCGA項目在2014年底宣告完成,研究者發現了近1千萬種與腫瘤相關的遺傳變異。通過對TCGA項目獲得的21種癌癥突變數據的統計分析,研究者表明,利用基因組測序方法能夠找到一些臨床上有用的突變位點。
然而,在基因組測序工作迅速推進的同時,研究者也逐漸認識到基因組知識的局限性。在人類基因組草圖發表的第10個年頭,人們發表了一系列文章來進行回顧和反思。例如美國《科學》雜志登載了一篇題為《等待革命》的評論文章,其主要觀點是:“人類全基因組序列的測定并沒有帶來基礎醫療方面的重大進展;由此促使人們去思考,是什么原因延緩了健康醫學領域的基因組革命”。為什么人們的預期目標和現實情況有如此大的距離?在《自然》雜志紀念人類基因組計劃10周年專輯中,一篇題為《生命是復雜的》的評論文章給出了答案:“生物學家看到的越多,顯現的就越復雜”。雖然基因組的DNA序列是生物體的遺傳基礎,但生命活動并不是簡單地依靠堿基序列就能夠實現的。
我們知道,現代生命科學建立在解釋遺傳信息傳遞的“中心法則”之上。長久以來人們相信,“中心法則”確保生物體遺傳信息的“高保真性”:mRNA序列必定嚴格由DNA序列決定,而蛋白質的氨基酸序列也必定由mRNA序列上的遺傳密碼子所嚴格決定。然而,科學家近幾年的研究表明,遺傳信息傳遞到RNA和蛋白質的過程中充滿了各種各樣的變異或者“錯誤”。也就是說,生命的復雜性遠遠不是簡單地測定基因組核酸序列就能夠闡明的。即使只從“中心法則”直接涉及到的DNA、RNA和蛋白質分子水平來看,基因組核酸序列不過是生命復雜性的“冰山一角”;更不用提,生命復雜性涉及到表觀遺傳現象,以及代謝小分子和糖脂的參與;不僅如此,生命復雜性還涉及到細胞、組織和器官等不同層次。
《細胞》雜志在2014年3月為紀念創刊40周年發行了專輯,其主題就被定為“復雜性”(Complexity)。在該專輯中,美國著名腫瘤生物學家R. Weinberg發表了一篇題為《完整的循環——從無盡的復雜性到簡單性再回到復雜性》的評論文章,文中著重指出:在過去的40年里,從事腫瘤研究的科學家,從最初面對無數難以理解的病理現象的困惑,到樹立了還原論必勝的信念,再到最近幾年重新面對腫瘤這個疾病的無盡復雜性。
面對當前生物醫學領域亟需解決的生理和病理的復雜性問題,有人看到了挑戰,有人看到了機會。“精確醫學”正是在生命科學和醫學實踐所處的這樣一個重要轉折點上應運而生。美國科學院研究理事會在2011年發布的一份長達100余頁的研究報告中提出:“邁向精確醫學——構建生物醫學研究的知識網絡和新的疾病分類法”(以下簡稱“邁向精確醫學”)。從而第一次明確提出了“精確醫學”的概念,并系統討論了為實現該目標所需要開展的核心任務。在該報告的作者看來,要想實現“精確醫學”,其前提是構建基于生物學大數據的生物醫學研究知識網絡,以及基于分子生物學的全新疾病分類方法;通過建立一個整合各種類型生物學數據和知識、以個體為中心的信息共享平臺,就可以形成一個生物醫學知識網絡,用來了解并獲取對個人健康具有決定性作用的、高度復雜的影響因素或發病機理;而利用生物醫學知識網絡將有助于建立新的疾病分類體系,從而定義新型疾病或對疾病進行分子分型和藥物分層,進而實現疾病的精確診斷和準確治療。該報告的作者強調:“所提議的疾病知識網絡和新分類法帶來的主要收益正是‘精確醫學’”。
怎樣才能達到精確醫學以個體為中心的、整合了不同數據層的生物學數據庫,以及高度關聯的知識網絡是邁向精確醫學的必要條件。
“邁向精確醫學”的作者認為:“知識網絡的建立以及對其進行研究和臨床應用,都取決于是否擁有一個大型的、多層級的、充分整合的人類疾病知識數據庫”。在這樣的數據庫里,關于人類疾病的知識不僅包含了臨床診斷和病理分析等表型信息,還具有各種生物分子信息,包括基因組、轉錄組、蛋白質組、代謝組、脂質組和表觀遺傳組等。
也就是說,開展精確醫學的基礎是需要有盡可能完整的個體生物學數據。2015年初,NIH主任F. Collins和美國國立癌癥研究所所長H. Varmus在描述擬開展的美國精確醫學計劃時表達了同樣的觀點:“我們準備建立一個有一定時間跨度的、100萬人以上的美國人群‘隊列’,他們自愿參加該項研究。參加者被要求同意對其進行全面地生物學分析(包括細胞種類、蛋白質、代謝分子、RNA和DNA,當經費允許時可進行全基因組測序)和行為分析,所有這些分析數據都將連接到他們的電子健康檔案”。
這種數據庫,并不是一個把某一種類型生物學數據簡單地收集在一起,像“GeneBank(基因文庫)”那樣的常規生物信息學數據庫。如果把一類生物分子或一種表型視為一個變量,相同變量的數據形成一個信息層,那么這個數據庫就是由很多變量組成的多層級的結構,每一層包含一個與疾病相關的變量信息。需要強調的是,利用生物信息學和計算生物學技術,人們能夠發現各種分子之間的相互關系,在各種不同類型生物學數據層之間建立起高度的內部連結,從而形成一個復雜的生物醫學知識網絡。例如,基因組的突變與表觀遺傳改變相聯系,或者與蛋白質組表達變化相聯系等等。理想的情況下,每個信息層都與其它信息層形成緊密的聯系。這種不同種類生物分子之間、生物分子與表型/臨床癥狀之間的高度整合,將有利于人們發現傳統方法不能挖掘到的致病因子或者診斷標記物,有利于人們對特定的個體患者進行準確地個性化診斷和治療。
顯然,這樣的生物醫學知識網絡所反映的,正是系統生物學的核心特征——多變量的整合。系統生物學(Systems Biology)是21世紀生命科學領域出現的一門新興的交叉學科。系統生物學創始人之一、美國科學家L. Hood認為,系統生物學的特點是研究一個生物系統中基因、mRNA、蛋白質等所有組成成分的構成,以及在特定條件下這些組分間的相互關系。因此,系統生物學的核心就是整合,首先是要把生物系統內不同種類的分子組成成份整合在一起進行研究;其次,對于多細胞生物而言,系統生物學還要實現從基因到細胞、到組織、到個體的各個層次的整合。也就是說,“邁向精確醫學”需要構造的生物醫學知識網絡是建立在系統生物學的基礎之上。
歐盟委員會為了在醫學領域推進系統生物學,專門成立了一個“系統醫學行動協調組織”(Coordinating Action Systems Medicine Consortium, CASyM),涉及9個歐洲國家的研究組織、基金會和企業。2014年6月,歐盟委員會發布了《CASyM路線圖》,其中包括近期(2.5年)和長期(10年)開展系統醫學(Systems Medicine)的研究規劃。該路線圖指出:“系統醫學就是將系統生物學的方法策略應用到醫學概念、研究和實踐之中”,同時認為,“系統醫學將在下一個10年圍繞著‘以患者為中心’這個概念,來進行醫療研究和實踐,這些活動的開展需要整合不同的學科,包括數學、計算機科學、數據分析、生物學,以及臨床醫學、倫理和社會實踐”。顯然,這份路線圖與“邁向精確醫學”報告稱得上是“異曲同工”。
“以患者為中心”的觀念,也正是“邁向精確醫學”的作者提出建設疾病知識數據庫和知識網絡的關鍵——“需要強調的是,這個信息共享平臺的新穎性和能力就在于以‘個體為中心’”。精確醫學所需要的數據庫,就是要在從單獨個體獲取的各種類型的生物學數據之間建立起高度的內部連結。
如何建立以個體為中心的數據信息庫?《細胞》雜志于2012年發表的一篇文章可以作為范本。美國一位科學家對自己進行了連續14個月的表型監測和血液樣本分析,獲得了表型組譜、基因組序列、轉錄組表達譜、蛋白質組表達譜和代謝組表達譜等一個完整的個體“多組學”數據,并通過生物信息學的工具將這些不同種類的數據進行整合,建立了一個被稱為“整合的個人多組學譜”(Integrative personal omics profile,iPOP)的數據庫。作為類似的工作,2014年3月,L. Hood和他領導的美國系統生物學研究所發起了一個被稱為“The Hundred Person Wellness Project”的研究項目,計劃用9個月時間,選擇100個健康人進行從分子到表型的個體化多組學研究。L. Hood認為:“這種個體化組分的基礎在于:每個個體在遺傳和環境方面都是獨一無二的,在不同時間段需要用他們自己作為對照,來分析個體從健康到患有某種疾病的轉變”。該研究所計劃,在未來的5到10年內,啟動一個名為“100K”的研究計劃,針對10萬名健康人開展這種多組學研究工作。NIH在2015年計劃啟動的“精確醫學計劃”,也是以個體為中心的多組學數據整合研究,只是將研究的人數擴大到了100萬。
也就是說,以個體為中心的、整合了不同數據層的生物學數據庫,以及高度關聯的知識網絡是邁向精確醫學的必要條件。“‘精確醫學’是用來為每個個體提供可得到的最好醫療護理。如果不對研究者和醫療保健提供者所依賴的信息系統進行巨大的重新定位,是無法達到這個目標的。這些信息系統就像它們準備支持的醫學類型那樣必需是個體化的。普遍性必需建立在大量個體信息的基礎之上;而與這樣一個過程相反的做法都將會失敗。顯然,如果在分析調查過程剛剛開始時,就將生物分子表達譜、個體特定情況相關的數據和健康史從個體中剝離出來,那么以此用來判定健康和疾病決定因素所必需的信息就會丟失”。“邁向精確醫學”報告中如此寫道。
通過以上討論,我們可以看到,“精確醫學”是一個有著豐富內涵的復雜概念,需要人們認真地思考和小心地解讀。例如,“精確醫學”不能簡單地等同于“個體化醫學”(Personalized Medicine),因為中醫是個體化醫學,但不是精確醫學;又例如,基因組測序是實現“精確醫學”的主要任務之一,但不能把實現“精確醫學”局限于基因組測序。另一方面,我們更要認識到,“精確醫學”的出現將對生物醫學研究和醫療實踐產生重大影響,有可能改變人類維護健康和抗擊疾病的傳統模式。
來自俄羅斯、美國、土耳其和歐洲的科學家開發了一個Shambhala平臺,可將大量基因活性水平的大數據結合起來。該數據庫的創建將使科學家能夠將不同實驗中兼容性較差的數據結合起來。此項成果發表于《分子生物......
近日,衛健委發布《衛生健康信息數據元目錄第1部分:總則》等34項推薦性衛生行業標準,,涉及總則、標識、實驗室檢查、醫學診斷等項目,詳情如下:標準編號標準名稱代替標準編號WS/T363.1—2023衛生......
近年來,隨著基因測序技術和算法不斷發展,大量物種基因組被陸續測序和組裝,為相關研究和應用提供重要遺傳信息。因此,如何精準檢測評估基因組組裝質量高低、避免組裝錯誤等非常關鍵,也備受關注。記者19日從中國......
京10月19日電(記者孫自法)近年來,隨著基因測序技術和算法不斷發展,大量物種基因組被陸續測序和組裝,為相關研究和應用提供重要遺傳信息。因此,如何精準檢測評估基因組組裝質量高低、避免組裝錯誤等非常關鍵......
ThomasC.Südhof于2013年與JamesRothman和RandySchekman共同獲得諾貝爾生理學或醫學獎,以表彰他們發現了調節細胞內主要運輸系統——囊泡運輸的機制的突出貢獻。在202......
10月18日發表在《自然》的一項研究報道了高致病性H5禽流感病毒在生態與演化上的主要變化,包括全球分布的變化。研究結果顯示,這些病毒的暴發中心已經擴展到亞洲以外,傳播到了非洲和歐洲的部分地區。2021......
斯坦福大學JoannaWysocka團隊在Science在線發表題為“Agenome-widegeneticscreenuncoversdeterminantsofhumanpigmentation”......
近日,中國農業科學院作物科學研究所玉米遺傳改良與新品種選育創新團隊發現了一個玉米抗粗縮病新基因ZmGLK36,并深入揭示了該基因編碼的轉錄因子調控玉米抗粗縮病的分子機制,為抗粗縮病玉米育種等作物抗病改......
近年來,熱帶傳染病登革熱盛行,對熱帶地區群眾的生命健康造成威脅。然而,目前用于大面積噴灑以趨避和殺滅蚊蟲的化工合成藥品對人體和環境均存在二次傷害的風險,因而亟需發展能夠有效驅避埃及伊蚊的天然綠色驅蚊產......
近期,美國國立衛生研究院(NIH)堅持要求實施此前提出的一項新政策,即其資助的外國合作伙伴定期分享實驗室記錄以及其他原始數據。對此,數百名研究人員以及相關組織表示抗議,他們警告說,該舉措可能會阻礙國際......