基因測序數據云處理有望加速發現與疾病相關聯的基因突變。
未來醫療的夢想是掌握基因與疾病之間的關系,并據此制定出個性化的醫療方案。但是科學家認識到這種“個性化”或“精準”醫學存在一個問題:即如何在保證基因數據和醫療記錄安全的同時,用基于云端的大規模數據分析處理這些數據。如今,一種方興未艾的數據加密技術表明,這一難題或已得到解決。
在美國加州大學圣迭戈分校(UCSD)近日舉行的一次研討會上,密碼學專家分析了用于測試的基因數據。他們利用較小的數據組以及一種叫作“同態加密”的方法,在10分鐘左右就可以找到與疾病相關聯的基因變異。而在現實中,計算機經常會在數小時內陷入停頓,例如要在相當于全基因組的數十萬分之幾的基因片段中找出與某種疾病相關聯的基因異變。“這是一項很有前途的研究成果。”UCSD計算機學家、幫助組織此次研討會的Xiaoqian Jiang說,“但在擴展其用途方面依然存在許多挑戰。”
醫生和研究人員認為,為了了解基因如何影響疾病,就需要獲得采集自數千萬個人的基因和健康數據。他們已經開始計劃其中的一些項目,如美國總統奧巴馬的“精準醫學計劃”以及英國的“10萬人基因工程”等。類似的重大研究項目需要具備云計算機網絡處理能力,但近年來的網絡安全問題卻表明,把如此海量、敏感的信息放在網絡空間會存在極大風險。例如美國國立衛生研究院的基因型和表型數據庫(dbGaP)中的基因和醫學數據便因為安全問題,而禁止使用這些數據的用戶把數據儲存到聯網的計算機上。
而同態加密則讓這一問題得到解決,其方法是通過讓科學家僅在云端儲存在數學上打亂的(或稱作為加密)形式的數據。這種方法包括在一臺本地電腦上對數據進行加密,然后把打亂的數據上傳到云端。已加密數據的運算可以在云端進行處理,然后生成的加密結果被返回至本地計算機,最終由本地計算機解碼答案。如果有數據竊取者想在此過程的任何一點上截取加密數據,那么其中的所有數據都將保持安全。
“如果我們可以證明,這些技術確實可以發揮作用,那么它將可以為通過計算機運算及儲存這些需要保護個人隱私的高通量數據提供更安全的保證。” UCSD計算機學家及此次會議組織者之一的Lucila Ohno-Machado說。
同態數據加密首次在1978年提出,它與其他加密方法的不同之處在于:它可以交由云端操作打亂這些數據,而從本質上說,云端永遠不會“看到”它所運作的數據。而且,和其他加密方法不同,當它進行加密數據運算時,其運算出的結果和正常情況沒有出入。
然而,在2009年紐約州IBM托馬斯·沃森研究中心的加密專家Craig Gentry證明這種方法可以對同態加密數據執行任何一種運算之前,該方法一直僅停留在理論概念層面。Gentry通過把每個數據點轉化成一段加密信息,或稱密碼文本,而加密后的信息比初始數據更加龐大、復雜。一個未加密的數據可能會被加密成擁有數百萬字節的密碼文本——其大小相當于一張數字化照片的尺寸。這種方法是一個進步,但由于需要對其解密,相關運算卻可能達到14個數量級。因此 Gentry的方法就其特點來說為解決上述難題提供了一種可能性,但其運算方面的復雜程度卻讓其難以走向現實應用。
自那時起,密碼學專家就在開發新的系統解決這些問題,例如通過對許多數據片段一起加密,這樣可以使它們同時得到處理;或是通過把真實數據直接加密為單個加密文本,而不是像起初那樣把它們加密為多個加密文本。這些創新比原來對每個片段的數據分別進行加密及執行運算所花費的時間和內存都更少。來自IBM研究中心的Shai Halevi說,現在的同態加密運算速度比2009年的運算速度快15萬倍。“同樣的一項運算,2012年可能要花費一天半,但現在我們5分鐘就能搞定。”他說,“現在是時候提出,這樣的速度是否足以達到應用階段了。”
盡管如此,依然有人對這種方法持懷疑態度。馬里蘭州貝塞斯達國家生物技術信息中心收藏部主管Steven Sherry表示,即便同態加密可以起作用,也不足以保護研究人員電腦中的數據。但是一些密碼學專家已經開始在生物醫藥領域配置有限的同態密碼系統。例如,瑞士一些艾滋病病毒研究管理人員和一家生物醫學庫就在利用這種方法:他們僅對一小部分相對簡單的運算采取這種方法,因此并不介意當前的系統并不適宜快速地進行復雜運算。
盡管如此,也有人擔心這些基因數據存在被泄露的潛在風險。設計該系統的瑞士聯邦理工大學Jean-Pierre Hubaux說:“科學家確實擔心不久的將來可能會出現一些丑聞,而他們卻因為沒有事先采取恰當的防范措施遭受批評。”
華南農業大學生命科學學院教授王海洋團隊聯合中國農業科學院作物科學研究所等研究人員,通過圖位克隆、轉錄組和代謝組等生物學手段,研究揭示了ZmDBF2-ZmGLK36-ZmJMT/ZmLOX8分子模塊調控......
草害是制約玉米高產穩產的關鍵要素之一,田間雜草與玉米爭奪水、肥、光和空間,且易滋生病蟲害,化學除草是玉米田首選的除草方式。草甘膦是世界第一大除草劑,其滅生性的特點在防治雜草的同時對玉米也會產生藥害,培......
北京時間9月1日晚10點,中國科學院外籍院士、中國科學院深圳先進技術研究院醫藥所能量代謝與生殖研究中心首席科學家JohnRogerSpeakman與丹麥哥本哈根大學公共衛生研究院的ThorkildSo......
為了保護極度瀕危的新西蘭鸮鸚鵡kakapo,幾乎所有剩余個體的基因組都已被測序,這為其保護管理提供了重要信息。新西蘭鸮鸚鵡kakapo(Strigopshabroptila)有幾個特性。它是世界上最重......
大約1/5的人出生時攜帶至少一份APOE4基因變異,這使他們在年老時更容易患心臟病和阿爾茨海默病。這種變異如此普遍,給進化帶來了一個謎:如果APOE4影響了人類健康,隨著時間的推移,為何它沒被清除出人......
7月31日,中國科學院深圳先進技術研究院合成生物學研究所胡政課題組與廈門大學數學科學學院周達課題組合作,在《自然-生物技術》(NatureBiotechnology)上,發表了題為PhyloVeloe......
7月31日,中國科學院深圳先進技術研究院合成生物學研究所胡政課題組與廈門大學數學科學學院周達課題組合作,在《自然-生物技術》(NatureBiotechnology)上,發表了題為PhyloVeloe......
近日,廣東省科學院南繁種業研究所玉米種業室團隊以甜玉米為研究對象,對甜玉米高溫下的表型特征變化進行觀察,發現了提高鮮食玉米耐熱性基因。相關研究論文發表于InternationalJournalofMo......
一般來說,水稻品種間親緣關系越遠,雜交優勢越明顯。據預測,如果秈稻和粳稻亞種間能育成超級雜交稻,可以比現有雜交水稻增產15%以上,因此,如何利用亞種間的超強優勢一直受到育種家的關注。7月26日,中國工......
7月19日,《美國國家科學院院刊》(PNAS)在線發表了中國科學院分子植物科學卓越創新中心王成樹研究組完成的題為Abacterial-likePictet-Spenglerasedrivestheev......