將數據存到DNA里!全世界的信息只有1公斤重
大數據時代,我們在網絡上每一個動作,比如網上沖浪、觀看視頻,甚至跑步、走路等日常行為,每分每秒都在產生大量數據。它們如一條條河流,匯聚成數據的汪洋大海。
如此大量的信息如何存儲?珍貴的數字記憶要如何長久可靠地保存?科學家們想到了一種方法,將數據寫入活細菌的DNA中!
最近,美國哥倫比亞大學的研究人員通過改變環境電壓,引導“基因魔剪” CRISPR-Cas系統,將“hello world”翻譯成堿基語言,錄入大腸桿菌的DNA中。在繁衍80代以后,這些大腸桿菌體內儲存的數據仍然基本完好無損。
相關研究發表在1月11日的《自然·化學生物學》雜志。
數據時代,存儲的革新
在地球生命系統中,DNA 可謂無處不在。自然將生命的遺傳信息存儲在 DNA 中,人類也可以將數據信息存儲其中。
計算機的二進制語言只需要0和1兩個符號,即可編碼所有信息。生命的本質也是一種語言,那就是由 A、T、C、G 四種堿基串聯而成的 DNA ,四種堿基的順序蘊藏著生命的信息。
早在上世紀80年代末,就有人提出,或許可以將計算機的二進制數字語言轉換成DNA的四種堿基語言,從而將數據信息存儲在DNA上。讀取時只要反向進行DNA測序即可。相比于人類津津樂道的硅,DNA 簡直是數據存儲的理想載體。首先,DNA 的存儲密度非常大。如果我們能夠像大腸桿菌那樣包裝DNA,那么全世界的數據信息都可以儲存在1公斤重、只占粉筆盒大小空間的一堆 DNA 中。
其次,一般物理存儲設備使用壽命往往不到10年,DNA 則可將遺傳信息完整保存100年以上;如果是在零下18℃以下的低溫環境中,甚至可保存上萬年、數十萬年。
第三,DNA 存儲過程耗能極少。要存儲同樣大小的信息,DNA 的耗能量只相當于閃盤的億分之一。
人工合成 DNA 帶來希望
在實際操作中,二進制數字語言要如何轉換成DNA的四種堿基語言呢?2012年,哈佛大學遺傳學家喬治·丘奇團隊確立的規則是,用堿基A、C編碼二進制的0,G、T編碼二進制的1。
經過簡單翻譯,一本包含大約5.34萬個單詞的書籍、11張JPG圖片、一段簡短的計算機程序,全部被編碼進不到億萬分之一克的DNA微芯片中。這些文件大小相當于659千字節。之后,研究人員利用 DNA 測序技術成功閱讀了這本書,雖然略有瑕疵地發現了22個錯誤。
幾個月后,歐洲生物信息研究所采用另一種策略,同樣將大小為739千字節的文件寫入人工合成DNA中,讀取正確率接近100%。
這兩項研究讓人們看到了DNA存儲技術的希望,也開啟了研發熱潮。之后,存儲數據的大小不斷突破上限,從22兆字節,到200兆字節,再到維基百科所有16GB 的數據。
不過,人工合成DNA數據存儲技術要實現商業化應用,還有一些重大問題要解決。
一是成本過高,目前人工合成存儲1兆字節數據的DNA,需要3500美元,解碼過程還需要額外的1000美元。二是無論存儲還是讀取過程都需要專業設備,個人使用極不方便。三是DNA保存需要低溫環境,否則長時間容易發生 DNA 降解,導致數據失真或丟失。
活細菌蘊藏著新可能
既然人工合成 DNA 有缺陷,那能不能借用活細菌的 DNA 呢?比如大腸桿菌,在實驗室只需要少量的營養物質就能茁壯成長,成本應該也會低很多。
事實上,早在2017年,丘奇團隊就開創性地利用“基因魔剪” CRISPR–Cas 技術,將編碼信息的DNA片段送入細菌體內。CRISPR–Cas 系統可以對任何DNA序列進行精準修改,如將堿基A替換成堿基G,或者刪除、插入、替換一段特異的DNA序列,就像我們使用 Word 軟件編輯文字一樣。
實驗中,丘奇團隊將一些黑白圖像和一張飛馳駿馬動圖編碼為DNA序列,插入大腸桿菌的基因組中。在大腸桿菌經過多代繁殖后,研究人員仍然能夠還原動圖信息,正確率達90%以上。
這一次,哥倫比亞大學的研究人員則進一步發展了該方法。他們用電化學方法調控 CRISPR 系統看是否行使功能。需要存儲的二進制信息先被轉換為DNA序列,并插入環狀質粒(一種穩定的DNA環),然后隨質粒轉入大腸桿菌體內。
通過改變化學試劑的濃度,就可以改變細菌周圍的電壓,這時一些特定的環狀質粒拷貝數會顯著增加。CRISPR 系統感知到這種變化,并將質粒中的插入片段(目標DNA序列)寫入細菌基因組,在生物體內實現數據信息的自動存儲——這就像為存儲動作設置了一個開關。
DNA轉座子也稱跳躍基因,可被用作基因工程工具。近日,中國科學院動物研究所張勇和王皓毅研究組開展了迄今為止最大規模的DNA轉座子活性篩選,構建了目前最大的活躍DNA轉座子數據集,極大擴展了基于DNA轉......
5月29日,中國科學院深圳先進技術研究院研究員姜青山、高級工程師黃小羅、中國農業科學院深圳農業基因組研究所戴俊彪研究員等聯合在SmallMethods發表最新研究成果。研究人員設計了一種名為"......
II型DNA拓撲異構酶是一種普遍存在的酶,在調控雙鏈DNA的拓撲結構中起著關鍵作用,參與了一系列最基本的DNA代謝過程,包括DNA復制、轉錄及重組等,并在原核和真核生物中得到了廣泛的研究--它們被分類......
RNA(核糖核酸)研究長期處于DNA(脫氧核糖核酸)研究的“陰影”之下。如今,科學家強烈要求大力推動RNA研究。RNA具有許多不同的形狀和功能。圖片來源:DARRYLLEJA據《科學》報道,5月30日......
DNA甲基化是表觀遺傳修飾的重要組成部分,可以通過改變染色質的結構、DNA的穩定性以及DNA和蛋白質的結合程度調控基因表達。在植物DNA甲基化的建立和維持過程中,植物特有的RNA聚合酶V(PolV)通......
廣州醫科大學基礎醫學院教授馮杜團隊研究揭示了線粒體DNA(mtDNA)質量控制的新機制,報道了線粒體轉錄因子A(TFAM)作為自噬受體介導胞質中mtDNA的清除,進而限制炎癥反應。相關成果5月23日在......
·目前臨床上應用比較多的藥物有兩類:一類是小分子藥物,另一類是蛋白類的抗體藥。這兩種藥物都作用于蛋白,而DNA等核酸藥物可作用于蛋白產生之前的基因層面,進而有效調控蛋白的表達。·我們每時每刻都在接觸D......
DNA的發現是人類研究地球生命遺傳本質的里程碑。地球上幾乎所有生命,從病毒、單細胞微生物、低等真核生物、動植物、哺乳動物,乃至人類都使用DNA遺傳物質進行細胞復制和生命繁衍。而mRNA的發現也是同樣重......
阿爾法折疊3通過準確預測蛋白質、DNA的結構以及它們如何相互作用,改變對生物世界和藥物發現的理解。圖片來源:深度思維/IsomorphicLabs《自然》8日報道了結構生物學最新進展——阿爾法折疊3的......
近日,四川大學華西公共衛生學院/華西第四醫院勞動衛生與環境衛生學系研究員李玲團隊揭示了DNA折紙技術是細胞信號空間調控的一種有前途的策略,為通過空間調控細胞信號通路來開發疾病的針對性藥物提供了典型范例......