在不斷探索以前未知的CRISPR基因編輯系統的過程中,研究人員從溫泉、泥炭沼澤、糞便甚至酸奶中搜尋各種微生物。現在,由于生成式人工智能的進步,他們可能只需按一下按鈕就可以設計出這些系統。
據《自然》報道,日前,研究人員公布了他們如何使用一種名為蛋白質語言模型的生成式人工智能工具設計CRISPR基因編輯蛋白質的細節,并證明其中一些系統如預期那樣工作。
今年2月,另一個團隊宣布,他們已經開發出了一種基于微生物基因組的模型,并用它來設計新的CRISPR系統,該系統由DNA或RNA切割酶和RNA分子組成。
“這真的只是皮毛而已。這表明,用機器學習模型設計這些復雜系統是可能的。”機器學習科學家、美國生物技術公司Profluent首席執行官Ali Madani說。4月22日,Madani團隊在預印本服務器bioRxiv上公布了一篇尚未經過同行評審的論文,報告了他們所說的“首次完全利用機器學習設計的蛋白質成功編輯人類基因組”。
中國香港大學合成生物學家Alan Wong表示,自然產生的基因編輯系統在它們可以靶向的序列以及可以做出的改變方面存在局限性。因此,對于某些應用來說,找到合適的CRISPR可能是一個挑戰。“利用人工智能擴大編輯的范圍可能會有所幫助。”他說。
盡管像ChatGPT這樣的聊天機器人是以現有文本進行訓練后處理語言的,但CRISPR設計人工智能是在大量生物數據上進行訓練的,這些數據是蛋白質或基因組序列形式的。這一“預訓練”步驟的目標是讓模型深入了解自然發生的遺傳序列,比如哪些氨基酸傾向于組合在一起。然后,這些信息可以應用于創建全新序列之類的任務。
Madani團隊此前曾使用他們開發的蛋白質語言模型ProGen來開發新的抗菌蛋白。為了設計新的CRISPR,該團隊用數百萬種不同的CRISPR系統重新訓練了一個更新版本的ProGen。
由于CRISPR基因編輯系統不僅包括蛋白質,還包括指定其靶點的RNA分子,Madani團隊開發了另一個人工智能模型來設計這些“引導RNA”。
然后,該團隊使用神經網絡設計了數百萬個新的CRISPR蛋白序列,這些序列屬于自然界中發現的數十個不同的此類蛋白質家族。
為驗證人工智能設計的CRISPR是否是真正的基因編輯器,Madani團隊合成了與CRISPR-Cas9系統中200多種蛋白質設計相對應的DNA序列。
當研究人員將這些序列——Cas9蛋白和“引導RNA”——插入人類細胞時,許多基因編輯器能夠精確地切割基因組中的預期靶點。
最有前景的Cas9蛋白——一種名為OpenCRISPR-1的分子,在切割靶向DNA序列方面與廣泛使用的細菌CRISPR-Cas9酶一樣有效,而且它在錯誤的地方切割的次數要少得多。研究人員還使用OpenCRISPR-1設計創建了一個堿基編輯器——這是一種精確的基因編輯工具,可以改變單個DNA的“字母”,發現它也與其他堿基編輯系統一樣高效,而且不太容易出錯。
另一個團隊由美國斯坦福大學計算生物學家Brian Hie和美國Arc研究所生物工程師Patrick Hsu領導,他們使用了一種能夠生成蛋白質和RNA序列的人工智能模型。這個名為EVO的模型在來自細菌和古細菌以及其他微生物序列的8萬個基因組上進行了訓練,總計有3000億個DNA堿基。Hie和Hsu的團隊尚未在實驗室測試其設計。但他們預測,該團隊設計的一些CRISPR–Cas9系統的結構與天然蛋白質的結構相似。這項工作也在預印本服務器bioRxiv上公布。
西班牙巴塞羅那分子生物學研究所的計算生物學家Noelia Ferruz Capapey說:“這太神奇了。”與一些獲得專利的基因編輯工具不同,研究人員可以無限制地使用OpenCRISPR-1分子,這給她留下了深刻印象。
Madani說,希望人工智能設計的基因編輯工具比現有的CRISPR更適合醫學應用。他補充說,Profluent希望與開發基因編輯療法的公司合作,以測試人工智能生成的CRISPR。
相關論文信息:https://doi.org/10.1101/2024.04.22.590591
https://doi.org/10.1101/2024.02.27.582234
在生命科學領域,基因編輯技術尤其是CRISPR/Cas9系統的出現,為科學研究帶來革命性突破。這項技術改變了人類對基因的認知,重新定義了自然選擇與人工干預間的界限。老百姓眼中,基因編輯可能也是類似于“......
在生命科學領域,基因編輯技術尤其是CRISPR/Cas9系統的出現,為科學研究帶來革命性突破。這項技術改變了人類對基因的認知,重新定義了自然選擇與人工干預間的界限。老百姓眼中,基因編輯可能也是類似于“......
華南農業大學園藝學院教授夏瑞團隊在國家自然科學基金等項目的資助下,開發了一種基于基因共線性進行物種基因組基因結構注釋矯正的工具——SynGAP(Synteny-basedGenestructureAn......
科技日報訊 (記者雍黎)記者9月9日從西南大學獲悉,該校資源昆蟲高效養殖與利用全國重點實驗室教授代方銀團隊發現了調控壽命的新基因OSER1,并在家蠶、線蟲、果蠅等多物種中進行研究,揭示了其調......
9月5日,記者在“千種海洋生物基因測序項目”暨全球海洋微生物基因庫建設及應用成果聯合發布會上獲悉,華大生命科學研究院聯合山東大學、英國東安格利亞大學等機構,構建了迄今為止最完整的海洋微生物基因數據庫,......
·NTRK和RET融合是該檢測支持檢測的兩種基因變化。這些特性支持該體外診斷試劑作為兩種癌癥藥物的伴隨診斷方法——拜耳(BAYRY.US)的Vitrakvi和禮來(LLY.US)的Retevmo。拜耳......
記者27日從西南大學獲悉,該校資源昆蟲高效養殖與利用全國重點實驗室代方銀教授團隊發現了調控壽命的新基因OSER1,并在家蠶、線蟲、果蠅等多物種中研究揭示了其調控機制。該基因對壽命的影響得到人類受試者研......
隨著經濟社會的不斷發展,人們對豬肉的偏好也發生改變,更加偏愛吃優質的瘦肉。我國地方豬肉質優良,但普遍肥肉多、瘦肉少。比如我國“四大名豬”之一的湖南地方豬寧鄉花豬,瘦肉率僅38.6%,而國外引進豬種(杜......
美國科學家發現了DNA內長期潛伏的“空間語法”,這是理解基因活動如何在人類基因組中編碼的關鍵。這項研究或重塑科學家對基因調控的理解,更深入地揭示遺傳變異如何影響發育或疾病中的基因表達。相關論文發表于《......
科技日報北京8月21日電 (記者劉霞)美國科學家發現了DNA內長期潛伏的“空間語法”,這是理解基因活動如何在人類基因組中編碼的關鍵。這項研究或重塑科學家對基因調控的理解,更深入地揭示遺傳變異......