<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>

  • 代謝組學研究已經確定了介導細胞信號傳導、競爭和疾病病理學的小分子,部分原因是大規模社區努力測量數千種代謝物標準品的串聯質譜。然而,在臨床樣品中觀察到的大多數光譜不能與已知結構明確匹配。

    令人驚訝的是,用于闡明小分子結構的深度學習方法無法與經典統計方法相媲美,科學家認為這可能是由于缺乏納入當前神經網絡架構的領域內知識。

    麻省理工學院(MIT)的研究團隊介紹了一種用于非目標代謝組學的神經網絡驅動的工作流程,即使用光譜 Transformer 進行代謝物推斷(Metabolite Inference with Spectrum Transformers,MIST),以用化學結構注釋串聯質譜峰。與現有方法不同,MIST 通過用化學式表示對峰進行編碼、隱式特征化成對中性損失并訓練網絡以額外預測子結構片段,將領域洞察融入其架構中。

    與標準神經結構和最先進的內核方法相比,MIST 在 70% 以上代謝物標準的指紋預測任務中表現良好,檢索 66% 的代謝物具有同等或更高的準確率,其中 29% 的準確率更高。

    該研究以「Annotating metabolite mass spectra with domain-inspired chemical formula transformers」為題,于 2023 年 8 月 17 日發布在《Nature Machine Intelligence》。

    image.png

    非靶向代謝組學是增進科學家對細胞和環境生物化學理解的重要工具。液相色譜串聯質譜(LC-MS/MS)是進行此類分析以識別新的且通常重要的代謝物的主要實驗方法:分子通過柱色譜分離,電離并根據質量進行測量(MS1),并通過更高能量碰撞(MS2)進行碎片化,產生一組具有不同質荷比的帶電片段,以峰譜的形式進行測量。

    然而,這些實驗的分析存在瓶頸,因為無法用產生這些碎片的分子的化學結構準確地注釋這些觀察到的碎片光譜,多達 98% 的碎片光譜尚未注釋。在許多情況下,光譜與已知的標準光譜并不十分相似,必須使用不完善的計算工具來推斷未知分子的性質。改進這個單一的推理步驟有機會增加在所有常規非目標代謝組學實驗中收集的信息。

    盡管深度學習最近取得的突破已經「神經化」了鄰近的蛋白質結構預測領域,但代謝組學卻并非如此。先進的計算代謝組學注釋工具仍然依賴于手工設計的啟發式方法和核函數(即用于比較質譜特性的定量函數)。

    人們已經做出了一些努力來利用深度學習來改進代謝組分析。光譜的表示學習(例如 Spec2Vec、MS2DeepScore 和正弦嵌入)可用于學習光譜之間更有意義的距離,以促進分子網絡。前向模型結合了前饋網絡和圖神經網絡,可以直接從分子結構預測碎片譜。

    在反方向上,MSGenie、Spec2Mol 和 MetFID 直接嘗試從質譜生成指紋或 SMILES 字符串,但在使用等效數據進行訓練時,沒有任何方法優于 CSI:FingerID。深度內核學習也被用來改進 CSI:FingerID,但這種方法仍然從根本上依賴于通過手工制作的輸入特征數十年的專業知識,并且無法在獨立研究中對新數據進行編輯、重新訓練或微調。

    研究人員假設這些神經網絡方法總體上無法超越其統計對應方法,因為它們缺乏架構中的領域知識。通過將峰值質量視為離散的分箱值,神經表示不太能夠在峰值之間和跨示例進行概括。

    image.png

    在最新的研究中,麻省理工學院的研究團隊使用 MIST 進行代謝物推斷,這是一種基于網絡的方法。MIST 沒有像之前的神經模型那樣將網絡應用于分箱光譜,而是首先將光譜表示為所有峰的化學式集。

    該團隊從質譜域引入歸納偏差:他們隱式地表征片段之間的中性損失關系,同時預測每個光譜中代謝物及其片段的結構,使用計算機前向增強為模型提供更多訓練數據,并引入一種新穎的「展開」架構來逐步提高指紋預測的分辨率。通過使用對比表示學習進行微調,可以進一步增強 MIST 使用已知生物分子大型虛擬庫中的結構注釋光譜的能力。令人興奮的是,它學習的潛在嵌入(神經架構的副產物)也可以用于對未注釋的光譜進行聚類,其距離比現有方法更能代表分子距離。

    image.png

    研究人員演示了如何使用 MIST 來預測分子結構指紋,并通過對比學習來學習有意義的連續表示或潛在空間。對于指紋預測任務,MIST 實現了優于現有方法的準確性。對于結構闡明(如檢索)和將光譜組織到分子網絡中的任務,MIST 學習的對比嵌入證明非常有效。這兩項任務對于臨床微生物組數據的前瞻性注釋都是有效的,正如對假定的和差異豐度的二肽分子和生物堿化合物的注釋示例所證明的那樣。

    質譜模型開發的一個關鍵困難是缺乏良好的標準化基準,而這對于機器學習任務的進展至關重要。CASMI 競賽同時評估化學式注釋和檢索注釋,這也是用于檢索的數據庫的功能,使得這種比較難以完全解卷積;根據設計,相關訓練數據不受限制或提供。

    為了促進該領域的未來進展,研究人員在一小部分易于處理的公共 GNPS 數據子集上提供了完全基準化的模型消融,用于注釋和指紋預測。這些標準將使跨研究的模型之間能夠更好地進行比較。

    這項工作也存在局限性。MIST 高度依賴于 MS1 分配的正確化學式。更高精度的公式注釋和用于此任務的新方法將與 MIST 產生協同作用。MIST 目前僅針對帶注釋的光譜進行訓練,而不針對未注釋的光譜進行訓練。未來的工作將探索預訓練等策略如何進一步提高結構解析模型的質量。

    MIST 提供了一種競爭性的神經解決方案,可將質譜和預測的化學式轉換為分子指紋或潛在空間嵌入,以進行結構闡明。正如蛋白質結構預測幾乎完全由神經網絡模型驅動一樣,研究人員估計小分子結構闡明管道也會發生類似的轉變。

    MIST地址:https://github.com/samgoldman97/mist

    論文鏈接:https://www.nature.com/articles/s42256-023-00708-3

    相關文章

    將領域知識引入神經網絡,MIT團隊用光譜Transformer研究非靶向代謝組學圖譜

    代謝組學研究已經確定了介導細胞信號傳導、競爭和疾病病理學的小分子,部分原因是大規模社區努力測量數千種代謝物標準品的串聯質譜。然而,在臨床樣品中觀察到的大多數光譜不能與已知結構明確匹配。令人驚訝的是,用......

    將領域知識引入神經網絡,MIT團隊用光譜Transformer研究非靶向代謝組學圖譜

    代謝組學研究已經確定了介導細胞信號傳導、競爭和疾病病理學的小分子,部分原因是大規模社區努力測量數千種代謝物標準品的串聯質譜。然而,在臨床樣品中觀察到的大多數光譜不能與已知結構明確匹配。令人驚訝的是,用......

    將領域知識引入神經網絡,MIT團隊用光譜Transformer研究非靶向代謝組學圖譜

    代謝組學研究已經確定了介導細胞信號傳導、競爭和疾病病理學的小分子,部分原因是大規模社區努力測量數千種代謝物標準品的串聯質譜。然而,在臨床樣品中觀察到的大多數光譜不能與已知結構明確匹配。令人驚訝的是,用......

    中藥基礎物質、代謝及代謝組學研究方案

    中藥組成成分復雜、作用環節多樣,中藥藥效物質基礎以及臨床療效機理的闡明,已成為中醫藥現代化研究的重要內容。如何快速地從海量的質譜數據中獲取有價值的信息,減輕繁重的數據處理工作量,成為廣大中醫藥研究工作......

    研究發現提高鮮食玉米耐熱性基因

    近日,廣東省科學院南繁種業研究所玉米種業室團隊以甜玉米為研究對象,對甜玉米高溫下的表型特征變化進行觀察,發現了提高鮮食玉米耐熱性基因。相關研究論文發表于InternationalJournalofMo......

    突破國外封鎖!我國自主研發的核磁共振儀器開始量產

    核磁共振儀器被譽為“尖端醫療設備皇冠上的明珠”,對于心腦血管、神經和腫瘤等多種重大疾病影像診斷有重大意義,但這項技術長期被國外封鎖。不久前,我國自主研發的核磁共振儀器研制成功,開始量產。將核磁共振儀器......

    大咖面對面丨代謝組學前景廣闊質譜構建核心平臺

    臨床質譜近年來發展迅猛,許多診斷標志物都是小分子代謝物,表明代謝組學從研究到臨床轉化的路徑更快;與此同時,代謝組學近年來在生命醫學、植物學、暴露組學等研究中發揮了越來越重要的作用,幾乎每一項多組學研究......

    強強聯手,合作雙贏“全景和空間代謝組學新技術”研討會

    強強聯手,合作雙贏——中國科學院大連化學物理研究所與島津共同舉辦“全景和空間代謝組學新技術”研討會代謝組學作為系統生物學的重要組成部分,已滲透到眾多研究領域,并廣泛應用于疾病診斷、個性化醫療、藥物研發......

    川大團隊揭示神經元進化缺失的一環,填補神經元空白

    1997年,從高中考上北京大學生命科學學院以來,26年間陳強始終在和生命科學打交道。從北大博士畢業之后,他來到哈佛大學醫學院做了6年的博士后研究。2013年,陳強回國加入四川大學生物治療國家重點實驗室......

    Nature:神經退變和腦衰老過程中神經元DNA修復新機制

    近期,Nature 發表了題為:ANPAS4‐NuA4ComplexCouplesSynapticActivitytoDNARepair的研究論文【1】,揭示了神經元在外部刺激下維持基因組穩......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频