<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>

  • 最近,印度理工學院(位于德里)化學工程系進行了一項研究,使用液相色譜-質譜聯用技術(LC–MS)來區分單克隆抗體(mAb)中的異變體(糖型),能夠對其進行表征,揭示了在完整水平上可辨識的峰。

    盡管商業軟件中具備自動化峰檢測功能,但為了達到最優的真實陽性率,通常需要利用視覺檢查和手動調整。最近,印度理工學院(位于德里)化學工程系進行了一項研究,使用液相色譜-質譜聯用技術(LC–MS)來區分單克隆抗體(mAb)中的異變體(糖型),能夠對其進行表征,揭示了在完整水平上可辨識的峰。LCGC International采訪了文章的通訊作者Anurag Rathore,談論了他的部門的研究結果。

    您的論文(1)展示了您和您的合著者進行的一項研究,該研究使用基于機器學習(ML)的方法進行峰檢測,以促進商業許可生物類似藥與創新產品之間的直接比較。與其他方法相比,使用ML進行此操作的優勢是什么?

    與傳統的峰檢測方法不同,傳統方法需要有關樣本的預先信息,如基線扭曲、相位誤差和t1噪聲,而基于ML的技術需要的先驗知識最少。因此,減少了對手動調整和專家輸入的依賴,使過程更加自動化和流線化。此外,基于ML的方法對噪聲較不敏感,因此在信號與噪聲問題的環境中特別有利,確保了可靠的峰檢測,無需廣泛的手動干預。

    為什么峰檢測方法很重要?

    在治療蛋白(mAbs)分析的背景下,峰檢測方法之所以重要,原因如下:

    它允許精確識別和量化樣本中存在的不同分子物種,從而確保產品符合必要的質量標準。

    通過準確識別峰,制造商可以監控并優化藥物開發過程。這有助于識別制造過程中的任何偏差或不一致性,使能及時進行調整。

    對于完整質量分析而言,這一點很重要,因為它用于驗證治療蛋白的分子質量,并確保蛋白質正確組裝并且具有預期的分子質量。

    在結構生物學方面,峰檢測有助于分析蛋白質和其他生物分子的結構組分。這些信息對于理解這些分子在生物系統中的功能和相互作用至關重要。

    您是否發現某些色譜或光譜技術通過使用基于ML的方法得到了優化?

    是的,由于其復雜和高維數據特性,某些色譜和光譜技術可以通過使用基于ML的方法得到優化,這些特性使得使用傳統方法處理具有挑戰性。一些常見的例子包括高分辨率液相色譜-質譜聯用技術(LC–MS)。研究表明,像卷積神經網絡(CNN)和循環神經網絡(RNN)這樣的ML技術在更高的真實陽性率檢測方面遠遠優于其他技術。

    在進行峰檢測分析時,ML是您的最佳選擇嗎?是否考慮過其他人工智能(AI)方法?

    我們針對我們的問題應用了傳統的峰檢測算法,如部分最小二乘判別分析(PLS-DA)和局部加權回歸(LWR)。它們的結果反映了在多個峰檢測方面的準確度較低,并且需要大量的計算負載。我們還部署了人工神經網絡來完成類似的峰檢測任務,但它們無法從光譜數據中提取關系,導致了不準確的檢測。我們開發的基于卷積神經網絡的方法在準確性、計算效率和操作效率方面超越了傳統算法以及基于人工神經網絡的ML方法。

    簡要陳述這項研究的發現。

    在初始階段,使用LC–MS區分了mAb的異變體(糖型),揭示了在完整水平上的可辨識峰。為了全面識別在完整水平分析中的每個峰,采用了一種深度學習方法,利用了CNN。使用傳統軟件進行峰識別時,只有五個峰被檢測到,閾值為0.5。CNN模型在同一條件下識別出七個主要峰,許多重疊峰在主峰內,表明了優越的檢測能力。CNN模型在0.5閾值的真實陽性率為0.9,概率AUC值為0.9949,結果良好。結果還與一些傳統算法如PLS-DA和LWR的峰檢測進行了比較,CNN模型在這兩個方面都表現出更高的計算效率。

    您的發現是否與您的假設相符?

    是的,正如所假設的,利用機器學習,特別是CNNs,會提高峰檢測的準確性和真實陽性率,相較于傳統方法。使用傳統軟件進行峰識別時,只有五個峰被檢測到,閾值為0.5。CNN模型在同一條件下識別出七個主要峰,許多重疊峰在主峰內,表明了優越的檢測能力。

    有沒有什么特別出乎意料的地方?

    CNN模型能夠準確檢測多個重疊峰而不受到噪聲影響的能力是出乎意料的。

    在您的工作中是否遇到了任何限制或挑戰

    本研究的一些限制包括:

    如果沒有進一步驗證,該模型可能不會很好地推廣到其他數據集或不同的實驗條件。

    盡管準確度高,但仍然需要專家驗證和解釋檢測到的峰以確認發現。

    CNN可能復雜且難以解釋,使得理解特定峰識別背后的原理變得具有挑戰性。

    在這種類型的分析中,您能推薦哪些最佳實踐,無論是儀器參數還是數據分析?

    我們推薦的有效數據分析的最佳實踐包括:

    通過嘗試不同的濾波器大小、學習率和批量大小來調整超參數,以獲得最佳結果。

    為了在計算速度和準確性之間獲得最佳平衡,相應地調整CNN架構的層數。

    在必要時實施dropout層和正則化技術以避免過擬合。

    對于儀器參數,應該關注:

    使用熟練的LC系統和柱子有效分離和估算mAb的完整質量。在我們的研究中,我們使用了Agilent 1260 Infinity Bio-inert Quaternary LC系統。

    在分析前校準MS色譜圖的正離子模式。

    將毛細管氣體溫及其電壓以及碎片器的電壓設置在最佳水平。

    應用精確算法在可用軟件中,如Agilent MassHunter定性分析和BioConfirm,用于解卷積MS色譜圖。

    這項研究的下一步是什么,您是否計劃參與改進這項技術?

    我們可以探索將CNN與其他AI技術(如分類器)結合使用,以進一步增強檢測能力和魯棒性。開發減少計算負載的策略,如并行處理或將數據集分成較小的區域,使方法更高效和可擴展。

    您對AI和ML在色譜和光譜數據分析中的看法是什么?

    AI和機器學習可以顯著提高色譜和光譜分析結果的可靠性和深度,通過提高準確性、效率和可擴展性。由色譜和光譜技術產生的高維復雜數據集可以通過ML算法輕松處理,提取可能被傳統方法遺漏的有意義的特征和模式。

    Anurag S. Rathore is a professor in the Department of Chemical Engineering at the Indian Institute of Technology in Delhi, India.


    參考文獻

    1. Nikita, S.; Bhattacharya, S.; Manocha, K.; Rathore, A. S. Deep Learning Framework for Peak Detection at the Intact Level of Therapeutic Proteins. J. Sep. Sci. 2024, 47 (11),139888. DOI: 10.1002/jssc.202400051

    相關文章

    2024年諾貝爾化學獎評選結果揭曉!

    北京時間10月9日下午5點45分許,2024年諾貝爾化學獎揭曉。美國科學家DavidBaker獲獎,以表彰其在計算蛋白質設計方面的貢獻;另一半則共同授予英國科學家DemisHassabis和JohnM......

    基因突變影響蛋白質穩定性有新解

    科技日報北京9月27日電(記者張佳欣)25日發表在《自然》雜志的一項研究稱,西班牙基因組調控中心和英國威康桑格研究所的研究人員發現,基因突變對蛋白質穩定性的影響遵循著極其簡單的規律。這一發現對加速開發......

    化學所在時空特異性蛋白質遞送及基因編輯研究方面獲進展

    蛋白質是生命體內最重要的生物大分子之一,在生命活動過程中執行著多種關鍵功能。利用外源性獲取的蛋白質,可以在細胞及體內實現生物大分子的化學標記與功能調控,進而應用于生命機制的解析研究及疾病的靶向治療。然......

    針對治療蛋白質的完整性水平進行峰檢測的深度學習框架

    最近,印度理工學院(位于德里)化學工程系進行了一項研究,使用液相色譜-質譜聯用技術(LC–MS)來區分單克隆抗體(mAb)中的異變體(糖型),能夠對其進行表征,揭示了在完整水平上可辨識的峰。盡管商業軟......

    針對治療蛋白質的完整性水平進行峰檢測的深度學習框架

    最近,印度理工學院(位于德里)化學工程系進行了一項研究,使用液相色譜-質譜聯用技術(LC–MS)來區分單克隆抗體(mAb)中的異變體(糖型),能夠對其進行表征,揭示了在完整水平上可辨識的峰。盡管商業軟......

    影響運動欲望的“分子開關”發現

    運動有益健康,但人們并非總是想去鍛煉,這究竟受到什么影響?西班牙國家癌癥研究中心薩比奧研究團隊發現了與身體運動有關的3種蛋白質,這些蛋白質可能是激活運動欲望的“開關”。相關論文發表在最新一期《科學進展......

    藻類毒素中發現最大蛋白質

    科技日報訊(記者張佳欣)據新一期《科學》雜志報道,美國加州大學圣迭戈分校科學家發現了生物界迄今最大的蛋白質,比此前已知的最大蛋白質——人類肌聯蛋白還要大約25%。研究人員表示,這是蛋白質界的“珠穆朗瑪......

    預測蛋白質序列的新AI模型問世

    瑞士洛桑聯邦理工學院開發了一種名為CARBonAra的新型人工智能(AI)驅動模型。該模型可以根據不同分子環境所施加限制的主鏈支架預測蛋白質序列,有望在蛋白質工程及包括醫學和生物技術在內的多個領域帶來......

    預測蛋白質序列的新AI模型問世

    使用CARBonAra進行序列預測(示意圖)。圖片來源:瑞士洛桑聯邦理工學院科技日報北京8月8日電(記者張佳欣)瑞士洛桑聯邦理工學院開發了一種名為CARBonAra的新型人工智能(AI)驅動模型。該模......

    新品上市|AndromedaX全新蛋白質表達和功能快速篩選系統

    當您從事抗原生產酶促蛋白優化小分子藥物靶蛋白表達重組膜蛋白重組蛋白研發和生產是否有如下困擾常規技術手段太過繁雜,耗時耗力?蛋白表達水雖然高,但無法同時監測其構象穩定性信息?無法使用粗裂解液進行快速篩選......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频