在過去的二十年中,新技術、新方法的重大進步使蛋白質組學成為蛋白質科學家、生物學家和臨床研究人員的一個極其強大的工具1。隨著分析儀器的不斷發展,蛋白質組學研究的每一項技術進步都會產生更多的數據。與此同時也給生物信息學軟件的開發帶來了新挑戰。
當代基于高通量質譜的蛋白質組學方法使人們對生命過程獲得更深入的了解,同時產生大量的數據。這些原始數據需要高效自動化的計算機算法來保障蛋白質的定性定量結果的可靠性。
全球許多實驗室正在使用MaxQuant處理蛋白質組學數據,并借助精確蛋白質和肽定量算法獲得可靠結果。MaxQuant由來自德國馬克斯·普朗克生物化學研究所(MPIB)的計算系統生物化學組開發,免費提供給學術和非學術研究人員。該小組還開發了Perseus軟件平臺,用于解釋蛋白質定量和相互作用數據以及翻譯后修飾(PTMs)數據。
MaxQuant擁有強大的算法,可進行全面的數據分析。它使用肽搜索引擎Andromeda,并與Perseus結合在一起,為下游生物信息學分析提供了完整的解決方案2。MaxQuant通過標記對樣品進行定量、通過MaxLFQ算法對非標記的數據進行定量,憑借先進的非線性再校準算法獲得了較高的肽質量準確性。
MaxQuant通常用于液相色譜和串聯質譜(LC-MS/MS)鳥槍法蛋白質組學(shotgun proteomics)。這是一種識別復雜混合物中蛋白質的方法,用以提供更廣泛的動態范圍和蛋白質覆蓋范圍。
鳥槍法蛋白質組學是基于MS最常用的方法,通過在MS分析之前將蛋白質消化成肽段來研究蛋白質。
離子淌度可以為基于LC-MS的鳥槍蛋白質組學增加一個新的維度,成為提高蛋白質組的覆蓋率、定量精度和動態范圍的潛在推動力。但是新增加的淌度信息需要合適的軟件來提取由m/z、保留時間、離子淌度和信號強度共同構建的四維(4D)數據。增加離子淌度信息對蛋白質組學領域的影響顯而易見。例如被廣泛應用于蛋白質組學研究的,布魯克的timsTOF Pro,提供了更高的靈敏度、選擇性和MS/MS采集速度。新穎的設計允許離子在前段累積的同時后段的離子則根據其離子淌度依次釋放,在隨后的掃描中,選定的前體可以作為MS/MS的目標。這個過程稱為平行累積連續碎列,或PASEF?3。
獨特的捕集離子淌度(TIMS)技術幫助研究人員獲得所有檢測離子的碰撞截面(CCS)值,且具有高度可重復性的這些CCS值可用于進一步提高系統的選擇性,從復雜樣品和短梯度分析中獲得更加可靠的相對定量信息。
相關研究表明:結合了TIMS技術和PASEF方法的LC-MS鳥槍蛋白質組學,如虎添翼,在提高蛋白質組的覆蓋率、定量精度和動態范圍層面擁有無限潛能,從而實現快速超靈敏分析。PASEF技術可以提高分析速度,在較短的時間內分析更多的樣本,但同時也產生了大量的譜圖數據。如何處理大量的樣本群成為一個棘手的難題。
圖1:MaxQuant軟件全面支持布魯克4D-蛋白質組學數據解析
MPIB軟件開發人員采用MaxQuant shotgun蛋白質組學工作流程,從timsTOF Pro數據中提取豐富的信息,掌控由保留時間、離子淌度、質量和信號強度這些特征所構建的4D空間,使其更有利于肽、蛋白質和PTM的識別和定量。
TIMS對于軟件開發人員而言具有挑戰性,因為它不是新增添一個層面的信息,而是增加了一個新的維度。新的的MaxQuant 4D-Proteomics工作流程可以處理通過PASEF,dia-PASEF和Mobility Offset Mass Aligned(MOMA)生成的數據。
增加新維度可以延長算法處理時間,這對4D-蛋白質組學的軟件開發提出了重大挑戰。 最終,通過優化MaxQuant中的計算時間克服了這一問題,保證用戶可以在合理的時間范圍內獲得良好的結果。
圖2:用于分析大型質譜數據集的MaxQuant定量蛋白質組學軟件包的屏幕截圖。資料來源:Maxquant.org
隨著質譜技術的發展,MaxQuant的應用范圍不斷擴大,性能不斷提升以滿足蛋白質組學領域的未來需求。這些改進為肽段、蛋白和PTM的定性定量分析中提供更高的靈敏度和選擇性,從而幫助科學家開發蛋白質組學的新方法與新應用。儀器的升級也促進了MaxQuant的持續發展。MPIB軟件開發團隊的目標始終是擴展和改進MaxQuant,以滿足生物過程的復雜性和日益更新的質譜技術。
01 蛋白質組學臨床研究
MPIB計算系統生物化學團隊認為,蛋白質組學臨床研究將是未來4D-蛋白質組學的主要應用之一。目前,他們正與多個臨床小組合作,將基于MS的蛋白質組學引入臨床實踐。然而,對來自病人樣本的蛋白質組學數據的分析需要特殊算法,所需解決的問題包括:如何從個體差異性大的數據中提取有意義的蛋白質表達特征、如何將患者的基因組背景整合到蛋白質組學數據分析以及如何確定生物標志物并合理推測其效用。
為了解決上述問題,MPIB軟件開發人員正在努力利用機器學習算法對患者進行分類,并采用特征選擇算法來提取預測性蛋白質特征。不過新增的臨床測試引擎為軟件帶來了挑戰,目前尚不清楚蛋白質組學是否可以指導觀察分子或可以成為臨床診斷的主要組成部分。
圖3:timsTOF Pro儀器的設計。資料來源:www.Bruker.com
02 單細胞蛋白質組學
當今實驗室從單細胞基因組學和單細胞轉錄組學研究中獲得了大量的數據集,而單細胞蛋白質組學(SC-蛋白質組學)則是新興領域。單細胞蛋白質組學使研究人員能夠對單個細胞中的蛋白質進行定性定量分析,從而避免了從細胞信使RNA水平推斷蛋白質的需要4。不過這也給計算分析帶來了新的挑戰。
伴隨蛋白質組學的發展,MPIB研究人員對未來的需求充滿期待,并密切關注新興技術以建立量化標準。開發者們認為單細胞蛋白質組學將在未來幾年內得以實現。實現這一目的關鍵在于提高儀器的靈敏度和相應操作軟件的擴展更新。
圖4:該示例展示了dia-PASEF如何有效碎裂給定保留時間內釋放出的所有肽離子。
數據提供:F. Meier, A.-D. Brumer, M. Frank, A.Ha, I.Bludau, E. Voytik, S. Kaspar-Schoenefeld, M. Lubeck, O. Raether, R.Aebersold, B. Collins, H.-L. Rost and M. Mann ,“Parallel accumulation – serialfragmentation combined with data-independent acquisition (diaPASEF): Bottom-upproteomics with near optimal usage”,bioRxiv 656207(2020)。https://doi.org/10.1101/656207
數據非依賴性采集(DIA)靈敏度的提升,激勵MPIB計算系統生物化學團隊使用機器學習算法將DIA工作流程集成到MaxQuant中。DIA的成功依賴于關鍵的儀器功能,即保證采集速度前提下的分辨率、靈敏度、準確度和動態范圍。
研究人員使用timsTOF Pro進行實驗時,通過利用TIMS和PASEF的速度和靈敏度來實現DIA測量,這一全新的DIA方法被稱為dia-PASEF?。dia-PASEF?所生成的4D數據提供的離子淌度信息,幫助軟件開發人員進行特征的對齊和提取。這些最新的技術進步以及DIA方法的發展為MPIB計算系統生物化學研究小組提供了新機遇。
由于儀器靈敏度的提高,DDA和DIA變得具有可比性。因此MaxQuant開發人員非常看好即將推出的DIA性能。
硬件操作對用戶來說已經越來越簡化,但是數據分析卻更具挑戰性,因為軟件必須分辨出哪些碎片屬于哪個分子。如前所述,解決這些挑戰將提供對蛋白質組學的更深入研究,擴展4D-蛋白質組學應用于臨床研究的可行性。
生物信息學軟件開發是一個不斷變化的領域,在未來會有更多的技術創新。隨著分析儀器的發展,MPIB計算系統生物化學團隊必須在軟件方面處理更多的信息,因為這些儀器在不斷擴展其動態范圍和性能。
通過MPIB計算系統生物化學研究團隊與其他機構和行業領導者之間的重要合作,可以對MaxQuant軟件平臺進行改進。這些合作包括旨在優化提高蛋白質組學技術的項目,以及MaxQuant提供了分析新興硬件平臺上獲取的數據所需的計算工具。這些合作的結果將用于開發軟件的未來版本,以優化4D-蛋白質組學工作流程。
1. J. Coxand M. Mann, “Quantitative, high-resolution proteomics for data driven systems biology”, Ann.Rev. Biochem. 80, 273–299 (2011). https://doi.org/10.1146/annurevbiochem-061308-0932162.
2. J. Cox, N. Neuhauser, A.Michalski, R.A. Scheltema, J.V. Olsen and M.Mann, “Andromeda: a peptide search engine integrated into the MaxQuant environment”, J. Proteome Res.10(4), 1794–1805 (2011). https://doi.org/10.1021/pr101065j
3. F. Meier, A.D. Brunner, S.Koch, H.Koch, M. Lubeck, M. Krause, N.Goedecke, J. Decker, T. Kosinski, M.A.Park, N. Bache, O. Hoerning, J. Cox, O. R?ther and M. Mann, “Online Parallel Accumulation-Serial Fragmentation (PASEF) with a novel trapped ion mobility mass spectrometer”, Mol. Cell. Proteomics 17(12),2534–2545 (2018). https://doi.org/10.1074/mcp.TIR118.0009004.
4. V. Marx, “A dream of single-cell proteomics”, Nat. Methods 16, 809–812(2019). https://doi.org/10.1038/s41592-019-0540-6
作者:Jürgen Cox,德國馬克斯·普朗克生物化學研究所,Gary Kruppa,布魯克·道爾頓
本文發表于《Spectroscopy Europe》 ,Vol. 32 No. 6 Dec/Jan 2020,第14-16頁
蘇州市疾病預防控制中心關于微生物飛行質譜儀等設備公開招標中標公告(SZCJ2023-G-043)【發稿時間:2023-11-06】一、項目編號:SZCJ2023-G-043號二、項目名稱:微生物飛行質......
公告信息:采購項目名稱高水平臨研專項設備品目貨物/設備/醫療設備/臨床檢驗設備采購單位中國醫學科學院北京協和醫院行政區域北京市公告時間2023年11月03日17:46獲取招標文件時間2023年11月0......
金屬元素分析是指對金屬元素的含量、組成、成分及其它性質進行測定的方法。主要包括對金屬中金屬元素的總量,包括銅、鋁、鉛、鋅、鎘等的測定,對金屬元素含量及其成分的分析。金屬元素分析主要是用來分析金屬中所含......
近日,布魯克公布了其第三季度財務業績報告。截至9月30日的三個月,布魯克收入為7.428億美元,同比增長16%;高于2022年第三季度的6.389億美元,超過了華爾街普遍預計的7.144億美元。布魯克......
為了向檢測實驗室提供明確的質量安全風險管理規范,提高分析檢測行業的整體水平,海關總署11月1日發布了《海關總署公告2023年第156號(關于發布《檢測實驗室質量安全風險管理通則》等60項行業標準的公告......
近日,自然資源部發布公告,《國土空間綜合防災規劃編制規程》等26項行業標準已通過全國自然資源與國土空間規劃標準化技術委員會審查,經2023年第7次部長辦公會審議通過,現予批準、發布,自2024年1月1......
XpresysLung作為IDH公司的診斷產品,給肺部結節患者帶來福音,該方案利用血液蛋白質組學技術針對組學水平下挖掘出來的潛在標志物進行進一步篩選,并利用算法在實際樣本中學習,最終挖掘出13個bio......
自然資源部關于發布《國土空間綜合防災規劃編制規程》等26項行業標準的公告《國土空間綜合防災規劃編制規程》等26項行業標準已通過全國自然資源與國土空間規劃標準化技術委員會審查,經2023年第7次部長辦公......
2023年11月1日,北京大學第一醫院發布《北京大學第一醫院科研平臺建設項目離子淌度4D組學質譜系統中標公告》,7766000.00元中標離子淌度4D組學質譜系統。詳細信息如下:一、項目編號:B070......
2023年11月1日,北京大學第一醫院發布《北京大學第一醫院科研平臺建設項目離子淌度4D組學質譜系統中標公告》,7766000.00元中標離子淌度4D組學質譜系統。詳細信息如下:一、項目編號:B070......