7月31日,中國科學院深圳先進技術研究院合成生物學研究所胡政課題組與廈門大學數學科學學院周達課題組合作,在《自然-生物技術》(Nature Biotechnology)上,發表了題為PhyloVelo enhances transcriptomic velocity field mapping using monotonically expressed genes的研究論文,提出了新穎的單細胞分化軌跡推斷的算法框架,并命名為PhyloVelo。該方法通過聯合單細胞轉錄組數據和譜系示蹤數據,鑒定隨細胞分裂而表達量呈單調遞增或遞減的基因即單調表達基因,并利用演化方法估計單調基因的RNA轉錄變化速度,以構建單細胞轉錄組速度場(RNA velocity fields),實現對細胞分化軌跡的高精準推斷。
細胞分化和命運決定是生命的奧秘之一,也是生命科學領域的核心問題,揭示其規律和機制對于探索生命現象和促進醫學發展具有重要意義。然而,準確地追蹤細胞的動態分化軌跡并非易事,尤其是在疾病等干擾情況下的細胞命運轉換過程,存在較大的隨機性和難以預測性。當前,單細胞轉錄組測序(scRNA-seq)是研究細胞分化的強有力的技術,可以通過分析單個細胞的轉錄組狀態來推斷細胞分化的動態過程。尤其是基于信使RNA(mRNA)的剪切動力學而發展起來的RNA速度模型(RNA velocity),可預測單細胞轉錄組在“過去”或“未來”時間的狀態,是單細胞軌跡推斷的經典算法。然而,由于單細胞測序技術與mRNA轉錄/剪切動力學的高度復雜性,RNA速度模型在實際應用中常出現錯誤推斷或不穩健的問題。
本研究提出利用單細胞系統發育樹的枝長信息代替物理時間,聯合單細胞轉錄組數據,可以探究基因表達隨著枝長(即時間)的變化規律,特別是鑒定隨細胞分裂而表達量呈單調遞增或遞減的基因(即單調表達基因),其RNA變化速度可以利用分子演化模型進行定量估計,從而構建單細胞轉錄組速度場,實現對細胞分化軌跡的高精準推斷(圖1)。
PhyloVelo算法主要分為兩部分。第一步是單調表達基因(monotonically expressed gene,MEGs)的識別,利用單細胞轉錄組數據和細胞系統發育樹(cell phylogeny)信息,通過帶漂移的擴散過程模型(diffusion process)和零膨脹的負二項分布(ZINB)來估計每個基因在系統發育樹上各個時間點的表達水平;進而,利用表達水平估計值和對應系統發育樹時間的相關性,篩選出那些隨著譜系時間線性單調增加或減少的基因,即單調表達基因MEGs(圖1)。第二步是基因表達變化速度的估計,假設每個MEG的表達水平隨著時間的變化速率是恒定的,即擴散方程中的漂移系數是常數;通過最大似然估計,可以得到每個MEG的漂移系數,從而得到每個細胞的單調基因表達變化速度的向量;將這個向量映射到降維空間(tSNE, UMAP等)重建RNA速度場,可推斷每個細胞在過去一個單位時間(如一個細胞分裂或突變)的轉錄組狀態,即逆時間重建細胞分化軌跡(圖1)。
該研究在多種仿真數據和真實數據上對PhyloVelo算法的準確性和魯棒性進行了驗證。PhyloVelo都能夠高準確地推斷仿真數據中的線性、分叉和趨同等復雜分化結構,與真實分化軌跡高度一致(圖2)。此外,PhyloVelo還在小鼠早期胚胎發育中表現出優于RNA velocity的性能,能夠準確地識別出紅細胞系列中血液/內皮祖細胞作為最早期的細胞類型,且與細胞增殖能力呈強相關(圖3)。
除了小鼠胚胎發育外,PhyloVelo還準確解析了小鼠和人類的腫瘤演化、免疫細胞動態發育等其他生物過程中的復雜分化軌跡,并量化了細胞類型之間的狀態轉換概率。例如,在肺癌模型中,PhyloVelo揭示了癌細胞的逆向分化軌跡。在抗PD-1治療后的CD8+ T細胞中,PhyloVelo發現活化CD8+ T細胞的來源在免疫治療前后有明顯的變化,表明T細胞高度的命運可塑性。
總之,PhyloVelo是利用單細胞譜系和轉錄組數據重建細胞命運轉變的新方法,具有高度的準確性和魯棒性。PhyloVelo可以克服傳統RNA velocity方法的局限性,并可以發現隱藏在轉錄組數據中的“時鐘基因”,為揭示細胞分化的分子機制提供線索。PhyloVelo為研究生物發育和疾病進展提供了有力的工具,也為未來的單細胞譜系和轉錄組數據分析提供了新視角。為了方便使用,研究團隊在線發布了使用手冊和具體應用案例(詳見https://phylovelo.readthedocs.io/en/latest/)。
研究工作得到國家重點研發計劃、國家自然科學基金、廣東省杰出青年基金、中央高校基本科研專項資金、中國博士后基金和深圳合成生物學創新研究院等的支持。該研究由深圳先進院和廈門大學共同完成。
圖1.PhyloVelo算法框架示意圖
圖2.?PhyloVelo準確推斷仿真數據中的細胞分化軌跡
圖3.?PhyloVelo重構小鼠血液系統發育的細胞分化軌跡
圖4.?PhyloVelo使用手冊網站截圖
BeaconDiscovery?單細胞功能表征平臺將幫助研究者解鎖活體單細胞功能分析的全部潛力。它采用Beacon?的光電定位(OEP)和微流體芯片光技術,使研究人員能夠實時探索多模態和動態細胞反應,......
2025年4月26日,由北京市科學技術研究院分析測試研究所(北京市理化分析測試中心)、創新方法研究會科學工具專業委員會、北京理化測試技術有限公司主辦,北京市科學技術研究院生物技術與健康研究所、寧波華儀......
喉氣管狹窄(LTS)作為臨床上棘手的上呼吸道疾病,其典型特征是細胞外基質(ECM)異常沉積導致的氣道狹窄。隨著COVID-19等公共衛生事件中氣管插管應用的增加,醫源性LTS的發生率顯著上升。盡管手術......
國家知識產權局辦公室關于印發《知識產權數據使用手冊及開放目錄》的通知國知辦函服字〔2025〕153號各省、自治區、直轄市和新疆生產建設兵團知識產權局,各地方有關中心:為促進知識產權數據開發利用,提高知......
由于無法對蛋白實現擴增,因此在單細胞多組學的研究中,單細胞蛋白質組學是最具挑戰的研究,近年來已取得突飛猛進的進展。除了質譜儀檢測靈敏度的提升,在前端取樣、預處理和分離方面的巨大進步是重要因素,這和微流......
過去幾年里,單細胞蛋白質組學技術取得了長足發展,單細胞蛋白質組學逐漸走向成熟,后續有望廣泛應用于腫瘤異質性分析、免疫學研究、發育生物學、神經科學以及精準醫學等領域。然而,從技術發展成熟到實際場景應用分......
2月23日,記者從海南醫科大學獲悉,該校熱帶醫學院楊國靜教授團隊近日在國際醫學期刊《英國醫學雜志》在線發表論文《中國被忽視熱帶病負擔估計的差異:真實世界數據與GBD2021的比較研究(2004—202......
近年來,單細胞RNA測序技術(scRNA-seq)在揭示復雜生物系統和探索遺傳學及臨床研究中取得了突破性進展。然而,僅依賴單一的轉錄組信息往往難以區分分子相似但功能差異顯著的細胞類別。因此,融合多種模......
近日,中國農業科學院棉花研究所鄉村振興科技創新團隊牽頭構建了首個結合單細胞轉錄組、空間轉錄組及空間代謝組的棉花纖維起始發育圖譜。利用該圖譜可以識別關鍵基因的表達模式及其與代謝途徑的關系,深入剖析纖維發......
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿......