單細胞測序數據集和考古發掘現場之間存在一種有趣的對偶:從某種意義上來說,它們都是關于歷史的壓縮快照。化石只有在與相關地層相關聯時才具有完全意義,考古發現只有在精確定年后才能解釋歷史。而現在,研究人員發現了一種隱含在單細胞測序數據中的時間信息:時鐘樣染色質可及性。利用這種細胞內在的“分子時鐘”,我們可以重構細胞群體的演化歷史。
單細胞有絲分裂年齡就像一個“時鐘計時器”:與其后代相比,祖先細胞的有絲分裂年齡較低;與晚近發生的細胞相比,古早發生的細胞表現出較低的有絲分裂年齡。假如存在一種單細胞有絲分裂年齡的測量工具,它將能為單細胞測序數據集提供細胞出生序列的精確時間參考,極大地幫助我們理解復雜的個體發育軌跡以及疾病發生發展進程。然而,對單細胞數據進行時間序列分析通常需要采用特別的實驗手段,如使用化學標記、高深度體細胞突變測序、譜系特異性反向遺傳標記、多時點采樣、單細胞甲基化測序等。為了從任意高通量單細胞測序數據集中重建精確的發育軌跡,需要找到嵌入在數據中的、用于報告細胞年齡的內在生物標志物,從而進行細胞年齡推斷。
2024年5月9日,優樂復生張翼博士與武漢大學王行環教授等在 Nature Biotechnology 期刊發表了題為:Tracking single cell evolution using clock-like chromatin accessibility loci 的研究論文。
該研究建立了一種基于時鐘位點染色質可及性推斷單細胞復制年齡的生物信息學方法——EpiTrace,實現了對單細胞染色質可及性(ATAC-seq)數據集的細胞年齡推斷,為單細胞測序數據集提供了時間參考系。
已有研究表明,特定基因組區域中的CpG位點上的DNA甲基化水平隨著個體年齡變化而勻速改變,因為這些特定基因組區域的DNA甲基化變化表現出類似于“時鐘計時器”的行為,因此將這類CpG位點被稱為時鐘樣差異甲基化位點(Clock-like differential methylated loci,ClockDML)。鑒于DNA甲基化與染色質可及性密切相關,作者提出了一個假設,年齡依賴性 DNA 甲基化要么是由ClockDML上的染色質可及性變化引起的,要么是它能直接導致染色質可及性變化。無論哪種說法成立,這類位點上的染色質可及性均與年齡存在相關。那么,從單細胞ATAC-seq(scATAC)數據中可能可以推斷細胞有絲分裂年齡。
研究團隊檢驗了ClockDML上的染色質可及性與細胞分裂次數(細胞年齡)之間的相關關系。實驗證據和數據分析顯示,ClockDML上的染色質可及性是良好的細胞年齡標記物,隨著細胞分裂次數增加,全基因組范圍內ClockDML上的染色質可及性異質性逐漸降低。在單細胞水平上,ClockDML上的染色質可及性總量隨著細胞年齡遞增而線性增加。實驗證明,在這類基因組位點上,年齡依賴的染色質可及性變化不依賴于DNA甲基化變化。這一現象在進化中高度保守,即使在DNA甲基化水平極低的遠緣物種基因組中的時鐘同源位點上,仍然存在年齡依賴的染色質可及性變化。研究團隊將這類基因組位點命名為時鐘位點(clock-like loci)。
由于單細胞ATAC-seq(scATAC)數據非常稀疏,而已知的時鐘位點數量又相對較少,因此覆蓋已知時鐘位點的測序片段極少,限制了細胞年齡推斷的信噪比。為了克服這個問題,作者開發了EpiTrace計算框架。EpiTrace使用表型相似細胞的信息來補充單細胞測序量不足的缺陷,利用迭代算法拓展可用的時鐘位點。作者將EpiTrace應用于公開可用的scATAC數據,驗證了EpiTrace的適用性。在胚胎發育ATAC數據集中,EpiTrace發現細胞年齡在ZGA階段被重置到最低,接著逐步上升。與此相反,在iPSC誘導過程中,EpiTrace推斷的細胞年齡隨著誘導進展逐步下降。在分時點采集的小鼠、斑馬魚和果蠅數據集上,EpiTrace推斷的樣本采樣時間高度相關于真實的采樣時間。
EpiTrace方法與基于DNA甲基化方法估算的細胞生物學年齡高度一致。同時,EpiTrace方法與基于RNA速率、突變追蹤、多時點采樣等技術之間具有良好的互補性。研究團隊將EpiTrace與線粒體突變追蹤、多時點采樣方法相結合,發現造血干細胞克隆的年齡與其未來增殖潛力之間存在很強的負相關性。這一結果為海弗利克極限學說(普通正常細胞只能分裂有限次)提供了實驗證據。在另一個實驗中,研究團隊從一個單獨的胎兒大腦scATAC數據集中對細胞年齡進行了分析,利用時鐘位點相似性方法重建了皮層谷氨酸能神經元群體發育的譜系樹,不僅驗證了新皮層由內至外的發育模式,還發現了腦回特異表達的基因NR2F1的活性差異可能決定神經元祖細胞發育的不同時序,為NR2F1突變導致的遺傳性多腦回綜合征提供了機制解釋。
此外,研究團隊還將EpiTrace應用到免疫治療相關T細胞數據集、人腎單細胞數據集、膠質母細胞瘤數據集等不同的應用場景中,展示了時間定序方法可以從已有的scATAC數據集中揭示隱藏的生物學現象,其中部分具有一定的潛在臨床意義。
綜上所述,該研究在ClockDML上發現了與有絲分裂相關的,細胞年齡依賴的染色體可及性,是一種良好的細胞年齡標記物,開發了用該標記物來追蹤單細胞年齡的計算方法EpiTrace。通過多個驗證實驗,表明EpiTrace應用到不同物種、不同細胞類型、不同技術平臺的scATAC數據集中,在僅利用人類外周血單核細胞時鐘位點信息作為參考的情況下,均能準確地推斷單細胞年齡,描繪細胞發育軌跡。此外,單細胞群之間的時鐘位點上染色質可及性的相似性還可以作為系統發育分析的距離度量。通過比較研究,發現EpiTrace方法與其它計算生物學工具相輔相成,可高精度、高功效的預測細胞發育軌跡。EpiTrace將成為單細胞研究的有力工具,用于研究細胞發育演化歷史和生物衰老。
Nature Biotechnology 期刊同期還配發了題為:Decoding single cell replicational age from scATAC data 的專欄評述,匯聚本文審稿人之一加州大學圣地亞哥分校任兵教授和Nature Biotechnology編輯團隊對這項研究成果的評價。
值得一提的是,EpiTrace全部實現代碼(https://github.com/MagpiePKU/EpiTrace)及用戶手冊(https://epitrace.readthedocs.io)已經開源發布。
破譯自閉癥等神經發育疾病和雙相情感障礙等常見精神疾病的遺傳原因,一直是重大挑戰,這是因為人腦太過復雜。在《科學》《科學轉化醫學》和《科學進展》雜志上,來自PsychENCODE聯盟的科學家們發表了十幾......
單細胞測序數據集和考古發掘現場之間存在一種有趣的對偶:從某種意義上來說,它們都是關于歷史的壓縮快照。化石只有在與相關地層相關聯時才具有完全意義,考古發現只有在精確定年后才能解釋歷史。而現在,研究人員發......
單細胞測序數據集和考古發掘現場之間存在一種有趣的對偶:從某種意義上來說,它們都是關于歷史的壓縮快照。化石只有在與相關地層相關聯時才具有完全意義,考古發現只有在精確定年后才能解釋歷史。而現在,研究人員發......
冠狀動脈旁路移植術(CABG)又被稱為冠狀動脈搭橋術,是改善心臟自身血供的手術,可以有效治療冠心病導致的心肌缺血。該手術從患者身上取下一段健康的血管供體,一端與升主動脈相連,另一端與冠狀動脈堵塞部位的......
圖SEVtras高效識別單細胞轉錄組數據中的胞外小囊泡在國家自然科學基金項目(批準號:32025009、32130020等)資助下,中國科學院北京生命科學研究院趙方慶團隊在單細胞數據挖掘算法方面取得新......
中山大學中山醫學院教授張宏波團隊與英國Sanger研究所教授SarahTeichmann團隊合作,研究建立了首個人類肢體發育的單細胞時空圖譜并解析關鍵調控機制。12月6日,相關成果在線發表于Natur......
微生物是地球上豐富且分布廣泛的生命形式,在生態系統中對有機物的生物地球化學循環發揮著關鍵作用。微生物降解是有機污染物分解過程中的重要環節。其中,降解功能微生物可將污染物轉化為無毒化合物,是有機污染物降......
美國麻省理工學院和布羅德研究所的科研人員繪制出小鼠全腦高分辨率單細胞空間轉錄組圖譜,為深入理解大腦結構與功能提供了重要基礎。該團隊基于109萬個高質量空間分辨單細胞基因表達定義出小鼠大腦更精細的組織區......
最近在高分辨率生物制造(如單細胞水平)方面的進展極大地提高了生物制造的能力,為組織工程開辟了新的途徑。然而,目前還缺乏一篇全面的綜述,概述了各種生物制造技術(超越生物打印),這些技術可以實現單細胞分辨......
Bio-Techne旗下子品牌Namocell的單細胞分離儀(NamocellSingleCellDispensers)采用先進的微流體技術以及靈敏的光學檢測系統,在精確鑒別細胞的同時又能對目的細胞進......