ChIP-seq、ATAC-seq等都是常見的研究體內蛋白質與DNA相互作用的有力工具,但這些傳統方法都無法獲得每一個大片段DNA分子上蛋白結合的真實狀態,無法進行DNA復雜結構域蛋白-DNA交互作用的分析,使得蛋白-DNA交互作用在單分子水平的研究受到限制。
近日,華大基因唐沖博士團隊在bioRxiv發表重要科學論文“Long-range single-molecule mapping of chromatin modification in eukaryotes”。該文章介紹了一種基于構建葡萄球菌蛋白A-甲基轉移酶融合重組蛋白,對抗體結合的組蛋白修飾、DNA結合蛋白附近的DNA進行特異性定點甲基化修飾,并通過長讀長測序,獲得高精度的、DNA單分子水平上的組蛋白修飾及DNA結合蛋白序列信息。
文章發表在bioRxiv上
值得注意的是,幾近同期,來自美國斯坦福大學的研究者也在同一期刊上發表類似技術的相關研究結果“DiMeLo-seq: a long-read, single-molecule method for mapping protein-DNA interactions genome-wide”。
這兩篇文章都可以獲得蛋白-DNA互作在單分子水平上的異質性、在DNA長距離上遠端的互作特征、同時也可獲得CpG甲基化多組學信息。可實現轉座子長末段重復區域LTR、SINE、LINE,絲粒高度重復區域等短讀長測序檢測受限區域的蛋白-DNA互作信息檢測。
兩項研究結果的發布,吸引了業界廣泛關注。今天,我們請到了華大基因該項目的第一作者甕喆博士,為我們詳細解析一下這項新技術。
甕喆博士
華大基因單細胞多組學&單分子研發項目負責人,實驗研發工程師,博士畢業于新加坡國立大學,發表過多篇SCI論文。
傳統的基于ChIP-seq的蛋白-DNA互作研究方法,利用抗體免疫沉淀后富集的打斷后DNA片段短讀長測序并進行peak calling,反映了特定DNA位點的蛋白結合平均信息。但傳統方法無法獲得每一個大片段DNA分子上蛋白結合的真實狀態,無法進行DNA復雜結構域蛋白-DNA交互作用分析。本次發表的新方法(BIND&MODIFY)通過對完整、不打斷的大片段DNA分子進行特異性分子標記,通過長讀長測序,獲得高精度、DNA單分子水平上的組蛋白修飾、DNA結合蛋白序列信息,進一步同時獲得DNA異質性、CpG甲基化多組學、復雜結構域的蛋白-DNA互作等信息。
本技術的關鍵點與主要結果在于,首先,構建一種基于葡萄球菌蛋白A-甲基轉移酶融合蛋白,對蛋白-DNA結合位點進行特異性修飾與單分子測序檢驗的方法;其次,設計開發了一套針對大片段單分子DNA上的蛋白-DNA交互作用的位置信息進行分析的算法流程,實現了高精度的蛋白-DNA交互作用檢測、DNA分子在蛋白-DNA結合水平上的異質性鑒定、蛋白-DNA交互作用強度在DNA長距離上遠端互作鑒定、CpG甲基化聯合分析、以及DNA復雜結構域的蛋白-DNA交互作用檢測方法。
本方法(BIND&MODIFY)首先構建了一種葡萄球菌蛋白A-甲基轉移酶融合蛋白(pA-M.EcoGII);將針對組蛋白修飾、DNA結合蛋白特定抗體與細胞孵育后,pA-M.EcoGII與特異性抗體結合;隨后激活甲基轉移酶活性,將抗體結合蛋白附近的DNA序列中的腺嘌呤(adenine)高效率轉化為N6-methyladenosine (m6A);最后通過納米孔單分子長讀長測序對m6A位點進行檢測,獲得單分子水平的高精度蛋白-DNA結合位點信息(圖1)。
進一步地,通過與傳統ChIP-seq對標,本方法在檢測組蛋白修飾H3K27me3水平上,具有接近的趨勢、較高的相關性、以及相近的精度(圖2)。在染色質復雜結構域LTR區域,本方法具有優于傳統ChIP-Seq的檢驗精度(圖3)。
通過分析結合位點轉錄起始位點(TSS)上游1000-0bp的m6A比率,本方法能夠進行DNA分子聚類(圖4),通過gene ontology分析,發現異質性較高的DNA分子(cluster 3)與乳腺癌相關通路相關, 如VEGF singling pathway, B cell receptor signaling pathway, PD-L1 checkpoint pathway等。本方法首次實現了單分子水平上的基于組蛋白修飾H3K27me3的DNA異質性鑒定。
最終,本方法通過對大片段DNA分子上的蛋白-DNA交互作用相關性進行分析,構建了反映DNA分子上蛋白-DNA作用相關性的correlation coefficient(CC)分析方法,以及反映分子上蛋白-DNA作用強度的distance effect(DE)index分析方法(圖5),實現了組蛋白修飾H3K27me3與DNA結合蛋白CTCF在單分子水平上的遠端作用互作檢測。
簡而言之,本方法(BIND&MODIFY),是一種具有普適性、高質量、高精度的單分子水平上實現蛋白-DNA交互作用檢測的方法,本技術能夠在單分子水平上為解析細胞命運決定與功能異質性的表觀遺傳學調控機制提供了一種強有力的工具。
圖1 本方法(BIND&MODIFY)技術路線流程圖。
圖2 本方法與傳統ChIP-seq相比,具有高度相關性。
圖3 本方法在染色質復雜區域LTR區域具有優于ChIP-seq的分辨率。
圖4 本方法實現DNA分子在蛋白-DNA結合水平上的異質性鑒定。
圖5 本方法實現蛋白-DNA交互作用強度在DNA長距離上遠端互作鑒定。
兩篇文章異曲同工,分別構建了兩種高效率的葡萄球菌蛋白A-甲基轉移酶融合重組蛋白,針對蛋白-DNA交互作用進行單分子水平上的檢測,并同時進行CpG甲基化測序獲得了多組學蛋白-DNA交互作用檢測。差異點主要在于,華大基因唐沖博士團隊,系統地比較了本技術與傳統ChIP-seq在蛋白-DNA互作的相關性、分辨率等方面的差異,發現本技術與ChIP-seq具有相近的性能表現;同時進行了基于蛋白-DNA交互作用在單分子水平上的異質性,對DNA分子進行聚類分析,發現與癌癥相關的基因調控異質性信息;基于DNA分子的異質性,發現了蛋白-DNA互作在DNA長距離上的遠端交互作用特征;完成了轉座子長末段重復區域LTR、SINE、LINE等短讀長測序檢測受限區域的蛋白-DNA互作信息檢測。斯坦福團隊則主要在體外構建了人工組蛋白-DNA復合物,驗證了其方法的特異性與分辨率,并針對著絲粒附近的CENP-A 組蛋白與DNA交互作用信息進行了檢測與分析。
本技術作為傳統ChIP-seq測序技術在單分子長度長測序領域的原創性升級,具體應用場景還是比較豐富,比如可以系統性研究蛋白-DNA交互作用在單分子水平的作用特征,發現特異性蛋白在單分子水平調控基因啟動與表達的動態特征;發現細胞類群內蛋白-DNA交互作用的異質性,進一步在單分子水平上精確定義細胞類群;同時還可以聯合CpG甲基化測序,獲得5mC甲基化位點與蛋白-DNA交互作用在單分子水平上的綜合調控機制,并通過結構變異與蛋白-DNA交互作用分析,實現邊測序、邊組裝、同時獲取基因組水平的蛋白-DNA交互作用信息。
總之,本技術能夠在長讀長測序領域,為廣大研究者提供了一種新型研究方法與范式,系統實現蛋白-DNA交互作用信息與多組學信息的綜合分析。
華大基因唐沖博士團隊正在對本技術進行優化,檢測更多與人類疾病相關的蛋白-DNA交互作用上進行系統分析,為后續新型藥物靶點發現提供基礎。同時正在進行基于該技術的單分子多組學測序方案的一步優化,實現在同一根DNA分子上的更多維度的單分子多組學檢測。