在生命科學的廣袤領域中,基因組關聯研究(Genome-Wide Association Studies,GWAS)宛如一座燈塔,照亮了探索遺傳變異與健康、疾病關系的道路。想象一下,若能整合全球各機構的基因數據進行研究,那將為攻克疑難病癥、揭示生命奧秘帶來多大的助力!然而,現實卻如同一堵高墻,橫亙在理想與現實之間。現有的數據共享法規對多機構間的數據合作設下重重限制,使得大規模的聯合研究難以開展。同時,盡管加密計算工具承諾保障數據隱私,但以往的方法要么計算成本過高,無法在實際中應用;要么無法支持當前最先進的分析方法,導致研究進展緩慢。
在這樣的困境下,來自多個研究機構的科研人員決心突破障礙,其中領銜的是 [第一作者單位]。他們聚焦于如何在保障數據隱私的前提下,實現高效準確的跨機構基因組關聯研究這一關鍵問題,展開了深入探索。經過不懈努力,他們成功開發出 Secure Federated GWAS(SF-GWAS),這一成果猶如一把鑰匙,打開了跨機構基因組研究的新大門,相關研究成果發表于《Nature Genetics》。
研究人員在開展此項研究時,運用了多種前沿技術。在加密技術層面,創新性地將安全多方計算(Secure Multi-Party Computation,MPC)和同態加密(Homomorphic Encryption,HE)相結合,構建了混合加密框架。同時,精心設計了分布式算法,以此支撐各類全基因組關聯分析流程。在數據來源上,使用了多個不同規模和類型的數據集,如 UK Biobank 隊列、eMERGE 聯盟數據集等,為研究提供了豐富的數據基礎。
下面來詳細看看研究的關鍵成果:
性能大幅提升:研究人員將 SF-GWAS 與先前的 S-GWAS 方法進行對比,分析了肺癌、膀胱癌和年齡相關性黃斑變性(AMD)等數據集。結果令人振奮,SF-GWAS 在運行時間和通信成本上都實現了顯著降低。以 AMD 數據集為例,SF-GWAS 的運行時間僅為 4.6 小時,相比 S-GWAS 的 64.3 小時,足足縮短了 14 倍;通信成本也從 666.6GB 降至 173.7GB,減少了約 3.5 倍。這一成果表明,SF-GWAS 在實際應用中具備更高的效率。
準確再現分析結果:在 eMERGE 和 UK Biobank 等大型數據集的測試中,SF-GWAS 基于主成分分析(Principal Component Analysis,PCA)計算出的關聯統計數據,與使用 PLINK 軟件對合并后的明文數據進行分析的結果高度吻合。這意味著,即使數據分散在不同機構,通過 SF-GWAS 也能得到與集中分析幾乎相同的準確結果,有力地證明了該方法的可靠性。
支持多種分析流程:SF-GWAS 不僅支持基于 PCA 的分析流程,還對基于線性混合模型(Linear Mixed Models,LMMs)的關聯測試展現出良好的適應性。在對包含 409,548 名歐洲裔個體的 UK Biobank 數據集的分析中,SF-GWAS 基于 LMMs 產生的關聯統計數據與直接在合并數據集上運行 REGENIE 軟件得到的結果精準匹配,充分顯示了其在復雜分析場景下的強大能力。
適用于多種性狀分析:針對二進制性狀(如疾病狀態)的分析,以往的安全 GWAS 研究存在局限,而 SF-GWAS 通過納入基于牛頓法的分數檢驗算法,成功實現了對邏輯回歸模型的高效支持。重新分析 S-GWAS 的三個數據集時,SF-GWAS 不僅得到了與 PLINK 一致的結果,而且運行時間控制在 5.3 小時以內,與線性回歸分析的運行時間相當,極大地拓展了其應用范圍。
助力跨機構聯合分析:研究人員利用 SF-GWAS 對來自不同機構的 AMD 相關數據集進行聯合分析,涵蓋了國際 AMD 基因組學聯盟(IAMDGC)、eMERGE 聯盟和 UK Biobank 的數據。結果不僅驗證了該方法的準確性,還成功識別出與 AMD 相關的重要遺傳變異。這一應用展示了 SF-GWAS 在整合多源數據、推動跨機構研究方面的巨大潛力。
研究結論和討論部分進一步凸顯了這項研究的重要意義。SF-GWAS 為多機構的 GWAS 研究提供了一種安全、高效且可擴展的解決方案,在嚴格保障數據隱私的同時,實現了大規模的跨機構合作分析。它的出現,為未來生物醫學研究的突破奠定了堅實基礎,有望加速基因與疾病關系的探索進程,推動個性化醫療的發展。盡管未來仍面臨一些挑戰,如進一步拓展分析任務、應對惡意攻擊等,但 SF-GWAS 無疑為基因組研究開辟了新的方向,引領著科研人員在生命科學的道路上不斷前行。
2月26日,記者從北京大學現代農業研究院獲悉,該院葉文秀研究員和郭立研究員團隊繪制了全球首個涵蓋葡萄屬的歐亞、北美和東亞世界三大種群的72個葡萄種質材料的單倍型超級泛基因組圖譜,從而揭示葡萄屬豐富遺傳......
在生命科學的廣袤領域中,基因組關聯研究(Genome-WideAssociationStudies,GWAS)宛如一座燈塔,照亮了探索遺傳變異與健康、疾病關系的道路。想象一下,若能整合全球各機構的基因......
在生命科學的廣袤領域中,基因組關聯研究(Genome-WideAssociationStudies,GWAS)宛如一座燈塔,照亮了探索遺傳變異與健康、疾病關系的道路。想象一下,若能整合全球各機構的基因......
近日,中國林業科學研究院亞熱帶林業研究所林木種質資源研究團隊在《經濟作物和產品》(IndustrialCrops&Products)上發表了研究論文。該研究組裝了無患子的染色體級別高質量基因組......
2月8日,中國農業科學院北京畜牧獸醫研究所張龍超研究員、黑龍江省農業科學院畜牧研究所劉娣研究員、重慶市畜牧科學院王金勇研究員、岳麓山實驗室印遇龍院士、四川農業大學李明洲教授聯合發布消息,國際首個豬T2......
在沙漠和旱地中,有一種神奇的生物土壤結皮被稱為“沙漠皮膚”,其在維持土壤健康、減少侵蝕、促進養分循環等方面發揮重要作用。綠藻(特指片球藻屬綠藻)就是土壤結皮中的重要成員之一,因其能適應各種極端環境如冰......
近日,一項發表于《自然-通訊》的研究發現,攜帶人源化蛋白NOVA1變體的小鼠發出的叫聲比野生型小鼠更復雜。該研究有望為找到影響人類語言能力演化的關鍵基因提供更多線索。人類何時以及如何獲得言語所需的大腦......
基因組編輯技術在農業領域的應用推動了作物改良,但以DNA形式遞送基因編輯工具的方式存在外源DNA整合風險和脫靶效應。近年來,無外源DNA殘留的基因組編輯遞送技術備受關注。盡管基于核糖核蛋白的遞送策略在......
就像寄生蟲危害人體一樣,寄生植物也會讓作物遭殃,破壞糧食生產。據《細胞》雜志12日報道,中國科學家在高粱中發現兩個關鍵基因,它們可像“開關”一樣控制高粱的抗寄生能力。“關閉”這兩個基因后,高粱抵抗寄生......
1月30日,中國科學院院士、分子植物科學卓越創新中心研究員林鴻宣團隊聯合上海交通大學林尤舜團隊,在《自然》(Nature)上發表了題為Fine-tuninggibberellinimprovesric......