<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2021-07-02 10:07 原文鏈接: 基于低深度測序的關聯分析方法

    由于缺少非人類生物的單倍型參考panel,研究人員很難對這類生物進行全基因組關聯分析(GWAS)。為了解決這個問題,牛津大學、威康信托人類遺傳學中心和加州大學洛杉磯分校的研究人員開發了一種生物信息學方法,利用低覆蓋度的全基因組測序數據填充基因型。


    該項研究近期發表在《Nature Genetics》上,研究小組利用2000多個測序深度僅為0.15×的封閉群小鼠的測序基因組數據和1.1萬多個中國漢族人群的基因組數據證明了該方法。


    發表于同一期《Nature Genetics》上的第二篇文章中,研究人員在2000個封閉群小鼠中研究了這種方法的有效性,將基因與特定性狀關聯了起來。


    STITCH方法的開發

    文章第一作者、威康信托人類遺傳學中心的統計遺傳學家Robert Davies將這種方法稱作“通過構建單倍型進行測序填充”(Sequencing to Imputation Through Constructing Haplotypes),簡稱STITCH。Davies說,這種方法可以將GWAS研究的應用擴展到所有沒有單倍型參考panel的物種中。他的實驗室已經開始在小麥和豬中測試這種方法。


    該研究小組基于需要開發出了這個方法。Davies的同事們對2000只小鼠進行了低深度測序,并嘗試用已有軟件對小鼠進行基因分型,但是發現現有方法都沒用。于是他們開始開發一種新的方法,以在不需要額外的芯片數據或單倍型參考panel的情況下使用NGS數據。


    STITCH方法基于隱馬爾可夫模型,與之前開發的用于芯片數據的基因型填充方法類似。兩者主要的不同在于,前者是在測序read水平分析,而應用于芯片數據的算法(例如Beagle)則是對每個SNP進行獨立分析。然而利用測序分析時,多個SNP通常會出現在同一個read中。Davies說,“測序reads可以跨越4個或5個SNP。STITCH方法適應了read上的SNP并不是相互獨立的這個事實。”


    STITCH方法的驗證

    研究人員利用STITCH方法分析小鼠測序數據,估算出基因型為710萬個SNP。他們將這些結果與4個測序深度為10×的小鼠基因組,以及44個之前用芯片分型得到2.1萬多個SNP的小鼠基因組進行比較,驗證了這些結果的準確性。


    對初始結果過濾后,他們的方法與芯片結果一致性達到98%,與高深度測序的全基因組測序數據一致性達到97%。


    Davies說,當他們按照“read unaware”模式運行STITCH時,準確率降低到88%,這證明考慮每個read含有多個SNP這個情況的重要性。


    該小組同樣還利用NGS數據測試了Beagle算法,結果發現準確率明顯降低。該算法與高深度WGS數據和芯片數據的一致性分別為8%和22%。


    研究人員接下來又利用1.1萬多個測序深度為1.7×的中國漢族人群基因組數據測試了STITCH,將STITCH結果與72個個體的芯片分型結果、9個測序深度為10×的基因組測序結果進行比較,再次發現STITCH方法與它們的高度一致性。


    第二項研究中,威康信托人類遺傳學中心Jonathan Flint和Richard Mott實驗室的研究人員描述了,當他們利用STITCH填充約2000個小鼠的祖先單倍型時,他們能夠將一些基因與不同表型關聯起來,包括與睡眠、籠內活動、驚嚇反應、骨礦物質含量和創傷修復相關的基因。


    作者寫道,“這是第一個在沒有參考panel的情況下,利用極低深度測序生成準確基因型的研究。”


    STITCH方法的應用

    Davies表示,STITCH可用于那些沒有單倍型參考panel的非人類基因組分析中,比芯片費用更劃算。據他估計,每只小鼠的低深度測序花費約60美元,而芯片分析約87美元。除此之外,測序提供的數據比芯片更多,并且不需要任何關于變異以及這些變異是如何在群體中分離的等已知信息。


    Davies說,“STITCH方法需要一個高質量的參考基因組和大量樣本。如果參考基因組不正確,該方法就不好用。無論如何,這種方法都是非常有前景的。”


    STITCH目前免費提供給學術研究人員。Davies說,我們感興趣這種方法接下來會如何被使用及在什么物種中使用。農業生物技術領域的研究人員可能會對它的使用特別感興趣。


    參考文獻:1. Rapid genotype imputation from sequence without reference panels.Nature Genetics (2016) doi:10.1038/ng.3594

    2. Genome-wide associationof multiple complex traits in outbred mice by ultra-low-coverage sequencing. NatureGenetics (2016) doi:10.1038/ng.3595


    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频