<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2022-02-16 16:50 原文鏈接: 多組學研究助力玉米種質資源創新利用

      近日,中國農業大學農學院、國家玉米改良中心王向峰教授在《科學通報》(英文版)(Science Bulletin)上發表了方法學研究論文。

      農作物種質資源精準鑒定與基因挖掘是從源頭上實現種業創新、保障糧食安全的根本路徑,是生物育種重點攻關的關鍵技術之一。全基因組關聯分析(GWAS)是通過推斷基因型與表型的關聯顯著性,實現挖掘種質資源的常規手段。但是,基于基因型-表型的傳統GWAS分析存在諸多不足。隨著轉錄組、代謝組、蛋白組、表觀遺傳組以及表型組等各種組學技術的飛速發展與檢測成本的大幅降低,聚焦一套公共核心種質資源開展全方位多組學研究將是種質資源研究領域的重點發展方向。

      大規模、多維度的組學數據的急速積累催生了“高維生物學(HDB)”研究領域。由于多組學數據具有規模大、維度高、噪音大、異質性強等特點,傳統關聯分析中常用的混合線性模型很難用于HDB數據的高效、精準解析。王向峰教授團隊開發的MODAS軟件運用多種先進數據分析技術解決上述問題,實現多組學數據在群體水平上的關聯分析與因果推斷。MODAS包含以下六大功能模塊或分析步驟:

      第一步,MODAS利用Jaccard index、 DBSCAN與PCA算法對基因型數據進行降維;將全基因組范圍內數百萬個SNP的基因型數據,抽象成由6萬個基因組區段代表群體的遺傳變異,并生成偽基因型索引文件;該文件用于分子性狀(即:基因表達、代謝物等等)的過濾,以及關鍵基因與代謝物的初步篩選。該步驟是大幅度提升多組學關聯分析的關鍵步驟。

      第二步,MODAS利用偽基因型文件首先將分子性狀與基因組區間的關聯分析;在獲得顯著關聯的分子性狀與區間后,提取區間內的SNP在進行第二部的分子性狀與SNP基因型之間的關聯分析,確定顯著性;通過以上兩步,實現分子性狀的初步篩選。

      第三步,由于代謝物數據、表達數據可能存在較大的冗余,MODAS對共同關聯到相同基因組區段的分子性狀進行降維,降低關聯分析的冗余。

      第四步,MODAS將篩選出來的具有潛在生物學意義的分子性狀進行基因表達-全基因組關聯分析(eGWAS)或代謝物-全基因組關聯分析(mGWAS),確定顯著相關的分子性狀與QTL。

      第五步,MODAS將所有曼哈頓圖以及QTL內基因信息進行注釋與整合,生成可以網頁式瀏覽的可視化數據庫。

      第六步,MODAS應用孟德爾隨機化(MR)算法 [2, 3, 4],推斷遺傳變異、轉錄因子、目標基因、基因表達、代謝物含量、表型性狀兩兩之間的因果關系。MR因果推斷的結果可以更好的輔助生物學家建立可驗證的分子通路假設,對挖掘獲得的候選基因開展下游的實驗驗證。

      中國農業大學的劉松譽、徐峰博士生為該論文的共同第一作者,也是MODAS(Multi-Omics Data Association Analysis)軟件的主要開發人。

      本項目受到“合成生物學”國家重點研發計劃子課題“抗逆回路在底盤作物中的智能重建與育種應用”的資助。

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频