種子被譽為農業的“芯片”,育種科技創新是推動農業發展的核心動力。未來植物育種的新范式是基因組學、基因編輯、合成生物學等生物技術(BT)與數據科學、機器學習、人工智能等信息技術(IT)的多元化融合。農業農村部“十四五”規劃將“智慧種業”列在“智慧農業”領域七大攻關任務之首。任務中明確提出:構建數字化育種平臺,探索基因型到表型的“智能育種技術體系”,加快“經驗育種”向“精確育種”轉變的攻關目標。
9月21日,Cell旗下的植物科學領域頂級綜述類期刊Trends in Plant Science在線發表了中國農業大學分子設計育種前沿科學中心、國家玉米改良中心王向峰教授與閆軍副教授共同撰寫的特邀綜述:“Machine learning bridges omics sciences and plant breeding”。該綜述準確定義了“精準育種”的含義,并將“精準設計育種”劃分為“知識驅動的分子設計育種”與“數據驅動的基因組設計育種”。論文重點闡述了機器學習技術如何將“知識”與“數據”轉化成為育種服務的驅動力,以及如何為基礎研究與育種實踐之間建立橋梁,加速實現植物領域的精準設計育種。
最近幾十年,植物生物學基礎研究產生了大量新的知識和數據,這些知識與數據最終將為植物育種與性狀改良而服務。然而,實現植物精準設計育種的終極目標,還需要解決當前植物基礎研究與育種實踐脫節的問題。作為人工智能的一個分支,機器學習技術因其在整合復雜多變的生物學知識和組學大數據方面的卓越能力而得到廣泛應用。
“知識”與“數據”驅動的精準設計育種。 王向峰供圖
機器學習主要可以通過兩種途徑在基礎研究和育種實踐中建立橋梁。一種途徑是從植物生物學的基礎研究中認識基因功能和調控機制,從而實現知識驅動的分子設計育種。在明確性狀調控基因的功能后,通過分子標記輔助選擇、有利等位基因的多基因聚合、基因編輯與合成生物學等技術,對植物品種進行定向改良。另一種途徑是直接將機器學習技術應用于商業育種管線,構建各種預測模型和決策算法,從而實現數據驅動的基因組設計育種。
這兩種途徑在現代商業化育種管線中相互結合并發揮著重要作用。現代育種管線的選擇取決于與性狀相關的基因或位點的數量:對于主要由遺傳背景決定的數量性狀,如:產量、生物量、環境適應性等性狀,通常采用數據驅動模型來推斷表型與全基因組標記之間的相關性;對于由遺傳前景決定的多基因性狀,如抗病、品質等性狀,必須首先明確性狀調控基因的分子功能及作用途徑,才能將多個基因的優良等位變異精準聚合;對于單基因性狀而言,應用基因編輯是人工制造突變,則是性狀改良的最佳快捷方式。事實上,只要在植物生物學和育種方面積累了足夠的知識與數據,機器學習技術便可以發揮功效以推動植物精確設計育種目標的實現。
各類機器學習算法在植物多組學研究中的應用 王向峰供圖
論文首先介紹了現代機器學習技術的主要類型(包括監督式學習、半監督式學習、非監督學習、深度學習等)與最新進展;其次,綜述了如何將現代機器學習算法應用于高維多組學數據降維、基因調控網絡推斷、多組學數據關聯分析與基因挖掘,以及候選基因的優先級決策等植物學基礎研究中;再次,介紹了基于半監督學習框架的深度學習算法在植物表型組學中的應用進展;最后,介紹了機器學習技術在全基因組選擇輔助育種、基因型到表型預測,以及基因型與環境互作建模中的應用進展。在論文的結論與展望部分,討論了目前機器學習和人工智能技術在植物研究中面臨的挑戰和潛在解決方案。
此外,本綜述還提供了一個應用非監督學習案例,即:如何利用NMF非負矩陣分解算法提高玉米多組學數據關聯分析的效率與基因挖掘的精度。
案例:應用NMF降維算法提高基因挖掘的效率 王向峰供圖
5月底,河南新鄉的中國農業科學院作物科學研究所試驗基地里,小麥即將成熟,麥浪翻滾,一片金黃,這片地里種植的小麥品種中,中國農業科學院作物科學研究所研究員李立會團隊創制的90個“小麥—冰草”遠緣雜交創新......
5月底,河南新鄉的中國農業科學院作物科學研究所試驗基地里,小麥即將成熟,麥浪翻滾,一片金黃,這片地里種植的小麥品種中,中國農業科學院作物科學研究所研究員李立會團隊創制的90個“小麥—冰草”遠緣雜交創新......
科技日報訊 (記者劉霞)美國布萊根婦女醫院對25000多名初始健康的美國女性進行了長達25年的跟蹤調查,發現攝入地中海飲食較多的人,全因死亡率降低23%。相關研究發表于最新一期《美國醫學會雜......
近日,西北農林科技大學植保學院孫廣宇教授團隊在鉀營養調控免疫、促進植物抗病性機理方面取得新進展,相關研究發表在Plant,Cell&Environment上。研究以煙草赤星病害體系為對象,解析......
5月15日,中國科學院分子植物科學卓越創新中心(以下簡稱分子植物卓越中心)研究員王二濤團隊、張余團隊以及何祖華團隊在水稻免疫機制研究上取得了重大突破,并發現了植物蛋白泛素化的新機制。相關研究發表于《自......
水稻是我國主要的糧食作物。水稻生產面臨著挑戰:一是水稻生長過程中常受到稻瘟病菌等病原真菌的侵擾,過度依賴化學農藥,從而對環境和食品安全構成威脅;二是水稻對磷、氮等營養元素的需求,導致過度施肥,污染環境......
近日,中國農業科學院植物保護研究所作物病原生物功能基因組研究創新團隊聯合國內科研單位,利用機器學習策略,成功開發出根據作物基因型精準預測抗病表型的方法。相關研究成果發表在《工程》(Engineerin......
近日,我國科學家在葉下珠科藥用植物基因組研究方面取得新進展,研究揭示了多次雜交與多倍化事件共同塑造了葉下珠科復雜的物種形成歷史。相關成果發表于《植物學雜志》(ThePlantJournal)。葉下珠科......
油菜是我國植物油第一大油源,每年可提供優質食用油約520萬噸,占國產植物油的47%;每年還生產高蛋白飼用餅粕約800萬噸,是我國第二大飼用蛋白源。但是,其產業發展現狀是因油菜種植效益較低導致農民種植積......
近日,中國農業科學院草原研究所草種質資源創新與生物育種團隊揭示了植物激素參與調控紫花苜蓿花芽生長發育的調控機制,該研究為苜蓿分子育種提供了重要的基因資源,為提高苜蓿種子產量提供了新的思路。相關研究成果......