為推動我國生物信息學的學科發展和創新研究,充分展示和宣傳我國生物信息學領域的重大研究成果,《基因組蛋白質組與生物信息學報》(Genomics,
Proteomics & Bioinformatics,
簡稱GPB)組織評選了2018年度、2019年度和2020年度“中國生物信息學十大進展”。在此基礎上,GPB近期組織2021年度評選活動,經過推薦、初選和復選程序,現公布2021年度“中國生物信息學十大進展”評選結果(排名不分先后,按題目首字母順序排序)。
感謝所有專家秉持專業和公正的態度參與本年度十大進展的推薦和評選;祝賀所有入選工作的團隊!同時祝愿大家在2022新的一年里健康平安、工作順利,如虎添翼!
評審委員會
2022年2月18日
? 3D基因組研究發現人類大腦發育獨特遺傳元件和調控機制
人類大腦起源于漫長的生命進化過程。哪些遺傳改變造就了人類大腦是國際科學界長期力圖回答的前沿科學問題。中國科學院昆明動物研究所宿兵團隊與北京大學李程團隊及中國科學院數學與系統科學研究院張世華團隊合作,構建了獼猴胎腦高分辨率大腦3D基因組圖譜。通過跨物種進化分析,他們發現了人類特有的染色質空間結構和腦發育調控元件,證明了人類已進化出更為精細的腦發育調控網絡。該研究為闡明人類大腦特異表型的遺傳機制提供了全新的線索。同時,該研究中產生的獼猴神經發育高峰期的表觀多組學數據,為后續獼猴功能基因組的注釋以及人類腦疾病的研究提供了極具價值的參考數據資源。
該成果發表于Cell。
數據鏈接:
https://ngdc.cncb.ac.cn/gsa/browse/CRA001934
原文信息:
Luo X, Liu Y, Dang D, Hu T, Hou Y, Meng X, et al. 3D genome of macaque fetal brain reveals evolutionary innovations during primate corticogenesis. Cell 2021;184:723–40. PMID: 33508230
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S0092867421000015
圖:高分辨獼猴胎腦3D基因組圖譜的構建及跨物種染色質結構進化解析發現人類特異調控元件影響神經細胞的樹突發育
? 基于4D活體成像繪制秀麗線蟲轉錄因子的單細胞空間蛋白表達圖譜
闡明每個細胞的蛋白表達及功能狀態是理解發育的重要切入點。中國科學院遺傳與發育生物學研究所杜茁團隊利用熒光報告品系,綜合活體成像、實時譜系追蹤和單細胞定量分析,實現了在原位以非侵入的方式解析轉錄因子在各個胚胎細胞的蛋白動態表達模式,并同時明確了細胞的譜系身份、空間定位及發育命運。基于圖譜,研究構建了時空調控通路,揭示了轉錄因子新功能,歸納了細胞命運多維調控的基本框架,發現了細胞調控狀態呈現高度動態性和多樣性,并提出了其隨發育轉變的非定向“繞路”模型。該研究為理解胚胎發育提供了“高精度導航圖”,推動了單細胞-全胚胎-多維度的發育定量生物學與系統生物學研究。
該成果發表于Nature Methods。
數據庫鏈接:
http://dulab.genetics.ac.cn/TF-atlas/
原文信息:
Ma X, Zhao Z, Xiao L, Xu W, Kou Y, Zhang Y, et al. A 4D single-cell protein atlas of transcription factors delineates spatiotemporal patterning during embryogenesis. Nat Methods 2021;18:893–902. PMID: 34312566
原文鏈接:
https://www.nature.com/articles/s41592-021-01216-1
圖:轉錄因子單細胞蛋白動態表達圖譜揭示發育圖式建立的分子調控基本框架
? 中國腦膠質瘤基因組圖譜計劃(Chinese Glioma Genome Atlas,CGGA)數據庫
腦膠質瘤作為成人最常見的、極難治療的顱內惡性腫瘤,其基于多維組學的遺傳特征和生物學功能亟待挖掘和研究。北京市神經外科研究所江濤/保肇實團隊,針對中國人群,構建了大規模多中心中國腦膠質瘤基因組圖譜計劃數據庫(CGGA)。該數據庫擁有全球范圍內覆蓋全面病理亞型的腦膠質瘤樣本,包括低級別、高級別、復發腦膠質瘤等。最長隨訪時間逾15年。其中2000余例樣本的多維組學數據已實現云儲存和共享下載,包括全外顯子組、轉錄組、表觀遺傳組學數據、單細胞數據等。CGGA網站還可實現數據的在線分析,并提供用戶友好的可視化分析工具。該數據庫為目前國際上腦膠質瘤病理類型最全面、種類獨特的腦膠質瘤臨床樣本最多的多維組學數據庫。
該成果發表于Genomics, Proteomics & Bioinformatics。
數據庫鏈接:
http://cgga.org.cn/
原文信息:
Zhao Z, Zhang KN, Wang Q, Li G, Zeng F, Zhang Y, et al. Chinese Glioma Genome Atlas (CGGA): a comprehensive resource with functional genomic data from Chinese glioma patients. Genomics Proteomics Bioinformatics 2021;19:1–12. PMID: 533662628
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S1672022921000450?via%3Dihub
圖:CGGA數據庫開發結構示意圖及功能實現
? 基于納米孔測序的環形RNA識別和全長重建方法—CIRI-long
環形RNA是一類在真核生物中廣泛存在的環狀轉錄本,在生物體內通過其序列特征發揮微小RNA海綿、RNA結合蛋白(RBP)海綿及翻譯小肽等重要的生物學功能。因此,確定環形RNA的全長序列,是研究環形RNA功能的重要基礎。中國科學院北京生命科學研究院趙方慶團隊通過結合滾環反轉錄擴增和三代納米孔測序技術,開發了高效測定環形RNA全長轉錄本的實驗與計算方法CIRI-long,解決了目前研究方法中難以區分環形RNA與線性mRNA來源讀段的問題,實現了不同長度環形RNA的高靈敏度檢測和內部結構重構。利用該方法,研究團隊鑒定到了大量環形RNA內部的可變剪接事件,并對來自線粒體基因組、相鄰基因轉錄通讀以及內含子自連產生的環形RNA分子進行了全面識別。該方法實現了環形RNA的高效識別與全長重構,為挖掘具有生物學功能的環形RNA提供了重要的研究工具。
該成果發表于Nature Biotechnology。
工具鏈接:
https://github.com/bioinfo-biols/CIRI-long
原文信息:
Zhang J, Hou L, Zuo Z, Ji P, Zhang X, Xue Y, et al. Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long. Nat Biotechnol 2021;39:836–45. PMID: 33707777
原文鏈接:
https://www.nature.com/articles/s41587-021-00842-6
圖:環形RNA的準確識別及全長重構
環形RNA的實驗富集(A),全長識別(B),類型注釋及多樣本數據整合分析(C)。
? 單細胞轉錄組測序揭示COVID-19感染與免疫重要機制
新冠(COVID-19)疫情爆發伊始,北京大學、首都醫科大學附屬北京佑安醫院、中國科學院生物物理研究所、中國科學技術大學、深圳第三人民醫院、上海交通大學、海軍軍醫大學、中國人民解放軍總醫院第五醫學中心、粵北人民醫院、武漢大學人民醫院、中國醫學科學院血液病醫院(血液學研究所)、陸軍軍醫大學、哈爾濱工業大學、中山大學、廣州生物島實驗室、深圳灣實驗室等40多家科研單位迅速組建了“新冠單細胞研究中國聯盟”,對輕癥、重癥COVID-19病人包括健康對照的外周血、肺泡灌洗液等不同類型樣本進行了單細胞轉錄組測序和生物信息分析。研究發現,新冠病毒核酸在上皮細胞與巨噬細胞、中性粒細胞、T細胞等多種免疫細胞中均可檢出,且具有亞基因組轉錄的特點,提示新冠病毒在人體中具有廣泛的宿主細胞譜。配體-受體分析顯示,感染新冠病毒后纖毛上皮細胞傾向于脫落,而鱗狀樣上皮細胞會上調S100A8/9、ANXA1等因子的基因表達,通過與TLR4、FPR1相互作用過度招募巨噬細胞與中性粒細胞從而導致肺炎。本研究還揭示COVID-19病人外周血中存在一群高表達S100A8/9、CCL3等細胞因子基因的單核細胞,是導致細胞因子風暴的重要源頭。這些發現對認識和控制新冠疫情具有重要指導意義。
該成果發表于Cell。
數據鏈接:
https://ngdc.cncb.ac.cn/gsa-human/browse/HRA001149
原文信息:
Ren X, Wen W, Fan X, Hou W, Su B, Cai P, et al. COVID-19 immune features revealed by a large-scale single-cell transcriptome atlas. Cell 2021;184:1895–1913.e19. PMID: 33657410
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S0092867421001483?via%3Dihub
圖:單細胞轉錄組測序揭示新冠肺炎重要感染與免疫機制
中心:實驗設計與樣本類型;左上:外周血中不同免疫細胞與疾病嚴重程度、年齡、性別等存在不同關聯;右上:上皮細胞與免疫細胞中可檢出新冠病毒核酸;左下:鱗狀樣上皮細胞在招募巨噬細胞中性粒細胞中的關鍵作用;右下:細胞因子風暴的潛在來源。
? 國家基因組科學數據中心建成多組學數據資源體系
基因組科學數據是人口健康和國家安全的重要戰略資源。為存好、管好和用好基因組科學數據,中國科學院北京基因組研究所(國家生物信息中心)國家基因組科學數據中心(China National Center for Bioinformation -the National Genomics Data Center,CNCB-NGDC)面向國家大數據和健康中國戰略,建成涵蓋國家人類遺傳資源和重要戰略生物資源的多組學數據資源體系,解決了長期以來我國基因組科學數據匯交共享嚴重依賴國際數據庫的問題,為國家基因組科學數據的匯交共享、安全管理和挖掘利用提供重要支撐。
該成果發表于Nucleic Acids Research。
數據庫鏈接:
https://ngdc.cncb.ac.cn
原文信息:
CNCB-NGDC Members and Partners. Database resources of the National Genomics Data Center, China National Center for Bioinformation in 2021. Nucleic Acids Res 2021;49:D18–8. PMID: 33175170
原文鏈接:
https://academic.oup.com/nar/article/49/D1/D18/5974090
圖:國家生物信息中心-國家基因組科學數據中心數據資源(2021)
? 雜交馬鈴薯的基因組設計
為了解決馬鈴薯產業面臨的育種周期長、薯塊繁殖成本高的問題,在前期克服了自交不親和和解析自交衰退的遺傳機制的基礎上,中國農業科學院農業基因組研究所黃三文研究團隊聯合云南師范大學等國內外優勢單位,運用“基因組設計”的理論和方法體系培育雜交馬鈴薯,用二倍體育種替代四倍體育種,最終獲得優良的雜交種子,顛覆了傳統的薯塊繁殖方式。該研究培育出第一代高純合度(> 99%)自交系,以及具有顯著的產量雜種優勢的雜交品系“優薯1號”,證明了雜交馬鈴薯育種的可行性,使馬鈴薯的遺傳改良取得了里程碑式突破。
該成果發表于Cell。
數據鏈接:
https://www.ncbi.nlm.nih.gov/bioproject/PRJNA641265/;
https://bigd.big.ac.cn/gvm/getProjectDetail?Project=GVM000101;
https://github.com/DieTANG/PiGBS_Pipeline
原文信息:
Zhang C, Yang Z, Tang D, Zhu Y, Wang P, Li D, et al. Genome design of hybrid potato. Cell 2021;184:3873–83.e12. PMID: 34171306
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S0092867421007078?via%3Dihub
圖: 雜交馬鈴薯的基因組設計原理圖
? 基于細胞內RNA結構預測蛋白質–RNA動態相互作用的人工智能方法—PrismNet
RBP在RNA分子的整個生命周期包括轉錄、代謝、翻譯以及降解等過程中動態結合RNA分子,對RNA分子的命運起著關鍵調控作用。清華大學張強鋒團隊基于細胞內RNA結構與對應細胞環境的RBP結合信息的耦合關系,建立了利用細胞內RNA結構信息預測細胞內RBP動態結合的人工智能新方法PrismNet。對于任意一個RBP,只要在某一種細胞環境下做了crosslinking and immunprecipitation(CLIP)實驗,PrismNet就可以通過構建準確的深度神經網絡模型,把結合信息外推到其他細胞環境中。在PrismNet的一個應用研究中,利用新冠病毒在宿主細胞內的RNA結構信息,研究組準確預測了多個新冠病毒的宿主結合蛋白,證明了PrismNet的廣闊應用前景。
該成果發表于Cell Research。
工具鏈接:
http://prismnetweb.zhanglab.net/
原文信息:
Sun L, Xu K, Huang W, Yang YT, Li P, Tang L, et al. Predicting dynamic cellular protein–RNA interactions by deep learning using in vivo RNA structures. Cell Res 2021;31:495–516. PMID: 33623109
原文鏈接:
https://www.nature.com/articles/s41422-021-00476-y
圖:PrismNet模型構建以及應用
? 基于深度學習和基因指紋的藥效預測系統—DLEPS
創新藥物研發是一個周期長、耗費大的艱難過程。在藥物研發方面,人工智能/深度學習(AI制藥)被寄予厚望。北京大學謝正偉、鄭瑞茂、張寧和周虹聯合研究團隊首先構建了一個神經網絡,使用簡化分子線性輸入規范(SMILES)化學編碼作為輸入,以預測L1000數據中測量的轉錄組變化。然后使用疾病相關基因指紋來反映特定疾病的“內在痕跡”,通過基因集合富集分析(GSEA)來評估化合物對疾病的潛在療效。研究人員將這種方法和模型稱為基于深度學習的藥效預測系統(DLEPS; 中文名為靈素系統)。研究員人員針對商用小分子數據庫預測了治療三種常見慢性病的化合物,并進行了實驗驗證,在每種疾病研究方向都發現了療效優越的小分子。該系統是國際上第一款藥效預測系統,受到國際同行的高度評價和廣泛關注。
該成果發表于Nature Biotechnology。
工具鏈接:
https://www.dleps.tech/dleps/index;
https://github.com/kekegg/DLEPS
原文信息:
Zhu J, Wang J, Wang X, Gao M, Guo B, Gao M, et al. Prediction of drug efficacy from transcriptional profiles with deep learning. Nat Biotechnol 2021;39:1444–52. PMID: 34140681
原文鏈接:
https://www.nature.com/articles/s41587-021-00946-z
圖:深度神經網絡的結構和原理圖以及DLEPS在肥胖、尿酸血癥和非酒精性脂肪性肝炎中的應用效果
? 空間單細胞核代謝組分析方法—SEAM
機體中的代謝分子可以顯著影響基因表達,最終改變細胞命運。因此,在組織原位觀測細胞核中的代謝組特征對認識機體發育、腫瘤發生發展、神經系統衰老等生命過程至關重要。結合高空間分辨率成像質譜技術和人工智能算法,清華大學張奇偉教授、張新榮教授、陳陽副研究員(現北京協和醫學院研究員)帶領跨學科交叉合作團隊在國際上首次建立了空間單細胞核代謝組技術SEAM。該技術可定位單個細胞在組織網絡中的位置、區分每個細胞相關代謝物的指紋圖譜差異、確定重要代謝物的分子組成,推動“空間代謝組技術進入了亞細胞時代”。
該成果發表于Nature Methods。
方法鏈接:
https://github.com/yuanzhiyuan/SEAM/
原文信息:
Yuan Z, Zhou Q, Cai L, Pan L, Sun W, Qumu S, et al. SEAM is a spatial single nuclear metabolomics method for dissecting tissue microenvironment. Nat Methods 2021;18:1223–32. PMID:34608315
原文鏈接:
https://www.nature.com/articles/s41592-021-01276-3
圖:首個空間單細胞核代謝組分析技術SEAM
Genomics, Proteomics & Bioinformatics(基因組蛋白質組與生物信息學報,簡稱GPB)于2003年創刊,是由中國科學院主管、中國科學院北京基因組研究所(國家生物信息中心)與中國遺傳學會共同主辦的英文學術期刊,由Elsevier金色開放獲取(Gold Open Access)出版。刊載來自世界范圍內組學、生物信息學及相關領域的優質稿件。現為中國科學引文數據庫(CSCD)和中國科技論文與引文數據庫(CSTPCD)核心期刊,被SCIE、PubMed / MEDLINE、Scopus等數據庫收錄。2018-2021連續位于中科院文獻情報中心期刊分區表大類“生物1區Top”。2020年,CiteScore為12.4,位于“計算數學”、“遺傳學”、“生物化學”、“分子生物學”四個學科領域Q1區;2年和5年Impact Factor分別為7.691和11.12,位于“遺傳學與遺傳性”學科領域前10%。期刊由科技部等七部門聯合實施的“中國科技期刊卓越行動計劃”資助(2019–2023)。
韓國浦項科技大學化學工程系教授SangminLee與美國華盛頓大學教授、2024年諾貝爾化學獎獲得者DavidBaker合作,通過使用人工智能模擬病毒的復雜結構,開發了一種創新的治療平臺。相關研究成果......
種質資源所農作物種質資源收集保護和評價創新團隊在綠豆(Vignaradiata)基因組組裝及馴化機制研究上取得新進展。研究論文“Telomere-to-telomere,gap-freegenomeo......
德國科學家對生活在約4.5萬年前的歐洲早期現代人已知最古老的基因組進行了分析,該研究為尼安德特人和現代人的混血時間提供一個更精確的日期,即距今4.5萬年至4.9萬年前的一次事件中。這比之前估計的時間更......
12月6日至8日,2024年生物與化工類學科高質量發展研討會在湖南科技學院召開。會議由湖南科技學院與中南大學主辦,湖南科技學院化學與生物工程學院、生物工程省級應用特色學科、湘南優勢植物資源綜合利用湖南......
廣東省農業科學院蔬菜研究所瓜類研究一室與北京市農林科學院研究員左進華團隊合作,在廣東省農業科學院科技創新戰略專項資金(高水平農科院建設)項目等的資助下,研究揭示了蒲瓜基因組組成和進化關系及果實生長發育......
——探索生命奧秘新途徑為促進我國糖復合物領域的合作交流,加快國內糖科學的發展 ,由中國生物化學與分子生物學會糖復合物專業分會、復旦大學/衛健委糖復合物重點實驗室主辦 ,分析測試百科......
傳統觀點認為,攜帶病毒的生物的遷徙一般會加速病毒的傳播。但最近有生態學研究表明,遷徙對病毒傳播有抑制作用,北美帝王蝶就是一個典型例證。長距離遷徙的帝王蝶相較于不遷徙的同類,感染寄生蟲病的幾率要低得多。......
在過去的二十年間,我們見證了生命科學領域的飛速發展與深刻變革,而這一切的起點,正是1953年4月25日,詹姆斯·沃森博士與弗朗西斯·克里克博士在《自然》雜志上揭示DNA雙螺旋結構的偉大時刻。為紀念這一......
東曹株式會社是一家成立于1935年的日本綜合化工企業,涵蓋化學品、電子材料、生命科學等領域。近十年來,公司在中國市場積極推進國產化戰略,與偉創力合作生產全自動糖化血紅蛋白分析儀,深化生命科學領域布局。......
ACAIC2024主題論壇4智能生物傳感技術創新論壇在ACAIC2024大會上,由深圳大學醫學部生物醫學工程學院主辦的“智能生物傳感技術創新論壇”成功召開。論壇主席張學記教授(深圳大學)、召集人劉輕舟......