眾所周知,在不同的情況下,在不同的組織中,基因表達的水平也不同。如今,研究人員可利用多種技術來追蹤基因表達水平的差異,如定量 PCR、芯片或測序。《Genome Technology》雜志這一次請來了幾位科學家,讓他們分享一下應如何選擇這些技術。此外,研究人員也談到了解決質量控制和數據分析的問題,以及如何驗證基因表達研究的發現。
Q1:您如何評估哪種方法(芯片、定量PCR或測序)最適合基因表達研究?
Gary Hardiman(加州大學圣地亞哥分校)
答案在很大程度上取決于研究的目的。傳統的qPCR最適合于少量目標和大量樣品。芯片和RNA-seq最適合于整體的轉錄譜分析。芯片和RNA-seq之間的選擇在于成本、數據處理的輕松程度以及檢測靈敏度。
芯片實驗的優勢在于它們很快,相對廉價,且數據存儲和處理較為輕松。在很短的時間內可生成兩個樣品之間差異表達基因的列表,并用于指導通路、基因本體、網絡/互作組的分析,為兩個樣品之間的生物學差異提供線索。這也可以通過測序來實現,但過程稍微復雜一些。如果要研究選擇性剪接,那么無疑要選擇測序。
芯片也面臨一些問題,包括近緣物種的交叉雜交,雜交動力學不好以及低豐度轉錄本的靈敏度差,無法區別目的基因和假基因。這些都會導致噪音數據。
商業化的芯片的缺點在于不能“與時俱進”,依賴于12個月或之前的基因組版本,有時注釋也不是最新的。這可能導致探針內容不再相關。此外,芯片也可能漏掉與特定研究相關的重要探針。人和小鼠的基因組芯片不會有很大的問題,但其他物種(如斑馬魚)可能會。
高通量測序則沒有以上這些限制。最終結果是一系列序列標簽,可定位到轉錄本上。測序是一個有序的過程,不存在芯片技術所固有的噪音,因此產生很少量真正的hits。而另一方面,芯片依賴結合的能量學,而少量轉錄本會被非特異雜交所沖垮,因此未檢測到。
大規模并行測序無疑將取代DNA芯片技術,來監控轉錄組的變化。然而,這些實驗的成本以及分析實驗的計算機要求讓測序不如芯片技術那么普及,但隨著測序儀產量更高,智能條形碼的實施以及可靠分析工具的出現,這將迅速改變。也就是說,如果現在要發現兩個樣品之間差異表達的基因,我還是會選芯片。
Chris Harrington(俄勒岡健康與科學大學)
為了確定哪種基因表達譜分析技術適合特定研究,我們會咨詢研究人員,考慮幾件不同的事情。整個研究的重點和實驗的具體目標是什么?是否要測定特定基因或網絡如何變化?或者要探索整體的表達模式?非編碼RNA如何?這是否是個臨床研究,對樣品量要求很高?我們利用這些信息來指導平臺和操作步驟的選擇。如果研究問題只是集中在少量通路或細胞功能,或者可通過芯片雜交檢測到的變化來回答,那么qPCR或芯片就夠了,也很經濟。
另一個問題是實驗可用的RNA量有多少,它的質量如何?目前,當總RNA起始量低于50 ng時,我們仍然借助于芯片和qPCR來開展表達譜分析,但我們預計少量RNA很快也能開展RNA-seq。
最后一個問題圍繞著數據分析的計劃和資源。qPCR和芯片數據已有可靠且易用的分析軟件,但RNA-seq分析對大部分研究人員來說仍是個挑戰。在我們建議一種具體的技術方法之前,我們嘗試讓研究人員了解有效的數據分析需要什么,以及所需的資源和/或合作者。
總的來說,我們會與研究人員共同確定哪種基因表達技術最能滿足他們的特定目標,適合他們的預算,并處理他們所有的RNA量和類型。如果RNA、預算或數據分析資源有限,我們往往會引導研究人員開展芯片或qPCR。
Craig Praul(賓夕法尼亞州立大學)
實驗的目標和成本指導了方法的選擇。就所分析的基因數量和樣品數量而言,這三種方法占據了不同的實驗空間。新一代測序和芯片顯然適合基因組范圍的表達分析,而定量PCR在單次實驗可評估的基因數量上要有限得多。樣品數量也是一個重要的考慮因素。如果大量樣品需要分析,那么新一代測序可能成本太高,而芯片實驗的花費大約在1/2至1/3。如果目的基因的數量有限,那么定量PCR是分析大量樣品的經濟高效方法。
最后,如果發現新穎轉錄本或剪接變體是基因表達研究的目標之一,那么新一代測序是唯一選擇。
Ralph Schlapbach(瑞士聯邦理工學院)
分析技術的選擇是基于研究項目需求的深度分析、研究小組的偏好以及現有的知識和數據。
根據所需的信息水平來解決一個特定的研究問題,選擇最精確、最具成本效益,也最節省時間的方法。目前有多種新一代測序技術(HiSeq、 MiSeq、SOLiD、羅氏/454、Ion Proton和PGM、PacBio RS)和芯片平臺(Affymetrix和Atlas芯片、安捷倫芯片)可供選擇,我們可以通過預實驗來確定最適合的技術。
如果準確定量、高靈敏度最重要,那么我們建議使用新一代測序。對于研究無參考基因組的物種或對表達的基因序列不了解的科學家,我們建議de novo轉錄組測序。同時,我們也對非編碼RNA的分析很感興趣,對于此,其他方法都不能以測序的成本和速度來提供數據。若研究目標可通過提供基因水平的表達數據來實現,那么許多研究人員仍然會選擇芯片,因為它們在相當短的時間內產生了與現有研究兼容的數據,且成本較低。
另一個考慮是基于樣品量和樣品的珍貴程度。如果只有極少量的材料,我們會越來越多地使用新一代測序來生成數據,因為現在出現了更多適用于低起始量材料的操作步驟。不過,在某些情況下,我們為安全起見,還是會選擇使用芯片,它產生了較少但仍然很有價值的數據。如果樣品量充足,但不可能或很難再次收集,我們會建議使用數據產量最高的技術,大部分情況下是高通量測序,結合不同的操作步驟不僅能捕獲基因表達數據,還有小RNA和長鏈非編碼RNA序列。另一方面,如果成本和周轉時間是最重要的考慮因素,那么實時定量PCR仍是一個很有價值的選擇,可以較低通量輕松鑒定基因表達,并驗證測序和芯片實驗的數據。
中新網騰沖12月7日電題:海歸科學家謝曉亮的赤子之心作者陸希成繆超白玲初冬的云南僑鄉騰沖,陽光灑落,白云悠然。靜靜矗立的滇西抗戰紀念館、國殤墓園,訴說著這座“英雄之城”的故事。“在騰沖能夠充分感受到先......
《科學》雜志15日發布了一項突破性研究成果:美國斯坦福大學Arc研究所團隊利用人工智能(AI),開發出一種大規模基因組基礎模型“Evo”,翻開了生命的“密碼全書”。該模型采用先進架構,能夠以前所未有的......
11月5日凌晨,中國科學院動物研究所攜手華大生命科學研究院、北京基因組研究所(國家生物信息中心),在全球頂尖學術期刊《細胞》(Cell)上發表了最新研究成果,利用華大自主研發的“超廣角百億像素生命照相......
近日,《柳葉刀-數字健康》發表了題為“基于高靈敏度檢測平臺輔助診斷食管鱗狀細胞癌:一項中國多中心病例對照診斷試驗”的研究成果。記者獲悉,該成果由中山大學腫瘤防治中心聯合河南省腫瘤醫院、汕頭大學醫學院附......
竹子即竹亞科是禾本科的重要分支,廣泛分布于亞洲、非洲和拉丁美洲,約有1,700種。作為一類生長快、多年生、可再生的森林資源,木本竹子越來越多被用作木材的替代品,具有重要的經濟價值和生態價值。有研究發現......
科技日報北京8月15日電(記者張佳欣)據最新一期《自然》雜志報道,德國康斯坦茨大學和維爾茨堡大學領導的國際研究團隊,對動物界最大基因組的擁有者——肺魚進行了基因組測序。肺魚基因組約為人類基因組大小的3......
在南美洲發現的一種肺魚是迄今測序的擁有最大基因組的動物。8月14日,一項發表于《自然》的研究顯示,美洲肺魚的DNA包含了驚人的910億個化學堿基,是人類基因組的30倍。然而,這910億個堿基只包含與人......
近日,中國熱科院品資所牧草團隊在木豆農家種高質量基因組組裝及種子百粒重遺傳基礎解析方面取得新進展,該研究繪制了一個我國的木豆農家種D30高質量參考基因組,并通過全基因組關聯分析(GWAS)......
不同微生物的基因組指向了一個初級免疫系統的早期進化所有生物共有的最后一個祖先是一種生活在42億年前的微生物,其基因組相當龐大,編碼約2600種蛋白質,以氫氣和二氧化碳為食,并擁有一個抵御病毒入侵的基本......
7月8日,記者從西南大學獲悉,該校教授代方銀團隊首次獲得了家蠶W染色體完整基因組序列,并揭示了鱗翅目昆蟲W染色體起源與進化新機制。相關研究成果近日發表于期刊《科學進展》。家蠶性別的決定機制一直受到科學......