引言
整個或部分基因組測序的研究問題已解決,研究者的研究重點向著遺傳密碼如何編碼調控細胞功能方向轉移。同樣,在分子水平了解人類健康狀況,基因序列數據則顯得更加重要。大多數的測序都是針對部分基因序列或是一段目標區域,提供必需的數據來解釋給定假說。利用PCR技術很容易從基因組中擴增得到一個離散的基因序列,當用該技術對靶序列進行測序的時候,通常被叫做擴增子測序。
根據假設,擴增子測序通常用于多個樣品中幾個到幾百個基因區域的研究。了解人類健康是醫療診斷的目的,擴增子測序技術在醫療診斷方面顯得非常重要。傳統的桑格測序法無法在大規模的多種樣品測序中滿足實驗的要求。下一代測序技術在過去五年的發展中顯著提高了測序通量,然而,在小規模的基因組測序中,NGS的測序儀器比較笨重,測序速度慢,成本也高。
Ion Torrent測序儀是唯一適用于擴增子測序技術的儀器,因其革新性,簡單、快速、可擴展并且經濟實惠。本文介紹了如何使用Ion Torrent進行擴增子測序,同時也提供了生殖細胞突變或體細胞突變檢測的實驗設計準則。
Ion Torrent 技術
Ion Torrent已經發布了一個商業化的儀器——1個新的半導體芯片——直接將化學信號轉換成數字信號。該儀器的第一個技術應用就是進行DNA測序。該儀器充分利用了幾十年的半導體研究成果,在短短幾年內就給整個的工業設計、制造和供應鏈基礎設施帶引入——1萬億美元的投資空間——迎接測序的挑戰。 該挑戰帶來的結果就是Ion半導體測序,第一個不需要光學系統的商業測序儀,且提供了一個前所未有的測序速度,擴增規模和低成本。該技術在幾個月內將測序規模從第一代含有一百多萬個微傳感器的Ion 314芯片擴展到七百多萬個微傳感器的二代Ion 316芯片——所有的運行時間都保持在1到2個小時之內(圖1)。
1. Ion 314芯片 該芯片灰色的橢圓形區域包含著一百多萬個半導體微孔,這些微孔接受并記錄測序的反應結果。
圖2 Ion Torrent測序芯片單個微孔橫截面的示意圖。 孔內容納的是含有模板DNA的離子微球顆粒。當合成一個核苷酸,就釋放一個質子,微孔的pH值隨著改變。離子傳感層檢測 pH的變化,并將化學信號轉變為數字信號。
該測序的化學反應非常簡單。一般地,DNA聚合酶將一個核苷酸滲入到DNA分子中就會釋放出一個質子,導致局部可被檢測的pH值變化。每個Ion Torrent半導體微孔測序芯片中含有將近一百多萬個DNA分子拷貝。Ion PGM測序儀按照一個核苷酸接一個核苷酸的微芯片流測序。在一個特定的微孔中,如果模板DNA分子上的一個互補的核苷酸被合成,微孔就會釋放出一個氫離子。然后溶液的pH值改變并被離子傳感器檢測到,基本上直接將該化學信號轉變為數字信號(圖2)。如果DNA鏈上有兩個相同的堿基,檢測到的電壓雙倍,芯片則記錄兩個相同的堿基。如果模板上的下個核苷酸與微芯片流的核苷酸不匹配,則檢測不到電壓,也不會記錄堿基。因該法是直接檢測DNA 合成,不需要掃描,攝像機,熒光等環節,幾秒鐘就可檢測合成插入的堿基,大大縮短了運行時間。
工作流程
Ion Torrent個人基因組測序儀的操作流程非常簡單(圖3)。第一步是產生兩端有Ion Torrent接頭的測序DNA片段的文庫。這一步可以通過直接將接頭固定在PCR產上或者在設計PCR引物的時候直接在引物的5’端加上Ion的接頭序列來實現(圖4)。
圖3. Ion Torrent測序工作流程示意圖。 生產兩端含Ion Torrent測序接頭的DNA測序文庫片段。將文庫片段克隆到離子微球顆粒上并進行乳液PCR擴增。將含有擴增模板的離子微球顆粒應用到Ion Torrent的芯片上,然后將芯片放置在Ion PGM上。設立Ion PGM測序運行程序。測序結果以標準的文件格式顯示。下游的數據處理可以用Partek ? Genomics Suite ?系統的DNA測序數據分析工作流程進行分析。
圖4. 生成測序文庫的PCR擴增引物結果。可以用標準的引物設計軟件設計引物,如Primer3.根據選擇的特定物種模板序列時使用。
然后,文庫的片段被克隆到專門的離子微球顆粒上,再通過微乳液PCR進行擴增。將表面帶模板的離子微球顆粒轉移到Ion芯片,通過短暫的離心將離子微球顆粒沉淀到芯片的微孔中,接著放到個人PGM儀器上按觸摸屏上的操作導引建立程序運行測序。
Ion文庫片段試劑盒使用說明書,Ion 314模板試劑盒使用說明書,Ion 314測序試劑盒使用說明書。各說明書上有相應工作流程詳細的步驟說明。
數據一旦在Ion PGM測序儀上產生,儀器會自動將數據傳送到Torrnet測序的服務器上。在該服務器上,數據通過信號處理和堿基算法分析,產生單次讀長的相關DNA序列。Torrent用戶網頁上有一些實驗數據的總結,這些數據的結果可以供用戶瀏覽和下載,數據文件格式為SFF,FASTQ或SAM/BAM。這些Ion Torrent的測序數據可以被多種NGS數據分析系統識別。這篇文章的數據分析描述是以Partek基因組分析系統為例子的。
實驗設計注意事項
為了要得到最理想的擴增子測序結果,需要考慮以下幾點:
?雙向或者是單向測序
?測序目標區域的長度
?測序覆蓋深度
一般我們推薦選擇雙向測序,雙向測序可以產生高質量的測序讀長,因為雙向測序可以分別從兩端讀取擴增子的全長(相當于進行了兩次測序)。雙向測序的方法要求每個目標區域包含4個融合引物,兩端的任何一個接頭序列都必須融合到特異的目標區域兩端。兩對融合引物中的其中一對,靠近目標區域的近端含有一個A接頭區域,而目標區域的末端含有P1接頭區域。另外一對融合引物將會含有A和P1接頭的交換區域(圖5)。單向測序只需一對融合引物就可以從擴增子的一端擴增整個片段。
圖5. 如何選擇恰當的靶序列DNA特異引物進行乳液PCR擴增構建用于雙向和單向測序的擴增子文庫示意圖。雙向測序需要生產兩個模板,需設計兩對引物,而單向測序只產生一種模板,只需設計一對引物。
為了獲得最佳的測序結果,必須慎重選擇靶序列區域的長度。而目前的單次讀長為100堿基。然而,片段開頭的20-25個核苷酸序列與靶序列PCR引物對應的序列將不會產生信號數據。因此,我們目前的靶序列(有信號產生的擴增子區域)長度約為75個核苷酸。該技術正在快速發展中,隨著單次讀長的增加,將進一步打開大片段擴增子的研究大門。雙向測序可以獲得更長的片段(約為150個核苷酸),且序列的兩端讀長不會重疊。
覆蓋的深度是用來確保足夠的統計置信度,以便作出準確的突變預測,其范圍也將決定樣品的預期突變頻率。實驗所需的覆蓋深度也將決定擴增子的數量,該數量包含于每張芯片固定的測序通量。作為指導,我們應該考慮兩個不同的使用情況,即所需的覆蓋深度范圍和單次測序的擴增子讀長。
1、對于遵循標準孟德爾遺傳模式的種系突變分析,預期在100%或是50%的測序讀長中含有一個給定的序列變種。這種情況遺傳性疾病如囊性纖維化(CF)、家族性癌癥、智力低下、發育性疾病等方面比較常見。在這種給定序列變種的均質細胞系中,覆蓋深度為100-200X的范圍可提供檢測統計置信度所需的足夠數量的讀取數據。Ion 314芯片提供的覆蓋深度可滿足500個擴增子雙向測序所需的序列讀長(圖6)。Ion 316芯片的測序通量是Ion 314芯片的10倍,因此每張芯片可以測更多的擴增子或是更復雜的樣品。樣品的多元性測序是利用分子條形碼來實現的,該分子條形碼是一組獨特的序列(通常為6-10個核苷酸長),該序列是每次讀長的一部分,可以用來鑒定一個給定樣品相關的所有讀長。Ion Torrent公司目前正在構建與Ion Torrent測序平臺兼容的分子條形碼。
圖6. 兩個擴增子事件說明覆蓋深度與擴增子數量之間的相關性示意圖。生殖細胞突變檢測,要求中等覆蓋深度;體細胞突變檢測,要求更高的覆蓋深度,因為在同樣的運行情況下,結果顯示,體細胞突變能夠測序的擴增子數量較少。Ion 316 芯片每張可以容納更多的樣品或增加每次實驗的擴增子數量。
2、在混雜的癌癥樣品中,多種類型、低頻率的體細胞突變檢測一般需要比較高的置信區域,其必須的更廣覆蓋深度范圍為1000-2000X。在該覆蓋深度,Ion 314芯片提供的通量完全足夠50個擴增子的雙向測序讀取(圖6)。Ion 316芯片提供了更高的通量,其覆蓋區域可以滿足更大數量擴增子的測序或是頻率更低的變異體檢測。
DNA突變的鑒定
堿基數據一旦生成并且與Torrent服務器上的參比DNA序列比對,然后SAM(序列比對格式)的數據文件可以直接導入Partek? Genomics Suite ? (GS)基因組分析系統進行后續分析。該基因分析體統會按照預先設定的工作流程進行各種分析。在DNA測序的工作流程中,多種樣品的分析是一個以循序漸進的方式產生Ion Torrent擴增子測序數據的過程。該進程是用戶以一個合乎邏輯的方式將SAM文件(PGM每次運行所得數據)步進導入Partek? GS數據分析系統。數據是按照復制結構來分組的,不管是生物合成或人工合成的復制數據都可用。由于覆蓋區域的差異,跨越幾個短的擴增子內也會發生,系統則認為該數據種類是正常的,野生型樣品與實驗樣品數據的分析是平行運行的。Partek? GS系統實行這樣的統計檢測,比較實驗樣品的堿基對組合與野生型正常樣品堿基對組合的基本差異。擴增子上每個堿基的檢測統計P值是按照以下的定義產生的,即如果變異存在,那么檢測到的變異的概率應該是隨機的。圖7以圖形方式顯示的結果是根據導出的數據表產生的。該圖可供科學家查看所發現的突變位點(根據P值判定)具體的基因組位置和每個突變位點附近相關序列的覆蓋深度區域。通過對基因組位置進行的統計檢測,可以在找到的顯著突變范圍中刪除一些不確定的突變選擇。
圖7. 均質細胞系內跨BRAF基因區域的DNA突變鑒定。頂部——圖示窗口顯示了BRAF基因序列內其中的22個堿基對。紫色的垂直線表明了26位點上高突變頻率(P值檢測的負Log函數值)。灰色區域顯示的是Ion Torrent測序覆蓋深度(約140X)區域。該突變是BRAF基因1799位點上T替換A的事件。樣品中幾乎100%的讀取都測出了這種突變,表明它是同質細胞系樣品內的純合突變。底部——彩條顯示了Ion Torrent定位的覆蓋區域讀長的堿基排列順序。根據底部圖例,每一種顏色都對應表示4種核苷酸的其中一種。
總結
擴增子測序是NGS測序技術中應用增長最快的一種,特別是在臨床研究的相關領域。擴增子測序在基礎研究方向也有廣泛的應用,如追蹤全基因組研究中鑒定的感興趣區域,重要的信號通道研究等。本文詳細說明了Ion PGM測序儀在生物基因相關區域,生殖細胞突變或體細胞突變的檢測應用。 我們提供了擴增子測序運行的完整實驗設計及工作操作流程準則。通過專門的擴增子測序的統計檢測分析,Partek?GS系統擴展了其在DNA序列數據分析的通量。該分析軟件不但提供了突變事件統計計算的置信度,而且還以直觀的圖形顯示突變位點在基因組的位置、覆蓋深度和突變事件的概率。這些結果可直接保存或以各種公認的高質量文件格式導出。 相比之下,簡單的Ion Torrent測序技術不超過2小時就能完成其它NGS測序技術需要幾天或是數周才能完成的工作。該技術結合了基礎化學和半導體的檢測技術,無需成像和熒光檢測,也不需要成像相關的攝像機或掃描圖。 由于芯片就是測序的主要儀器,因此該測序技術有極大的可擴展性。Ion 316芯片的測序通量是Ion 314芯片的10倍。更多的通量允許樣品以多條形碼的方式研究,極低頻率突變的判定是每次運行測序時通過對異構樣品的檢測或是分析更多數量的擴增子來實現的。只需購買一臺儀器設備的,用戶可根據不同的實驗要求選擇不同級別的測序通量。此外,不久的將來,隨著測序讀長的延伸,可以對更大的擴增子進行測序。Ion Torrent公司已經成功的將單次測序讀長提高到200個核苷酸。 Ion Torrent介紹了非常適合擴增子測序的一種革命性的技術。它是一種經濟、快速、簡單、規模可擴展,極具前瞻性的測序技術,也是各種不同規模的實驗室想要進行高通量測序的完美選擇。