實驗材料:小麥
試劑、試劑盒:
儀器、耗材:SDS 聚丙烯酰胺凝膠電泳
實驗步驟:
3.1 芯片背景
我們使用了
19846 個點,包含 9246 個 Unigene 序列的小麥 cDNA 芯片(http://www . cerealsdb. uk.
net/index. htm) 用于詳細的轉錄組研究 [3 ] 。重復的 unigene 集合陣列點到了 Codelink
活化芯片上(Amersham Biosciences Ltd, UK ) 。
芯片雜交用與 aa- dUTP- cDNA
樣品熒光標記染料反向的染料——Alexa 熒光染料 555 和 647。雜交在轉基因系 (B 102-1- 1、B1118-8-4 或
B1355-4-2 ) 和其原始非轉基因系 ( L 88-31 或 Cadenza ) 之間的兩個胚乳發育階段(開花后 14 天和 28
天,dpa ) 和葉片 ( 發芽后 8 天,dpg ) 成對比較 [5]。每個材料取樣 3 次,檢測 2 次。
cDNA
芯片的優勢是經濟實惠,并允許使用者完全控制內容和設計(定制芯片)。相反,Affymetrix
寡核苷酸芯片更加靈活,它是單染料系統,使試驗更簡單、更特異(提高對類似的異構體和多基因家族成員的識別能力),提供更量化和易比較的數據。GeneCMp
基因組芯片,采用了一套能匹配任何轉錄序列的 25 堿基寡核苷酸“探針”。以小麥芯片為例,每組探針有 11 個,多數與組裝的序列表達標簽(
EST ) 的公共保守域序列一致。因此,在 cDNA 芯片中,每一組探針對應的是許多 EST,而不是單個的
EST。為了識別不同的轉錄本,同時滿足其他條件,如 GC 含量相對一致,探針通過程序自動化設計。對于一個目標轉錄本,設計了
一個完全匹配的探針(perfect matches,PM ) 、一個單堿基錯配探針(mismatches,MM )
,這樣能對非特異雜交有一個估計和矯正。然而,對于 MM 探針的真正信號值存在爭論,許多廣泛使用的分析方法不用 MM 探針( 見 3.10節)。短
探針( 如 25-mer)
對于序列相似的轉錄本更有效,因為單個堿基錯配足夠使雜交不穩定,而且固定長度使得雜交條件可以標準化,以滿足所有探針;相反,較長的可變長度的探針,比如那些
cDNA 芯片平臺使用的探針,將不可避免與任何與其部分序列相似性探針雜交,所以其真實信號集成了幾個不同的轉錄分子。
3.2 植物材料和生長條件
轉錄組比較研究使用了三個六倍體轉基因面包小麥的胚乳和葉片。轉基因小麥品系
B102 -1-1 ( L 88-31 背景) [ 6, 7 ] 和 B1118-8-4 ( Cadenz 北背景)[ 5 ]
由基因槍共轉化兩個質粒產生[ 14 ] 。一個質粒是 p1Axl 質粒 [ 13 ] ,含有由自身的胚乳特異啟動子驅動的高分子質量谷蛋白亞基
1AX1 ( Glu-M ) 基因; 另一個質粒含有選擇基因bar 和標記基因 uidA,由玉米泛素啟動子驅動。轉基因系 B1355-4-2 [
5 ] 也來自 Cadenza,共轉化獲得只含 IAX1 基因和 bar 基因編碼序列的“干凈”片段。一個常規育種系 L88-18 [ 9 ]
是 L88- 31 的姐妹系,也用于轉錄組比較。兩個常規育種系 ( L 88-31、L 88-18 ) 和轉基因系(B 102-1-1 )
的轉錄組兩兩比較是:B 102-1-1與 L 88-31、L 88-18與 L 88-31、 B 102-1-1與 L
88-18。轉化方法的比較,即 “干凈”片段與整個質粒的比較:B1355-4-2 與 Cadenza、 B1118-8-4 與
Cadenza、 B1355-4-2 與 B1118-8-4。本研究所用的不同面包小麥攜帶的相關基因成分的詳細信息見表15 . 1 。
( 1 ) 植物種在平衡行列設計的盆缽中,每個處理(小麥生長發育階段)有 3 個生物學重復。
( 2 ) 開花后 14 天和 28 天胚乳,取樣的植物每盆種 2 株。每一株只保留 2 個分蘗。選中的盆缽(本試驗為 3 個生物學重復)包括用于發芽后第 8 天取葉片的第三株植物。
( 3 ) 每天觀察穗,一旦發現中央小穗開花就做標記。
( 4 ) 在無菌條件下,手工從穎果剝離種子胚乳;每盆只從 2 個穗子的中部分別取至少 24 枚胚乳為一個樣品。
( 5 ) 樣品都是一天中同一時間取樣,以避免晝夜節律的影響。
3.3 SDS-PAGE
通過谷粒總蛋白 SDS-PAGE 凝膠電泳,檢測所有小麥系的高分子質量亞基蛋白的表達(圖 15. 1 ) ,使用 10% ( m/V) 丙烯酰胺凝膠和 Tris-硼酸緩沖液系統 [ 10 ] 。
3.4 RNA 提取
3.4.1 小麥胚乳總 RNA 提取
提取方法根據 Chang 等 [ 11 ] 改編而來。
( 1 ) 用預冷的研缽和杵(-70°C ) 在液氮里將 2~3 g 組織磨成粉末(見注 8 ) 。
( 2 ) 室溫下迅速將磨碎組織轉移到有 15 ml 提取緩沖液(加入 300 μl β-巰基乙醇 ) 的離心管中,充分顛倒混勻( 見注9) 。
( 3 ) 用等體積氯仿:異戊醇(終體積 15 ml ) 抽提兩次,液相分離用 15000 g 室溫離心 10 min。
( 4 ) 上清液加 0.25 倍體積 10 moI/L LiCl 混勻。4℃ 過夜沉淀 RNA,4℃、15000 g,離心 20 min 獲取 RNA。
( 5 ) 500 ml SSTE 懸浮沉淀顆粒。
( 6 ) 用等體積氯仿:異戊醇抽提一次。
( 7 ) 上清液加兩倍體積乙醇,-70℃ 沉淀 30 min 以上或者 -20℃ 沉淀 2 h。
( 8 ) 15000 g 離心 20 min 沉淀 RNA。
( 9 ) 75% 乙醇洗滌。
( 10 ) 干燥沉淀并溶解于無核酸降解酶水中。
3.4.2 發芽后 8 天幼苗 RNA 提取
提取方法根據 Cheng 等 [ 12 ] 改編而來。
( 1 ) 用預冷的研缽和杵(-70℃ ) 加液氮里將已知質量組織(大約 1 g 幼葉)磨成粉末(見注9) 。
( 2 ) 將冷凍的粉末快速轉移到第二個有 10~15 ml 勻漿緩沖液的研缽中(見注10),繼續研磨至均勻(見注 11)。
( 3 ) 勻漿液轉移到 50 ml 帶帽的圓底旋蓋離心管中,60℃ 孵育 10 min ( 勻漿液終體積 5~10 ml )。
( 4 ) 離心管置冰上冷卻,加 0.2 倍體積 pH 5.5 的 5 mol/L 乙酸鉀(見注 12) ,輕輕地充分混勻,然后冰上靜置 10~15 min。
( 5 ) 10000 g、4℃ 離心 15 min , 取上清液到新的離心管中。
( 6 ) 加等體積酚:氯仿(1 : 1,V/V ) 混勻,擰緊瓶蓋并劇烈振蕩 10 min。10000 g、21°C 離心 10 min。取上層水相于新離心管中(見注13)。
( 7 ) 水相重復上一步的酚:氯仿萃取和分層。
( 8 ) 往水相加 0~1 倍體積 3 mol/L pH 5.3 乙酸鈉和 2.5 倍體積乙醇。混勻后 -20℃ 孵育過夜以提高核酸沉淀效率。
( 9 ) 10000 g 、4℃ 離心 30 min 沉淀核酸,棄上清。倒置離心管數分鐘。
( 10 ) 少量無核酸降解酶水( 300~700 μl ) 溶解沉淀。核酸溶液轉移到 Eppendorf 管,加 0.67 倍體積 10 mol/L 氯化鋰沉淀 RNA。拌勻,冰上孵育 20~30 min ( 見注14)。
( 11 ) 離心(15000 g,室溫,20 min ) 沉淀 RNA,棄上清。
( 12 ) 用盡可能小體積( 200~300 μl) 的無核酸酶水溶解沉淀,重復氯化鋰沉淀,和上一步同樣離心沉淀 RNA。
(13 ) 200 μl 無核酸酶水溶解沉淀,加入 15 μl 5 mol/L 乙酸鉀(pH 5.5 ) 和 800 μl 乙醇。混勻,離心(15000 g 室溫,20 min) 沉淀 RNA ( 見注15)。
( 14 ) 棄上清,加入 1.0 ml 80% ( V/V ) 乙醇,離心洗滌 RNA ( 15000 g,室溫,10 min)。
( 15 ) 離心管開蓋置于超凈工作臺,室溫干燥沉淀不超過 10 min。溶解于 100~200 μl 無核酸酶水中。將每份樣品分成等量小份以避免在反復凍融過程中污染或者降解。
3.4.3 總 RNA 樣品除去基因組 DNA
RNA 提取之后用 DNA-free ( DNA 酶處理和清除試劑盒,Ambion) 按照使用說明處理 RNA 片段。該系統專為去除 RNA 樣品中的 DNA 雜質和清除處理后的 DNA 降解酶 I,無需加熱或苯酚提取。
3.4.4 RNA 定量分析和質量控制
RNA
濃度、完整性及質量檢測使用 Nanodrop ND 1000 分光光度計(Labtech Int ,U K ) 和 Agilent 2100
生物分析儀 ( RNA 6000 Nano Assay, Agilent Technologies, PaloAlto, CA,USA )
( 見注 16)。
3.4.5 樣品保存
RNA 樣品短期(最長 3 個月)保存在 -20℃,長期則在 -80℃。
3.5 cDNA 合成
( 1 ) 加 100 μg DNA 酶處理過的總 RNA ( 不超過 20 μl) 、8 μl oligo (dT)23 錨定引物和無核酸酶水至終體積 28 μl。
( 2 ) 將啟動反應混合物在 70℃ 孵育 10 min,置于冰上 5 min。
( 3 ) 向啟動反應混合物加入 cDNA 合成反應混合物:10 μl 5x 第一鏈緩沖液,10 μl 0.1 mol/L DTT,5 μl 50x aa-dNTP 混合物,2 μl Superscript 逆轉錄酶Ⅲ( 200 U/L ) ,加無核酸酶水至終體積 50 μl。
( 4 ) 42℃ 孵育 2~3 h。
( 5 ) 用微型離心柱(Qiagen) 參照使用說明純化 aa-dUTP-dDNA 產物。
( 6 ) 收集最后的洗脫液 10 μl 作為樣品。cDNA 的產品將用于準備芯片雜交的探針和實時 RT- PCR 技術。最后反應可不用 50x aa-dNTP 混合物進行(見注 17)。
3.6 cDNA 芯片標記
( 1 ) 為了 cDNA 與突光染料偶聯反應,將需要反向染料標記的總 cDNA ( 見第3.5節步驟6 ) 分成兩等份(5 μl ) ,并將不同梁料的反應放在單獨的管。
( 2 ) 每管加入: 5 μl 氨基烯丙基純化的 cDNA ( 見 3 . 5 節步驟 3 ) ,3 μl 1 mol/L NaHCO3 標記緩沖液,2 μl ALexa 熒光染料 555 或者 647,10 ml 無核酸酶水。
( 3 ) 移液器混勻,室溫黑暗孵育 1 h。
( 4 ) 用 mini Elute columns 試劑盒(Qiagen) 去除沒有與 aa-dUTP- cDNA 偶聯的染料( 見注18)。
3.7 cDNA 芯片雜交
( 1 ) 取 20 μl 混合的標記 cDNA ( 來自 3. 6 節步驟 6 的兩個 Alexa 染料)加入到 25 μl 2x 雜交緩沖液和 2 ml poly (dA ) 。
( 2 ) 探針在 95℃ 3 min 變性。
( 3 ) 標記的探針涂在蓋片上,并將載片印有 Code Link 面朝下放置。
( 4 ) 將芯片雜交盒置于烘箱內 42℃ 過夜。
( 5 ) 將芯片置于含有溶液 A 的 Falcon 管(藍帽)中(見 2. 6 節步驟 2 ) ,室溫顛倒 15 min (見注 19)。
( 6 ) 將芯片轉移到第二個含有溶液 A 的 Falcon 管中,室溫顛倒 15 min。
( 7 ) 將芯片轉移到第三個含有溶液 B 的 Falcon 管中( 見 2 . 6 節步驟3 ) ,室溫顛倒 15 min。
( 8 ) 將芯片轉移到第四個含有溶液 C 的 Falcon 管中(見 2 . 6 節步驟3 ) ,室溫顛倒 15 min。
( 9 ) 將芯片放置干燥的 Falcon 管中,立刻 8000 g 離心干燥。
( 10 ) 用 Axon 儀器公司的 Gene-Pix 400B 型雙激光掃描儀掃描雜交芯片。
3.8 cDNA 芯片數據分析
芯片做圖像分析,檢測每一個觀測點的兩種熒光信號的強度,以此來評估成對小麥系之間轉錄基因的表達差異。數據標準化后,作適合某個模型的統計分析,說明實驗設計 ,檢測差異表達的顯著性。
3.8.1 圖像分析和標準化
芯片上的點用
GenePix 軟件掃描成圖像(Gene Pix 第 5 版,美國 Axon
儀器公司),然后所有的點進行人工檢測,排除雜交失敗或者信號弱的。圖像分析給出了每一點的所有像素,這些數據包含了兩種熒光染料信號(647和 555
) 的平均值和 Log2 比率值。這些數據專用于差異表達分析。將數據從 GenePix 導入 GeneSpring 軟件包 (GeneSpring 6. 2 美國硅遺傳公司),然后信號強度的 Log2 比率值進行標準化。本研究中,一個點的 Log2 比率值(差異表達的)( M ) 和 Log2 乘積(亮度的)( A ) 之間的比較表明,局部加權光滑描點技術( LOWESS ) 標準化處理,可用于消除數據不佳的趨勢。換句話說,所有點的 Log2 比率值乘以 ( across ) 光 強 ( Log 乘積)應該在一個恒定范圍內,但圖像顯示有一些會隨著 A 増加而發生變化的趨勢。因此,標準化處理的目的是消除 Log2
比率數據的系統變異( 比如由于實驗過程)。局部加權光滑描點技術( LOWESS ) 標準化處理,是通過逐點檢測 M 和 A
值之間的關系,然后相應地調整 M 值(adjusted M = MLOWESS- fittedM) 。由于有兩個獨立的實驗, L 88-31、
L 88-18和 B 102-1-1的數據與 Cadenza的數據分開處理。
3.8.2 統計分析
參考
Kerr [ 15 ] 討論的方法,使用 GenStat 統計系統( GenStat 第 7 版 ,GenStatProcedure
Library Release PL15, Lawes Agricultural Trust, Rothamsted
Research Harpenden, U K ) 分析規范化的數據( 進一步的詳細信息見[ 5 ]
及其補充材料)。在估計基因的固定效應之前,用符合 Log2 比率的線性混合模型來估算實驗設計( 生物學和技術重復)的隨機效應。該模型通過模型計算用數據的整體殘差( 噪聲)估計標準誤參 數(一個基因一個參數)。每個參數對其標準誤的比率服從殘留自由度的 t 統計分布,這使得從 0 (Log2 范圍)開始的差異表達統計上顯著性得到評估。在我們的研究中,通過表達量和拷貝數篩選顯著差異表達基因( P <0.05 ),只有那些表達差異大于 1.5 倍并且存在多 2 次以上重復的基因被保留下來做進一步分析。
3.8.3 用實時 RT-qPCR 驗證差異表達
挑選轉錄本做實時 RT- qPCR 驗證芯片表達數據,見 3.13 節。
3.9 芯片數據介紹
對簡單的實質等同性實驗來說,一個比較轉基因系與對照之間基因表達的散點圖就已足夠了。文獻
[ 5 ] 中參與兩個實驗的樣品都標注在圖15. 2中。結果用 GeneSpring
軟件包顯示,繪制了每組比較小麥系之間每個基因成對的平均強度,并突出顯示少數感興趣的基因(統計上顯著差異表達)。結果也在表15 . 2
中作了數值化總結。
結果表明,轉基因并未影響顯著數量的內源性基因的表達,轉基因植物實質等同于其相應的非轉基因對照或親本[
5 ] 。結果也證實了轉化方法( 如干凈片段或者整個質粒)對基因表達模式影響不大。實質等同性實驗強調統計上的嚴謹性,對 cDNA 芯片來說
,考慮諸如染料偏好性和芯片空間變異等的問題( 見注20,目前 cDNA 芯片實驗數據分析的評價)。
對于簡單的實質等同性實驗而言,一張簡單的比較轉基因系和對照系之間表達的散點圖就可以了,更復雜的設計可能需要其他的顯示方式。無論是
cDNA、寡核苷酸芯片或者其他平臺,分層聚類是一種有力的轉錄組數據概覽方法
[16]。這種方法將有基因關聯表達的樣品和(或)基因分組,不同的關聯程度以樹狀圖可視化。它通常是以熱圖樣式顯示的:基因樹在一邊,樣品樹在另一邊,顏色代表基因的表達量。如果檢測到處理對表達有影響,不同處理的樣品會表現為不同的分支,所有重復出現在這些分支內的葉片上;在另一維,不同表達的基因也會聚在一起。
基因表達譜的非分層聚類方法,如
K 均值、質量閾值(QT )
和自組織映射等也是常用到的。基因簇的平均表達值可以簡化轉錄組數據。共表達意味著共同的轉錄調控和潛在的功能關系。進一步檢查基因簇內基因,以確定是否有任何共同的已知功能(如蛋白質儲存、應激反應或防御),或參與共同途徑。對于作物如小麥中的絕大多數基因,功能只可能從序列相似性推測。聚類分析,顯示和注釋工具可以在開放資源
[ 如 Bioconductor (http://www .bioconductor .org / ) ] 和商業軟件包 [ 如
GeneSpring (AgilentTechnologies, Inc) ] 獲得。
3.10 分析小麥基因芯片背景
這里概述了 Affymetrix 基因芯片表達分析應遵循的步驟。詳細的標準流程可以在“ Affymetrix 基因表達分析技術手冊”中查詢(見注 21 ) 。
基因芯片探針芯片是由
Affymetrix 公司制造的(見注 22) 。現在許多大學和私入公司已全面配備 Affymetrix Gene Chip TM
芯片平臺,為客戶提供各種芯片檢測過程服務(GeneChip芯片探針購買、cDNA 標記、芯片雜交、掃描、芯片分析等)。
Affymetrix
Wheat Gene Chip 芯片由 AffymetrixGene Chip Consortia Program 制造,包含了
61127 套探針,代表小麥基因組所有 42 條染色體上 55052 個轉錄本。芯片是基于 GenBank 和 dbEST (
http://www.affymetrix.com/community/research/consortia .affx )
上發表的功能域數據設計的。小麥基因組芯片可用于不同小麥種的基因表達研究: UniGene Build 38,2004 . 4 . 24 )
。該芯片包含了至 2004 年 5 月,所有這些種的 EST 和全長序列設計的探針。
GeneChip 探針芯片制造過程結合了光刻和化學合成技術。1.7cm2
的芯片上有幾萬到幾十萬個不同的寡核苷酸探針,每個探針點(探針室)20 mm。每一個目標轉錄組由一套長度 25 個堿基的 11 個 PM 和
11 個 MM 探針來檢測。這些 PM 和 MM 探針(探針對)位置彼此相鄰。基因表達水平可以用 Affymetrix 軟件通過 PM 和 MM
探針之間亮度差異來計算(見注22) ,或者只用 PM 探針的亮度計算(RMA 和 gcRMA 分析)。
3.11 小麥基因芯片表達分析
3.11.1 RNA 樣品準備
對于特定組織,RNA
[ 總 RNA 或者提純的 poly ( RNA species ) ] 提取和純化可以采用已有的步驟(步驟與 3. 4節敘述的類似)。RNA
提取也有許多商業試劑盒可供選擇。例如,TRIZOL - Reagent (Invitrogen ,見注2 3 ) 被推薦為小麥旗葉的總
RNA 提取方法。當提取物含有大量的糖蛋白和多糖時,標準步驟中勻漿(TRIZOLRNA提取說明步驟1 ) 和 RNA 沉淀(TRIZOLRNA
提取說明步驟 3 ) 需要略作修改。勻漿這一步,勻漿產物需要增加一步離心(見注 24) 。RNA 沉淀這一步,水相回收沉淀總 RNA
需要用異丙醇和高鹽沉淀溶液(見注 25) 。為了得到高純度 RNA ( 特別是 A260/A230。比值
>1.8),我們還建議 RNA 過 RNeasy 柱(Qiagen,見注26 ) 洗滌。RNA 清理建議放在總 RNA 樣品中去除基因組
DNA 之后進行(見 3.4 節)。核酸濃度和質量分別用 Nanodrop ND 1000 分光光度計和 Aglient 2100
生物分析儀(RNA 6000 Nano Assay, Agilent Technologies , Palo,Alto,CA , USA
) 檢測(見注 16)。
3.11.2 cDNA 合成和標記(見注 27 )
從總 RNA [ 或者純化的 poly ( A ) RNA ] 合成雙鏈 cDNA,然后生物素標記的 cRNA 由 cDNA 體外轉錄。與基因探針芯片雜交前,發現 cRNA 片段對于最高靈敏度是很關鍵的。
3.11.3 雜交(見注 28)
準備雜交混合物包括 cRNA 片段和探針芯片對照。與探針芯片雜交,孵育 16 h。
3.11.4 探針芯片洗脫與染色
(
1 ) 流體工作站(fluidic station ) 的設置: 流體工作站是用于芯片洗脫和染色的。它是通過兼容 PC 工作站上
GeneChip Operating System ( GCOS ) /Microarray Suite
操作的。步驟包括設置和啟動流體工作站(見注 29 和注 30)。
( 2 ) 芯片的洗滌和染色(見注 31 ) : 16 h 雜交后,除去芯片上雜交液( 見注 28) ,然后將芯片完全浸入適當體積推薦的清洗液(見注 31)。
3.11.5 芯片掃描(見注 31)
一旦掃描結束,每張完整的芯片圖保存在一個以.dat
為擴展名、實驗名字命名的文件。GCOS 采集和分析芯片圖譜及實驗數據:定義探針單元并計算每個單元的光強度 ( 見注 22)
。由于制造過程中的更高的質量控制,許多 cDNA 芯片圖譜分析的問題,如空間變異對 Affymerix 芯片來說不用考慮( 3.8
節)。產生了包含每一個 PM 和 MM 探針信號值的輸出文件(cel 文件)。
3.12 小麥基因芯片數據分析
Affymetrix
公司芯片廣泛用于許多種生物,人們投入了相當大的精力來開發和測試不同的方法分析信號,以尋找最好的基因表達檢測方法。Affymetrix
開發的方法是以一組探針的 PM 和 MM 之間的平均差異來估計表達( MAS5 ) 。然而,MM
信號值的有效性還有疑問,而且有一些替代的方法看起來事實上超過了 MAS5。RMA (robustmultichipaverage)
算法取一個實驗的所有 PM 數據(如全部 cel 文件),不僅標準化每個芯片表達數據中位數,而且對每個芯片表達數據使用相同的方差
[17]。gcRNA 算法是 RMA 一個變種,它將每個探針的 GC 組成對信號貢獻的權重考慮在內[18]。與其他方法相比,在標樣 [ 19 ]
檢測和實時反轉錄 PCR 定量 [ 20 ] 方面,它能很好處理 Affymetrix 芯片數據。gcRNA 算法可以使用開源的
Bioconductor 軟件包(http :// w w w .bioconductor .org) 或者商業軟件如
GeneSpring7 (Agilent Technologies, Inc) 。
一旦選擇了表達檢測方法(如
MAS5、RMA 、gcRNA 或者其他),接下來的分析是一樣的,而非標準化數據( 如 MAS5 )
必須首先進行標準化(如除以每一個芯片表達值的中位數)。建議先篩選探針集,保留絕對表達值高于閾值(至少一個樣品如此)的所有探針(可以從芯片中非小麥對照的信號判斷)。這些探針進一步篩選那些表達差異在任何一對樣品的閾值之上的;通常
1.4 倍的變化被認為是可以檢測到的最小值。實質等同性實驗設計通常有 2 個以上基因型,至少 3
次生物學重復。為了檢測到基因型之間統計上顯著差異表達的基因,對每個探針集的表達值的對數(它們通常呈對數正態分布)作方差分析 (ANOVA )
。假定即使經過篩選,探針數量依然非常大,可以用多重檢驗校正。Benjamini-Hochberg 假陽性率( FDR ) 校正 [ 21 ]
是不錯的選擇。對許多探針做經典的 P<0.05 的方差分析和 Benjamini-Hochberg 多重檢驗校正,能夠有大約 5%
的基因通過純屬偶然。然而,如果很少或根本沒有基因通過此校正,可以取消多重檢測,方差結果是假陽性率所致。例如,如果 1000 個探針 P
<0.05 測驗,50 通過了但沒有多重檢驗校正,這只是不超過預計的運氣。重要基因名單的實質等同性標準是與 cDNA 芯片實驗相同的 [ 5
] 。
3.13 實時 RT- PCR 驗證轉錄組數據
有兩種常用的基因(擴增子)定量檢測方法:基因特異熒光探針(如
TaqMan chemistry) 或者特異雙鏈 DNA 結合試劑(SYBR green chemistry ) [22]。我們通過實時
RT-PCR,選擇 SYBR green chemistry 來驗證 cDNA 芯片發現的 DEG 的表達。不同的基因設計特異引物(見注 32)
。
3.13.1 實時 RT- PCR 反應的準備
( 1 ) PCR 用可視化的 96 孔板在 ABIPRISMA 7500 Sequence Detection System 儀器上進行 ( Applied Biosystems, Foster City, CA,USA ) 。
( 2 ) 總 RNA ( 2 μg 脫氧核糖核酸酶處理過的 RNA,來自 3.4 節)用反轉錄酶和緩沖液(Superscript EIRT, Invitrogen ) 按照說明手冊反轉錄。
(3
) PCR 反應用 25 μl 體系:100 ng cDNA,12.5 μl 2X 帶 SYBR 綠色熒光染料的 Platinum qPCR
Super Mix-UDG ( Invitrogen ) ,0.5 μl ROX 參照染料(Invitrogen )
,一對特異引物(每個引物 200 ng) ( 見注 33 ) 。
( 4 ) 所有 PCR 反應用了如下標準溫度控制:50℃ 2 min , 95°C 2 min , 40 個循環:95℃ 15s 和 60°C 1 min ( 見注 34)。
3.13.2 實時 PCR 數據提取和分析
( 1 ) 原始數據提取。收集每個樣品循環閾值(Ct ) [23]。為了比較不同的 cDNA 樣本的 Ct 值,所有比較基因的 Ct 值都根據看家基因 actin 進行標準化 (見注釋 35) 。
( 2 ) 數據分析。使用 Pfaffl 推薦的方程式計算選擇基因的相對表達量 [24] 。這些算法包括校正基因擴展效率。不同目標基因和參照基因的 PCR 擴增效率估計使用 Ramakers 等 [ 25 ] 推薦的方程式。
3.14 遞交芯片數據到公共數據庫:ArrayExpress
芯片的數據應存放在公共數據庫:ArrayExpress
[ 26 ] 是在歐洲生物信息研究所( EBI) 的高通量功能基因數據的公共數據庫 。這個數據庫由兩部分組成:ArrayExpress
庫(MIAME,主要是初級歸檔)和 ArrayExpress 數據 庫(它是不斷注釋的選擇基因表達譜數據庫)。ArrayExpress 是
MGED (
基因芯片表達數據協會)推薦的三個公共芯片數據庫之一。它以保密的形式存儲文章使用的數據,允許獲得授權的用戶,如期刊編輯和審稿入登錄數據,文章發表后與其相關的數據可以在指定日期公開。一般情況下,芯片數據提交包括
4 個主要步驟:① 創建一個提交用的新賬戶(MX 賬戶);②
提交程序(芯片制備方案、樣品的生長和提取步驟、樣品標記、雜交,掃描、分析步驟等);③ 提交芯片設計( 名稱、設計、技術等) ; ④ 提交實驗 (
實驗設計、發表的論文、樣品、提取物等)。有關的詳細信息請參閱網頁: http ://www . ebi. ac. uk/
miamexpress/ Help。
3.15 統計模型
剩余最大似然法(REML 法) [ 27 ] 在
GenStat 第 7 版 ( 2003年)統計系統中應用 ,適合于混合模型( 包括隨機和固定效應),以從任何特定比較( 如 14dpa 的
B102-1-1與 L88-31 ) 中,每個基因多達 6
個觀察值,建立一套完整的數據集。根據模型偏差估算實驗設計中由生物學重復和技術重復所組成的方差,不同的模型之間進行測試時,隨自由度變化的其方差變化服從
x2 分布。使用 Wald 檢驗 [ 28 ] 評估模型中的固定效應,測試統計量也服從 x2 分布。因此,建模考慮了設計上的變異效應( 隨機效應)和固定效應 ( 9246 個基因)。經過隨機和固定參數(term) 的顯著性評估,在 14dpa 的 B 102-1-1 和 L 88-31 比較模型是:
在臨床和研究環境中,血液都是對人類進行分子分析的主要來源,并且是許多治療策略的目標,這突顯了需要對構成人類血液的細胞進行全面的分子圖譜構建。人類蛋白質圖譜計劃(www.proteinatlas.org......
單細胞轉錄組測序(Single-cellRNA-seq)是在單細胞水平對轉錄組(mRNA)進行測序的一項新技術,可發現細胞群體中真正起作用的細胞,特別適合對高度異質性的干細胞、腫瘤細胞及胚胎發育早期的......
運用系統性、整體性的研究手段,全面背景下描述癌癥的機理可以為研究人員獲得更多有用的數據。1月4日Naturecommunication上的兩篇研究文章分別運用蛋白組學和造血細胞轉錄組學對乳腺癌臨床樣本......
整合來自不同類型組學實驗的數據,即研究系統生物學,是現代分子生物學中最令人興奮的前沿科學之一。安捷倫致力于與研究團體建立合作伙伴關系,以克服這一新興學科的研究者所面對的關鍵且根本的技術挑戰。我們秉承合......