摘要:綜述了RAPD技術的一些理論性問題,包括RAPD與其它分子標記技術相比的優點,影響結果重復性的因素,顯性標記產生的原因,條帶取舍的標準等。提出在實驗中解決這些問題的一些方法:嚴格控制反應條件,采用單倍體和單劑量標記,系統學研究中要結合其它方法進行分析,定位基因時要選用合適的群體等。
1 RAPD技術原理及特點
1.1原理RAPD(Random Amplified Polymorphic DNA),即隨機擴增多態性DNA技術,是由美國科學家Wiliams和Welsh于1990年分別研究提出的,又稱任意引物PCR。它的應用是基于這樣的一個推理:對于同一模板DNA,用同一引物擴增既可能得到相同的帶譜(模板基因組間可能具有同源性),也可能得到不同的帶譜。僅在某一特定模板中出現的條帶就可作為該模板的分子標記。事實上,不同基因組DNA總是一定差異的,所以用RAPD就可以進行分子標記研究。理論上講,在一定的擴增條件下,擴增的條帶數取決于基因組的復雜性。對特定的引物,復雜性越高的基因組所產生的擴增條帶數也越多。
90年代前期RAPD技術得到廣泛的應用,幾乎所有的作物都有這方面的研究報告。但隨著研究的深入,人們發現該技術存在一定的缺陷,并對此作了一些探索。本文僅就RAPD技術的原理和應用中存在的理論性問題及一些改進措施的研究作一綜述。
1.2 RPAD特點 與PCR相比,具有以下幾個特點:①RAPD使用的是隨機引物,不需要預先了解目的的基因和相應的序列。②操作簡便,實驗周期短,能在較短的時間篩選大量樣品。③引物具有普遍適就性,適用于自動化操作分析。
與RFLP相比,具有以下特點:①RAPD分析只需要少量模板,一次擴增僅需20-100ng,這對于DNA量很少的材料進行基因組分析有利。比如對花粉粒、原生質體、種子等的DNA分析是切實可行的。②RAPD標記具有更大的隨機性,亦有利于圖譜的構建。對于DNA含量大的和多倍體物種,RFLP探針會與多倍體的多個片段雜交,所得到的混合指紋會對其它等位基因的闡明帶來困難。而且由于DNA量較大,進行單拷貝的Southern雜交不很實際,至少需要很長的曝光時間,并且已知的探針數量有限。RAPD大大增加了可構建遺傳圖譜物種的數量。③無需借助于有傷害性的同位素,耗費的人力物力少。④靈敏度高。引物中的個別堿基的變化會引起擴增條帶和強度的劇烈變化,這是RFLP所無法比擬的。⑤RAPD標記可以覆蓋整個基因組,包括編碼和非編碼區,可以反映整個基因組的變化。⑥RAPD產物有大于50%的條帶擴增于單拷貝區,經過克隆和序列分析后,可作為RFLP和原位雜交的探針,在基因定位、克隆及輔助選擇育種中可以廣泛應用。
2 RAPD技術本身存在的問題及對策
RAPD技術是由多種成分參加的生化反應,反應中各種成分均為微量,盡管其反應靈敏度高,但是影響因素較多,會出現重復性差等一些問題。為了得到較穩定的結果,各種反應參數必須事先優化選擇,操作中每一步都必須小心謹慎,以防止出現差錯。
2.1 溫度 RAPD一般反應條件是:變性92-95℃,常用94℃,30-60s;延伸72℃,60-120s;退火35-37℃,30-60s。變性和延伸溫度一般沒有太大變化,而退火溫度影響較大。退火溫度低,引物和模板結合特異性較差,出現的條帶可能增多;退火溫度高,引物和模板結合特異性增加。有人提出,在尋找基因差異為目的的實驗中,退火采用33-34℃效果更好。在優化方案中,退火溫度可能要提高,以便降低背景,得到少而清晰的"帶"。溫度的梯度率也是十分重要的,特別是退火與延伸之間的梯度尤為重要。各種儀器的控溫、升降溫性能均有差別,一些儀器(如一些舊型號的儀器)在到達特定的溫度前就開始計時,一些PCR儀顯示的溫度與實際溫度會有差異。這些在設計程序和結果分析時有必要考慮,所以注明所用儀器的生產廠家、品牌、規格,就顯得很有必要,對于同一批實驗,注意控制在同樣的溫度條件下進行反應,結果才有可比性。
2.2反應物的影響 PCR擴增受多種成分的制約,產物僅在部分循環中呈指數式(2)增長,逐漸將達到一個平臺期,模板是關鍵制約因素之一,RAPD產物取決于此,實驗中非常精確的模板濃度是十分關鍵的一個步驟。濃度過低,分子碰撞機率低,偶然性大,擴增產物不穩定;濃度過高,會增加非專一性擴增產物。更重要的是,若循環數控制不好,引物過早消耗完,后面循環中,PCR擴增產物的3端會和原模板及每一次循環的擴增產物退火,造成不等長度的延伸。因此,如果原模板濃度過高,非專一性擴增產物就足以形成背景,這是高濃度模板造成彌散型產物的原因。相對而言,模板純度影響不大,即反應液中蛋白質、多糖、RNA等大分子物質影響不大。理想的模板和引物濃度能產生多態性豐富、強弱帶分明的RAPD圖譜。引物3端的重要性似乎更大。此外,Mg+2濃度也影響反應的參數包括產物的特異性和引物二聚體的形成,人們在各自的實驗中得出不同的結論,大約在1.5-4mmol/L范圍內。總之,各種反應物的濃度應事先進行篩選優化。
2.3污染問題 實驗中應設空白對照,因為引物、各種緩沖液和雙蒸水都會造成污染。而且Taq酶也可能出現污染,給分析帶來困難,所以必須設置對照以排除系統誤差。并且,酶也盡可能優化。
2.4擴增條帶的取舍 重復性問題 為了克服RAPD重復性差的問題,應設置重復實驗。作為DNA多態性標記位點的條帶是應該可重復的,重復性好是最重要的取舍指標,而帶的強弱不應該作為取舍的指標。有學者認為帶的強弱與其在基因組中的拷貝數有關。但據Thormann對十字花科植物分析,RAPD產物的強弱與該產物在基因組中的拷貝數無直接關系,而與引物及模板的同源性程度有關。分析一個位點時,要作全面分析,若某一個體的全部帶均弱,其模板可能有問題(濃度、分子量);若某一個體的大部分帶與其它個體強度一致,僅有一條或少數幾條帶弱,可能存在拷貝數差異。重復性不好的弱帶(無規律出現的帶)可能由非專一性擴增、產物間退火或其它人為因素造成,不能記錄。
異源雙鏈問題 Ayliffe研究亞麻銹病菌時發現F1代中出現的一條帶在親本中沒有出現,進一步研究發現這一條帶是由2個等位基因組成的異源雙鏈形成的,這2個等位基因除中間插入的38bp的序列外,其余序列相同。這種條帶可以在后代中遺傳,在該研究中這種條帶大約占0.16%。在蜜蜂的研究中也發現了相似的問題,這種條帶可以用單鏈核酸酶將其消除。也可以將電泳溫度提高到60℃以上,使異源雙鏈變性,以消除其影響。
非孟德爾遺傳的條帶 Heun等分析認為,在顯示多態性的非模糊條帶中有92.5%的表現為孟德爾顯性遺傳,其余的條帶不符合孟德爾遺傳,分析認為可能由不同的序列組成。一般實驗中大多采用符合孟德爾遺傳的條帶進行分析。在連鎖圖譜分析中,基因型錯誤可以部分消除,即在F1代或1:1混合物中沒有出現的條帶,在其父母本中應盡可能去掉。
同一條帶的同源性問題 Thormann將RAPD產物標記作探針,雜交結果表明,與探針片斷遷移率一致的帶有時并不同源,這種情況僅發生在種間。并比較了RFLP和RAPD標記在種內和種間得出的結果,發現RFLP和RAPD標記在種內水平的結果完全吻合,但在種以上等級的結果相差甚遠,這說明在電泳結果的同一個帶中,有可能存在序列不同但分子量相同的幾條帶,RAPD無法檢測。這種可能在種內較少發生,而這種間可能性較大,Castagna用RFLP和RAPD比較研究也得出了相同的結論。
2.5電泳分辨率問題 電泳時,基因組不同位置的擴增產物共同移動的可能性是有的,即不同分子量的擴增產物可能在電泳時沒有分開而形成一條帶,凝膠分離系統和基因組的親緣關系有可能提高這種概率。一般而言,聚丙烯酰胺和銀染的分辨效果比瓊脂糖和溴化乙銨要高,用較長(可達到20cm)或濃度更高(2%)的瓊脂糖凝膠有助于提高分辨率。當然,隨著分辨率和靈敏度的提高,更可能出現實驗誤差。所以有人評述:最保險而簡單的方法是用瓊脂糖電脈分離而且只注意那些無疑而重發性高的帶。但是,聚丙烯酰胺和銀染所揭示的高信息量的多態性無疑可加快分子標記的鑒定過程。
2.6顯性標記問題 RAPD標記來自于模板DNA的復制,經過30一40次循環,擴增條帶數量理論上可達2。原模板中擴增位點是純合還是雜合已無法判斷,因為純合位點的擴增條帶只相當于雜合位點的2倍,電泳時無法檢測到其差別。雜交中。如果親本一方為純合體,F1代就可以全部表現出該條帶;如為雜合體,該條帶在F1中應為l:l分離,即一半后代有該條帶,而另一半則沒有。當然來自于多拷貝區的條帶分析更為復雜。
3、應用中存在的問題及策略
3.1遺傳圖譜構建的問題 RAPD是一種顯性標記,符合孟德爾遺傳定律,不能區分雜合型和純合型,因此在遺傳分析及遺傳圖譜的構建等一些方面受到限制。目前,在實踐中,主要利用了以下2種方法。
①利用單倍體 利用胚乳進行RAPD分析,可以克服構建遺傳圖譜中這些困難。因為針葉樹的胚乳是單倍體,記錄了雜合的母本染色體組在減數分裂過程中的遺傳事件,不存在雜合型,進行RAPD遺傳分析時,與共顯性標記具有同樣的遺傳行為,是天然的優良作圖材料。現在已進行遺傳圖譜構建的有濕地松、歐洲赤松、火炬松、楊樹、日本柳杉和桉樹。但是由于缺乏細胞遺傳學的研究,暫時還不能確定連鎖群和染色體之間的對應關系。國內尹佟明等利用馬尾松的胚乳構建了分子圖譜。這種研究所采用的作圖材料不具備永久性質,作為解決方法之一是將所取的材料進行培養。轉化為永久性群體,利用半同胞群體進行數量性狀基因定位(Quantitative trait locus,QTL)研究。另一個方法是與集團分離法(Bulked segregant analysis ,BSA)相結合,通過與目標性狀連鎖的標記在單倍體群體中的分離,在圖譜上進行基因定位或找出與目標性狀相連鎖的其它標記。
②將RAPD條帶作為單劑量標記 單劑量標記(Single-dose RAPD markers)是從兩物種和其雜交產生F1代的分子標記中選擇的。選擇構建圖譜用的標記有2個原則:A、它們必須在一個親本中存在而在另一個親本中不存在;B、它們在后代中必須以l:1分離。這種方法相當于一個雜合體和一個隱性純合體的測交,稱為雙向假測交(Two-way pseudo-testcross)。在多倍體植物中,不論基因組是如何組成的(異源多倍體或同源多倍體),也不論材料的多倍性水平如何,單劑量的標記都相當于簡單的等位基因(同源多倍體)或相當于二倍體基因座上的雜合等位基因(異源多倍體)。因此根據這些單劑量標記的連鎖情況可以構建分子圖譜。RAPD條帶作為單劑量標記使那些基因組DNA含最大,世代周期長的喬木和多倍體植物的遺傳圖譜研究走出了幾乎停滯的狀態。Grattapagalia利用這種策略首先構建了巨桉和尾葉桉的分子連鎖圖譜。Conner利用這種策略構建了3個蘋果品種的分子圖譜。Mudge利用甘蔗及雜交后代的RAPD條帶作為單劑量標記進行連鎖分析構建了甜根子草的51個連鎖群,并分析了其染色體組的數目。雖然這些連鎖圖譜是個體特異性的,但可以為數量性狀定位提供框架結構,為標記輔助選擇育種奠定基礎。
3.2系統學研究中的問題 系統學是RAPD研究最為迅速的領域,許多作物都用RAPD作過親緣關系分析,大部分結果和形態分類結果相類似,僅有少數例外。但是近年來,有人對其結果的可靠性提出不同的看法,主要有以下幾點:
①由于引物的競爭性等,基因組的RAPD位點有時不能全部檢出,造成假象上的差異。根據這種情況,可以認為,RAPD可以應用于種間乃至近緣屬之間關系的研究,但有一定的局限性。因不同種度的擴增產物難以作同源性分析,只能作表征分析,從而只能從相似性或遺傳距離上去分析親緣關系。其結果可能與真實的系統關系相左。
②因RAPD在種間或屬間的變異水平很高,取樣代表性是一個較大的問題,即利用某一個體代表一個種或用一個種代表一個屬都可能造成結果的偏差。因而,最好能找到群體特異或種特異性的條帶。
③在表征分析中另一個值得注意的問題是一些RAPD產物的出現存在相關關系,即一個位點與另一個位點相連鎖。若將這個差異單獨計算,相當于對某一性狀極度加權。
④在系統發育學分析中,因為RAPD條帶具有顯性的遺傳特征,多態性信息量較低。如果其符合二歧分枝樹的假定,就可以對變化的性狀予以加權,并進行分析。但是許多植物的核基因組是有性的二倍體,而且它們的進化歷史是網狀分枝樹,不便于分析。通常認為葉綠體、線粒體和有些細菌及真菌的病原體符合二歧分枝樹的假定。但由于其基因組較小,沒有重組,它們的信息量只相當于核基因組中具有多個等位基因的一個同工酶座位,這樣估算的基因多樣性值的標準差理論上會比有多個核基因蛋白座位得出的大。其非編碼區在一些動物類群中的進化速度很快,因此做種上水平研究時將會影響結果的準確性,但種下水平影響較小。
⑤RAPD和農藝性狀的系統分析比較說明,二者相差不大,沒有出現相反的情況。而且RAPD比農藝性狀提供了更多的遺傳信息。
總之,用RAPD作系統分析應結合其它方法,結果才更有說服力。
3.3標記、定位目的基因 標記、定位目的基因是相對較為緩慢的一個領域,這是因為RAPD標記探測的是整個基因組的變化,包括編碼區和非編碼區,要和基因位點聯系起來有一定的困難。一般的變異群體性狀的變化涉及到基因組內較大的范圍(微效多基因),RAPD不可能全部檢出。而且RAPD檢出的多態性又不一定是性狀變異的標志(可能擴增于非編碼區)。另一困難是RAPD擴增的特異性片段有些為重復序列,轉化為RFLP探針有一定困難。據Grattapaglia用48個RAPD片段所作的雜交實驗表明,有53%來自于低拷貝區(<10),20.4%來自于10~100拷貝區,18.4%來自于100一1000拷貝區,8.2%來自于高度重復區(>1000)。這只有通過篩選出與單拷貝區連鎖的標記予以解決。如果RAPD標記和基因位點或性狀不能聯系起來,其實用價值就會大大降低。為此人們作了以下探索。
①利用易位系、回復突變系、等位基因系、近交重組系等特殊材料 從理論上講,除目的基因及鄰近區域外,其它部分完全一致。如果檢測出多態性,差異必定在目的基因及鄰近區中,也就是說RAPD標記在這個范圍內與目的基因連鎖。但是要獲得這些材料比較困難,例如等位基因系需要回交20代,時間太長。RAPD分析中一般用近等位基因系NILs(Near isogenic lines),回交6代以上即可。回交6代時,供體DNA的比例為l/128,用RAPD找到的與目的基因連鎖的標記與目的基因在距離上還相當遠。
②集團分離法(BSA)對不存在上述特殊生物模型的群體,可采用這種方法。即利用F2分離群體為材料,根據目的基因的表型把F2群體分為2群(例如抗病的和不抗的),每一群中將各個體DNA等量混合,這樣形成2個DNA混合池。在每個基因池中,不管群體性狀如何,在目的基因的表型上都是一致的,2個群體之間,目的基因的表型都是相反的。因此,在2個群體之間完全不同、在每個群體之內各個體間又是完全相同的RAPD擴增產物即可認為是與目的基因連鎖的RAPD標記。這種方法相當于把分析材料作為近等位基因系。
在找到合適的分子標記后,既可直接用于輔助選擇育種(Molecule-marker assisted selection,MAS),也可通過對特異片段的分離和兩端測序將之轉換為序列標志位點(Sequence-tagged sites,STS)。從這個分子標記出發找到目的基因需經過幾個步驟:A、用稀有切點內切酶將基因組DNA切成大片斷DNA;B、用脈沖電泳分離大片斷DNA;C、將大片斷DNA克隆到YAC(Yeast artificial chromosome)中,建立YAC文庫;D、以顯示多態性的擴增產物為探針從YAC文庫中調出含有該RAPD標記和與其連鎖的目的基因的大片斷DNA;E、以該RAPD標記為起點向目的基因進行染色體滑步或跳躍,以找到目的基因。Michelmore首先利用這種方法找到了萵苣抗性基因的標記,Koller等利用這種方法找到與蘋果瘡痂病抗性基因有關的分子標記。
③利用一套缺體一四體系或雙端體系,以獲得與目的基因連鎖的標記引物進行擴增反應,然后進行原位雜交,確定特異性帶在染色體上的位置。
這些工作在一些基礎研究較多的領域或與人類關系較為密切的物種中進展較為迅速,比如小麥、水稻找到的RAPD分子標記已有許多。但林木等多年生植物研究進展稍遲滯,關鍵是缺乏合適的群體。
3.4純度和外源基因檢驗問題 雖然由于RAPD條帶的靈敏和重復性等問題,純度檢驗研究還只停留在實驗階段。但已有的對大麥、玉米、大豆、棉花、小麥、水稻的實驗表明,RAPD技術是鑒定品種的有效方法。相信其在純度檢驗和ZL保護方面會取得較為廣泛的應用。
4、小結
每一種技術和方法都有其優勢和缺陷,只有仔細研究,在實際運用中注意取長補短,就會發揮出其最大的作用,RAPD技術也是如此。對此進行的一系列研究會使RAPD技術日益成熟和完善,并在人類認識自然生命現象中發揮更大的作用。