實驗概要
類CPP基因家族(CPP-like gene family)屬于一類成員數目較少的基因家族,該基因家族成員編碼的蛋白質序列含有一到兩個富含半耽氨酸的結構域,即CXC結構域。該基因家族在植物和動物中廣泛存在,但是沒有在酵母中發現。為了解CPP-like基因家族在植物中的進化規律,本研究對擬南芥和水稻基因組中的CPP-like基因家族進行了比較分析和分子進化研究。
實驗步驟
1. 序列搜索
在NCBI數據庫中獲得擬南芥的TSO1和大豆的CPP1基因編碼的蛋白質序列,并以這兩段蛋白質序列為檢索序列,通過BLASTP檢索TIGR擬南芥基因組注釋數據庫(http://www.tigr.org/tdb/e2k1/athl/)和TIGR水稻基因組注釋數據庫(http://rice.tigr.org/tdb/e2k1/osal/index.shtml)。若檢索出的蛋白質序列滿足E≤10-l0,將被作為候選蛋白序列。然后利用Pfam工具檢測候選序列中是否存在CXC結構域,若存在CXC結構域,則將其作為CPP-like基因編碼的蛋白質序列。最后在利用新檢索出的擬南芥和水稻的CPP-like蛋白質序列重新對上述數據庫進行重新檢索,直到沒有新的序列檢出為止。本研究中涉及的CPP-like基因的核昔酸序列,編碼序列和編碼的蛋白質序列均來自于TIGR數據庫。此外本研究還利用TBLASTN和BLASTP分別檢索了NCBI和Swiss-Prot數據庫,以獲得其他植物物種中已知的CPP-like基因。
2. 多序列聯配和系統發生樹的構建
對植物基因組中CPP-like蛋白質序列的多序列聯配采用的是CLUSTAL W軟件,參數為默認。將多序列的結果輸出到MEGA 4軟件中,并利用MEGA構建系統發生樹,方法為鄰接法(Neighbor-Joining,NJ),參數為P距離模型(p-distancemodel)和空位/缺失數據的成對刪除模式(pairwise deletion of gaps/missing data),并利用bootstrapping方法對樹進行評估。系統發生樹的展示同樣利用MEGA 4。
3. 基因擴張模式的分析
植物基因組中最重要的兩種基因擴張模式為串聯重復和片段復制。串聯重復指的是同一家族的基因出現在染色體的同一區段或相鄰區段。而片段重復則通常表現為一大片段區域中所有基因的重復,而不是單個基因或少量幾個基因的重復。本研究中利用Gramme對基因組注釋的結果將獲得的CPP-like基因定位在染色體上。首先確定若在同一區段出現的CPP-like基因則被認為是通過串聯重復形成的。對片段重復方式的研究,首先通過TIGR對擬南芥和水稻基因組的注釋,找到每一CPP-like基因上游和下游各10編碼基因的蛋白質序列,然后利用本地BLASTP軟件分析是否在一對CPP-like基因的兩側還存在其它的旁系同源基因對,若存在其它的旁系同源基因對,則表明這對CPP-like基因起源于一次片段重復事件。
4. 正選擇作用分析
核苷酸的非同義替換率(dN)和同義替換率(dS)的比值(dN/dS)是衡量選擇壓力的分子進化參數,通常用ω表示。ω>1表示正選擇壓力(positive selection);ω<1表示純化選擇壓力(purifying selection);而ω=1表示中性選擇或自然選擇壓力(neutral selection)。正選擇作用的分析采用的是極大似然方法來確定具有正選擇作用的系統發生樹節點以及這些節點包含基因的多序列聯配中經歷正選擇作用的氨基酸位點。由于這些方法的適用條件是至少包含三段同源序列,所以本研究分析了系統發生樹中包含三個以上基因的節點。首先對每一待分析的節點中包含的蛋白質序列進行了多序列聯配,然后利用PAL2NAL軟件將蛋白質的多序列聯配結果轉換為編碼序列的多序列聯配,并去除多序列聯配中產生的空位(gap)。將編碼序列的多序列聯配結果再導入到PAML4軟件的CODEML程序中,并利用該程序計算相應的dN/dS(ω),即非同義替換率與同義替換率的比值。根據系統樹和序列對位排列結果,采用“位點特異性”模型(site-specific model)下的各種密碼子替換模型來計算每個位點上的ω。似然比測驗(LRT)可以用于比較嵌套間差異的顯著性,前提是似然比的比較結果基本遵循卡方分布,其自由度為兩個模型間自由參數之差。在本研究中采用M3(離散模型)對M0(單個ω)模型檢驗位點間是否存在選擇壓力的差異;并用M8對M7模型檢驗正選擇壓力。M7和M8模型均采用離散刀分布來估計每個位點的ω值,并通過參數p和q來描述刀分布,M8和M7的不同之處在于M8添加了一類ω>1的位點,可用于檢驗正選擇。若M8對M7的統計檢驗達到顯著水平,并且M8模型具有ω>1,再通過貝葉斯方法估計經歷正選擇作用的位點。
5. 結構域的協同進化分析
大部分植物的CPP-like基因編碼的蛋白質序列中包含兩個CXC結構域,而且結構域序列及兩段結構域之間的序列均是高度保守的,因此本研究認為兩段CXC結構域在進化過程中很可能是協同進化的。本研究對CXC結構域的協同進化現象進行了研究。分析中,包含兩段CXC結構域序列的蛋白質被分成5個部分,分別為N-末端序列、CXC結構域1、結構域之間的序列、CXC結構域2和C-末端序列。由于N-末端序列和C-末端序列的保守性較差,所以在本研究中重點考慮了CXC結構域1、結構域之間序列和CXC結構域2之間的協同進化現象。首先分別將這三段序列進行多序列聯配,并利用MEGA 4來計算兩兩之間的進化距離。獲得進化距離之后,再求取三段序列進化距離之間的相關系數(r)。顯著高于0的相關系數被認為是正向的協同進化,顯著小于0的相關系數被認為是負向的協同進化,而若與0表現出沒有顯著差異,則認為不存在協同進化現象。
對計算所得的相關系數采用兩種方法進行了統計顯著性檢驗,首先對相關系數:按照bootstrapping的方法進行了1000次重抽樣,其次通過隨機的方式對進化距離矩陣進行了1000次重抽樣,并進而獲得1000個隨機的相關系數,以此來估計真實相關系數的概率(p)。以上的模擬工作是在Matlab軟件中完成的。
衰老對身體產生的可見影響有時與基因活動的無形變化有關。DNA甲基化的表觀遺傳過程會隨著年齡增長而變得不再精確,造成基因表達的變化。而這種變化與隨著年齡增長而出現的器官功能衰退和疾病易感性增加有關。如今......
有些人比同齡人更顯年輕,而有些人看著更顯老;有些人年逾九旬仍身心康健,而另一些人早在數十年前就飽受糖尿病、阿爾茨海默病或行動障礙的困擾;有些人能輕松應對嚴重摔傷或流感侵襲,而有些人一旦住院就再難康復。......
近日,西北農林科技大學玉米生物學與遺傳育種團隊聯合華中農業大學玉米團隊在《植物生理學研究》發表論文。研究初步揭示了ZmGBF1-ZmATG8c模塊通過自噬途徑調控玉米耐熱性的分子機制。隨著全球氣溫持續......
記者21日從國家乳業技術創新中心獲悉,該中心技術研發團隊成功研制出奶牛種用胚胎基因組遺傳評估芯片和“高產、抗病、長生產期”功能強化基因組預測芯片。該系列基因芯片具有完全自主知識產權,填補了我國基因芯片......
國際期刊《內分泌學前沿》日前刊登的一項新研究揭示,一種特殊基因對腸道吸收維生素D及其后續代謝過程至關重要,阻斷或抑制該基因能夠選擇性抑制癌細胞生長。這一發現在癌癥治療等精準醫學領域具有廣闊應用前景。維......
記者從安徽農業大學獲悉,該校王曉波教授團隊聯合中國農業科學院作物科學研究所邱麗娟、李英慧研究員團隊,解析了關鍵基因對大豆種子油脂和蛋白比例(油蛋比)的調控機制,為高油或高蛋白大豆品種選育提供了新方向。......
茶樹是以收獲新梢為主的葉用經濟作物,茶芽大小不僅直接影響鮮葉的產量和品質,還與茶類適制性密切相關。解析茶樹芽大小的遺傳調控機制,有助于改良茶樹品種、提高茶葉產量。近日,中國農業科學院茶葉研究所種質資源......
玉米作為全球重要的糧食、飼料和工業原料作物,其高產對保障糧食安全至關重要。近日,東北農業大玉米遺傳育種團隊完成的研究在《農業科學學報(英文)》(JournalofIntegrativeAgricult......
水稻作為起源于熱帶或亞熱帶的糧食作物,其生長發育對低溫脅迫敏感。伴隨全球氣候變化加劇,極端低溫事件發生頻率顯著上升,發掘耐冷基因并解析分子機制,有利于水稻高產穩產遺傳改良。目前,利用自然群體挖掘的水稻......
東南亞人群基因組計劃概念圖。受訪者供圖東南亞是全球最重要的人類演化區域之一。該地區人群擁有極高的遺傳多樣性,但基因組學研究卻長期缺失,制約了人類環境適應性進化與疾病遺傳機制的深度解析,因而被稱為全球人......