<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2020-09-14 11:18 原文鏈接: 核酸和蛋白質序列分析2

    (2)輸出:除了以文本形式外,還可以通過JalView顯示和編輯結果。此外,還可以另外使用GeneDoc(常見于文獻)及DNAStar軟件等顯示結果。多序列比對的結果還用于進一步繪制進化樹。

    3、ORF(Open Reading Frame)分析

    從核酸序列翻譯得到蛋白質序列,需要進行ORF分析,每個生物信息學分析軟件包幾乎都帶有翻譯功能。推薦使用NCBI的ORF Finder(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)軟件或EMBOSS中的 getorf(http://bioinfo.pbi.nrc.ca:8090/EMBOSS/)軟件。ORF Finder 以圖形方式,分為正鏈+1、+2、+3和反鏈+1、+2、+3六個相位預測ORF;Getorf可指定預測ORF的長度下限和指定預測正反鏈。進行ORF 分析雖然比較簡單,但應注意以下幾點:

    (1)序列的準確性:尤其是通過計算機拼接的序列,需要根據EST和基因組序列進行反復校正。

    (2)ORF是否完整:看在ORF上游同一相位是否具有終止碼,或者具有起始密碼子。

    (3)參考Kozak一致性規律,即起始密碼子位點符合A/GCCATGG。

    (4)不要忽略反義讀框。

    4、染色體定位

    根據基因組圖譜對序列進行染色體定位和瀏覽其基因組上下游基因。具體方法為:(1)進行Genomic BLAST搜索。(2)通過“Genome view”觀察基因組結構。(3)點擊相應染色體區域,通過表意圖(ideogram)和相應區域上下游的基因進行精確定位。

    5、基因結構分析

    根據基因的mRNA序列及基因組序列,可以進行基因結構的分析。推薦使用BLAST或BLAT(http://genome.ucsc.edu/cgi-bin/hgBlat?command=start) 進行分析。由于真核生物轉錄后內含子將被剪切,因此將mRNA和基因組進行比對以后,會發現mRNA的每個外顯子與基因組序列片斷匹配,根據這些片段可以判斷外顯子的數目和大小。外顯子和內含子具體邊界的確定,可以參考GT/AG一致性規則。BLAT的結果直接顯示外顯子數目、大小及邊界。

    6、基因上游調控區分析

    (1)啟動子預測:推薦使用冷泉港開發的FIRSTEF程序(http://rulai.cshl.org/tools/FirstEF/)進行啟動子預測。用RT-PCR等實驗方法獲得的mRNA往往缺少完整的 5’端,采用FirstEF 程序可以對第一外顯子(尤其是非編碼的第一外顯子)和CpG相關啟動子進行預測。

    方法:以FastA格式輸入起始密碼子上游序列。

    (2)轉錄因子結合位點分析:推薦使用TFSEARCH程序(http://www.cbrc.jp/research/db/TFSEARCH.html)及MATCH程序

    http://www.gene-regulation.com/pub /programs.html#match)對轉錄因子數據庫TRANSFAC(http://transfac.gbf.de/TRANSFAC/)進行搜索,尋找可能的轉錄因子結合位點。

    方法:輸入起始密碼子上游序列。結果將給出很多可能的轉錄因子結合位點,注意選擇其中分值較高的位點。

    (二) 蛋白質序列分析

    1、跨膜區預測

    各個物種的膜蛋白的比例差別不大,約四分之一的人類已知蛋白為膜蛋白。由于膜蛋白不溶于水,分離純化困難,不容易生長晶體,很難確定其結構。因此,對膜蛋白的跨膜螺旋進行預測是生物信息學的重要應用。

    推薦使用TMHMM軟件(http://www.cbs.dtu.dk/services/TMHMM/)對蛋白進行跨膜預測。TMHMM綜合了跨膜區疏水性、電荷偏倚、螺旋長度和膜蛋白拓撲學限制等性質,采用隱馬氏模型(Hidden Markov Models),對跨膜區及膜內外區進行整體的預測。TMHMM是目前最好的進行跨膜區預測的軟件,它尤其長于區分可溶性蛋白和膜蛋白,因此首選它來判定一個蛋白是否為膜蛋白。所有跨膜區預測軟件的準確性都不超過52%,但86%的跨膜區可以通過不同的軟件進行正確預測。因此,綜合分析不同的軟件預測結果和疏水性圖以獲得更好的預測結果。

    方法:輸入待分析的蛋白序列即可。

    2、信號肽預測

    信號肽位于分泌蛋白的N端,當蛋白跨膜轉移位置時被切掉。信號肽的特征是包括一個正電荷區域、一個疏水性區域和不帶電荷但具有極性的區域。信號肽切割位點的-3和-1位為小而中性氨基酸。

    推薦使用SignalP軟件2.0版(http://www.cbs.dtu.dk /services/SignalP-2.0/)對PDCD5N端序列進行信號肽分析。SignalP2.0根據信號肽序列特征,采用神經網絡方法或隱馬氏模型方法,根據物種的不同,分別選擇用真核和原核序列進行訓練,對信號肽位置及切割位點進行預測。信號肽切割位點預測用Y-score maximum來判斷,對是否分泌蛋白用mean S-score來判斷:如果mean S-score大于0.5,則預測為分泌蛋白,存在信號肽,但II型跨膜蛋白的N端序列可能被錯誤預測為分泌蛋白的信號肽。

    方法:輸入待分析的蛋白序列,如為原核基因選擇原核訓練集,否則選擇真核訓練集。

    3、亞細胞定位預測

    亞細胞定位與蛋白質的功能存在著非常重要的聯系。亞細胞定位預測基于如下原理:(1)不同的細胞器往往具有不同的理化環境,它根據蛋白質的結構及表面理化特征,選擇性容納蛋白。(2)蛋白質表面直接暴露于細胞器環境中,它由序列折疊過程決定,而后者取決于氨基酸組成。因此可以通過氨基酸組成進行亞細胞定位的預測。

    推薦使用PSORT(http://psort.nibb.ac.jp/)II 軟件對PDCD5蛋白的細胞內定位進行預測。PSORT將動物蛋白質定位于10個細胞器:(1)細胞漿,(2)細胞骨架,(3)內質網,(4)胞外,(5)高爾基體,(6)溶酶體,(7)線粒體,(8)胞核,(9)過氧化物酶體(peroxisome)和(10)細胞膜。

    相關文章

    清華大學團隊提出蛋白質序列功能空間壓縮的概念

    蛋白質作為最重要的生命構建單元之一,其序列和功能之間的映射(適應性景觀,Fitnesslandscape)的針對性研究對于蛋白質理性設計以及工程應用都有極大的意義。目前人們只能對于蛋白質序列-功能關系......

    預測蛋白質序列的新AI模型問世

    瑞士洛桑聯邦理工學院開發了一種名為CARBonAra的新型人工智能(AI)驅動模型。該模型可以根據不同分子環境所施加限制的主鏈支架預測蛋白質序列,有望在蛋白質工程及包括醫學和生物技術在內的多個領域帶來......

    預測蛋白質序列的新AI模型問世

    瑞士洛桑聯邦理工學院開發了一種名為CARBonAra的新型人工智能(AI)驅動模型。該模型可以根據不同分子環境所施加限制的主鏈支架預測蛋白質序列,有望在蛋白質工程及包括醫學和生物技術在內的多個領域帶來......

    Science揭示“第三殺手”帕金森相關蛋白損傷大腦細節

    此前,對于帕金森的基礎性研究已經發現,α-synuclein(α-突觸核蛋白,αS)是一種與帕金森癥發生密切相關的蛋白質。當該蛋白在神經細胞內錯誤折疊會形成路易小體,積累過剩容易損傷神經細胞。這次,來......

    遺傳發育所在水稻聯會復合體結構研究中取得新進展

    減數分裂過程中,配對的同源染色體間要形成拉鏈狀的聯會復合體。雖然聯會復合體在結構上具有高度保守性,但其蛋白質序列的保守性卻很低。目前已鑒定的聯會復合體相關蛋白,在真菌、動物和植物之間幾乎沒有同源性。中......

    蛋白質序列中可能存在的Zipf定律

    摘要:本文介紹了蛋白質序列中可能存在的Zipf定律。......

    用非線性預測方法研究蛋白質序列的特性(Ⅱ)

    摘要:為了研究蛋白質序列的內在特性,通過非線性預測方法將蛋白質序列和隨機序列以及混沌序列進行比較。前期研究可知:每條蛋白質序列的每個特征序列的誤差比值(E2D)圖具有特異性,和隨機序列的E2D圖相比具......

    一種新穎的蛋白質序列可視化模型

    摘要:利用相似規則、互補規則和分子識別理論建立一種氨基酸數字編碼模型用于研究序列特征、功能預測。給出一種新的基于元胞自動機的蛋白質序列圖像生成方法,其優點是考慮了氨基酸前后的相互作用,生成的圖像與基因......

    蛋白質序列中的關聯規則發現及其應用

    摘要:隨著蛋白質序列-結構分析中使用的機器學習算法越來越復雜,其結果的解釋和發現過程也隨之復雜化,因此有必要尋找簡單且理論上可靠的方法。通過引入原理簡單、理論可靠、結果具有很強實際意義的關聯規則發現算......

    基于最大頻繁序列的蛋白質分類算法

    摘要針對現有基于頻繁模式的分類算法未考慮完全頻繁模式所產生的大量無效序列,提出了一種基于最大頻繁序列的蛋白質分類算法,此算法每一類都以獨有的最大頻繁式作為代表,執行模式裁減和測試數據分類實驗表明該算法......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频