<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2019-11-13 14:07 原文鏈接: 基因芯片數據的分析方法

    研究背景:

    基因芯片可以通過探針和熒光標記對某個時間點生物體的全部基因表達量進行檢測,探針代表的基因熒光強度通過儀器轉換成基本數據。這些數據的背后隱藏著很多的生物學意義,這就需要我們通過生物信息學的方法去分析和挖掘。不同實驗設計方案產生的海量芯片數據,其分析方法和思路都大同小異,這里分享一個多組實驗設計的乳腺癌侵襲性研究芯片數據分析方法。

    實驗設計:

    主要通過芯片數據篩選與乳腺癌侵襲性相關的基因和分子生物通路來研究乳腺癌侵襲性的分子機制。實驗分為正常對照組 2a,非侵襲性乳腺癌組 2b,侵襲性乳腺癌組 2c。正常對照組 2a 有 2a_1 和 2a_2 兩個樣本,非侵襲性乳腺癌組 2b 有 2b_1、2b_2、2b_3 三個樣本,侵襲性乳腺癌組 3c 有 3c_1、3c_2、3c_3 三個樣本,其中每個樣本都使用 Aglient 芯片進行檢測,儀器輸出的數據通過歸一化后進行接下來的數據分析。

    研究方法:

    1.芯片數據質控

    1.1 數據 PCA 分析

    使用 OmicsBean 組學數據分析系統(www.omicsbean.com:88)將基因芯片的原始矩陣數據和分組文件進行上傳,使用其 PCA 功能模塊進行分析得到各組表達量數據的分布圖。

    1.2 Clustering 分析

    使用 OmicsBean 的 Clustering 功能模塊對基因芯片的原始矩陣數據進行 Clusering 分析,得到各組數據的簇分析分布圖。

    1.3 HeatMap 分析

    使用 OmicsBean 的 HeatMap 功能模塊對基因芯片的原始數據進行 HeatMap 分析得到各組基因表達量數據的 HeatMap 分布圖,從圖中可以看到每個基因在不同分組中的表達量差異分布。針對分組和基因在熱圖的基礎上又進行了簇分析。

    2.差異基因篩選

    使用 OmicsBean 分析系統將基因芯片的原始矩陣數據和分組文件進行上傳,使用 T-test 方法和 FoldChange 進行差異數據的計算。FoldChange 設置參數為 2,T-test 設置參數 P-value 為 0.05,同時在分組矩陣中選擇進行差異比較的兩個組進行分析。系統會根據參數設置和進行比較的分組進行差異基因篩選,這樣會得到差異篩選的分布圖和差異基因的列表。接下來還可以針對多個差異列表再進行分析。這里選擇了非侵襲性乳腺癌與正常組比較,侵襲性乳腺癌與正常組比較,非侵襲性乳腺癌與侵襲性乳腺癌比較。圖中橫坐標為 Log2(FoldChange),縱坐標為-Log10(P-Value),圖中越靠近左下角和右下角的數據 P-value 值越小,FoldChange 值越大,差異越顯著。

    3.利用 Venn 分析構建模型

    使用 OmicsBean 分析系統將非侵襲性乳腺癌(相對于正常組)的差異表達基因與侵襲性乳腺癌(相對于正常組)的差異表達基因進行 Venn 分析,得到 Venn 分析結果圖,從圖中可以看出只在侵襲性乳腺癌中差異表達的基因有 722 個,只在非侵襲性乳腺癌中差異表達的基因 942 個,同時在侵襲性乳腺癌和非侵襲性乳腺癌中差異表達的基因共 281 個,而在這 281 個差異基因中有 34 個基因在侵襲性和非侵襲性兩個組中又存在差異表達,這 34 個基因是用來研究乳腺癌的侵襲性分子機制的關鍵基因,這些基因參與的生物通路和生物過程也將進一步闡明乳腺癌侵襲性分子機制。

    為了更深入的研究乳腺癌侵襲性分子機制使用 OmicsBean 分析系統將只在侵襲性乳腺癌中表達的 722 個差異基因與 34 個關鍵基因進行合并構建出了乳腺癌侵襲性分子模型。該模型共 756 個基因。

    4.功能富集分析

    使用 OmicsBean 分析系統將乳腺癌侵襲性分子模型中的 756 個基因進行功能富集分析,其中包括 GO 富集分析與 Pathway 富集分析,其中 GO 富集包括 Biological Process(生物過程),Cell Component(細胞組成),Molecular Function(分子功能)。 Pathway 富集分析主要指 KEGG 富集分析。

    4.1 GO 富集分析

    使用 OmicsBean 分析系統將乳腺癌侵襲性分子模型中的 756 個基因進行 GO 富集分析。 富集到的比較顯著的生物過程包括 multicellular organismal process,single-multicellular organism process,single-organism process,single-organism cellular process,developmental process,single-organism developmental process,anatomical structure development,system development,cell communication,multicellular organismal development 等, 這些生物過程都與細胞的生長相關,這些生物過程與侵襲性癌細胞向周圍組織擴張性生長的特性是一致的。其中生物過程 Positive regulation of cell adhesion,regulation of cell communication 更能說明侵襲性乳腺癌細胞通過分泌一些特殊物質或降解正常組織的防御屏障使得與周圍細胞粘附,破壞正常的組織。

    4.2 生物過程 HeatMap 分析

    使用 OmicsBean 分析系統將參與 cell communication 這個重要生物過程的差異基因進行 HeatMap 分析,可以看到在這個過程中不同基因的差異分布。從這個分布中可以快速的找到一些相對比較關鍵的基因。

    4.3Pathway 富集分析

    使用 OmicsBean 分析系統將乳腺癌侵襲性分子模型中的 1820 個基因進行 KEGG 富集分析。富集到的比較顯著的生物通路包括 Neuroactive ligand-receptor interaction,ABC transporters,Nitrogen metabolism,Type II diabetes mellitus,ErbB signaling pathway,Proximal tubule bicarbonate reclamation,Dorso-ventral axis formation,Arginine and proline metabolism,ECM-receptor interaction,Thyroid cancer 等。其中生物通路 Insulin secretion,Protein digestion and absorption,EMC-receptor interaction 與侵襲性癌細胞可以伸出偽足插入到周圍的組織間隙,或通過分泌特殊物質等方式入侵周圍的組織相一致

    4.4 生物通路 HeatMap 分析

    使用 OmicsBean 分析系統將參與 EMC-receptor interaction 這個重要生物通路的差異基因進行 HeatMap 分析,可以看到在這個通路中不同基因的差異分布。從這個分布中可以快速的找到一些相對比較關鍵的基因。

    5.網絡調控模型構建

    使用 OmicsBean 分析系統進行 PPI 模型構建,系統通過 String 數據庫建立基因相互作用關聯,在根據選擇的生物通路進行模型構建。在這里選擇 cell communication 和 EMC-receptor interaction 這兩個重要的生物通路構建網絡調控模型。

    研究結論:

    通過 PCA 分析,Cluster 分析,HeatMap 分析對芯片數據進行質量控制,了解不同組之間的數據分布和差異,然后使用 T-test 和 FoldChange 對矩陣數據進行了差異篩選,根據差異篩選的基因進行 Venn 分析構建了乳腺癌侵襲性模型,對模型中的基因進行功能富集找到了重要的生物通路 cell communication 和 EMC-receptor interaction,針對通路進行 PPI 網絡調控模型的構建找到了重要的基因 VWF,CD44,SPP1,ITGB6,SDC4,ITGB3。


    相關文章

    基因芯片的背景介紹

    高通量、全基因組的DNA芯片已經成為生物領域十分有用的工具。然而,芯片實驗產生的數據量日益增長,由于不同的分析方法,會得出不同結論,因而分析起著關鍵作用。基因芯片分析就是為了通過生物信息學方法從這些芯......

    個性化給藥!基因芯片了解一下

    臨床上同病同治不同療效的現象比比皆是,面對一些格外棘手的患者,以往醫生只能無奈地解釋為個體化差異。如今,以藥物基因組學理論和基因檢測為基礎的“個體化藥物治療”可以實現量體裁衣式的個體化給藥,它可以幫助......

    基因芯片原理

    基因芯片(genechip)的原型是80年代中期提出的。基因芯片的測序原理是雜交測序方法,即通過與一組已知序列的核酸探針雜交進行核酸序列測定的方法,可以基因芯片的測序原理用圖11-5-1來說明。在一塊......

    基因芯片簡介

    隨著人類基因組(測序)計劃(Humangenomeproject)的逐步實施以及分子生物學相關學科的迅猛發展,越來越多的動植物、微生物基因組序列得以測定,基因序列數據正在以前所未有的速度迅速增長。然而......

    基因芯片

    基因芯片(genechip)(又稱DNA芯片、生物芯片)的原型是80年代中期提出的。基因芯片的測序原理是雜交測序方法,即通過與一組已知序列的核酸探針雜交進行核酸序列測定的方法,在一塊基片表面固定了序列......

    2019年基因檢測將全面噴發

    2017年上半年,全球消費級基因檢測領域表現活躍,接連發生幾起大事件。7月底,美國創業公司Exploragen宣布推出基于用戶DNA的生活方式APP,即將在蘋果APPStore上發布,能為用戶提供生物......

    基因檢測“劇透”人生?

    得知自己的基因檢測結果后,吳峰(化名)如釋重負。過去,他一直活在父親抑郁癥遺傳基因的陰影下,甚至擔心自己的社交能力有問題。“擔心自己是生下來就被詛咒的人”。直到他向一個小試管里吐了2毫升唾液,20天后......

    程京院士:用心締造“中國芯”的領軍人

    成功研制專門用于SARS病毒檢測的基因芯片;研制出世界上第一張遺傳性耳聾基因檢測芯片,讓耳聾基因篩查列入民生工程,超百萬人因此受益……多年來,博奧生物集團創始人程京帶著他的研發團隊發出了五個系列數十項......

    溯源精微中選國家食安風險評估基因芯片檢測服務項目

    在國家食品安全風險評估中心基因芯片檢測microRNA技術服務項目比選評審中,經專家評審小組集體評議,北京溯源精微科技有限公司被確定為本項目中選單位。聯系人:任柏璇52165512;王珊5216552......

    中科院:空氣污染促使致肺癌關鍵因子CXCL13分泌激增

    近日,中國科學院動物研究所膜生物學國家重點實驗室發布科研文章:周光飚研究組發現炎癥因子CXCL13在環境污染引起肺癌中的關鍵作用。文章稱,世界衛生組織的數據顯示,在每年180萬新發肺癌病例及159萬肺......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频