當下,在部分學習生物專業的學生面臨工作難找、科研難做的多重窘境之際,基因產業和個體化用藥卻在以前所未有的速度蓬勃發展,遺傳咨詢師行業亦初露頭角。傳統學習生物專業的學生,可謂是趕上了“最好的時代”,倘若你知道如何解開維系健康的生命密碼信息,你將變得無可替代。那么問題來了,如何自學生物信息學?本文是一個非生物信息學自學成才的葵花寶典。
先說一下自己吧,我碩士讀的是細胞生物學,今年4月開始在boss要求下自學perl,打聽了下,這本書不錯,就買來開始看,等5月份去北京參加公司的培訓班時,讀了一遍,看了一部分。培訓回來,我們的項目就開始做了,9月拿到所有原始數據和分析結果。然后,我對照著公司的分析報告,試著自己走一邊分析流程,中間遇到問題,自己解決不了的,就發郵件求助。有幾點需要注意:
1. 我能理解你想早些玩兒數據的愿望,但是在這之前,最好要有一個outline.需要知道數據從哪兒來的,怎么產生的?其實就是測序儀的工作原理。然后是數據質量檢驗,為什么需要數據過濾?接著是reads拼接和組裝。總之,要對整個流程有一個認識,而后在學習的過程中,再不斷回頭對比這個流程,這樣才不會有迷失的感覺。[這本書](Bioinformatics for High Throughput Sequencing)推薦看一下。
2. 有了基礎知識的鋪墊,就可以嘗試著自己做些練習了,paper上面都會給出他們的數據、原碼地址,可以找來自己試試,先看看自己能不能做出一樣的效果。當然,這時要是你手里正好有項目,那就更好了。
3. 學生物信息,paper肯定是要跟蹤的。這兩個網站可以經常看一下:
[homologous](Homologus -Frontier in Bioinformatics) 覆蓋生物信息有趣的論文, 算法,以及生物科學問題。這個網站還匯集了很多生物信息領域科學家的博客。再如BGI的主程羅瑞邦, SAMtools、BWA的作者Heng Li都有在這里出現。
[RNA-Seq Blog](RNA-Seq Blog) 推薦新的論文、工作、培訓課程、大型會議等。
如果你是生物背景的,那么計算機方面的知識需要補一下:
-需要能在linux環境下舒服的工作。比如從源碼編譯安裝軟件、PATH配置,再比如舒服地使用google找到問題的答案 :-)
-學會使用python/perl。比如有的時候運行一個軟件老是報錯,可能就是因為在一個包含幾十萬行的文本文件里,有隨機的那么幾千行的末個位置,多一個冒號,[就像這里](using HTSeq | popucui), 這時候你知道需要怎么做了?
-學會R。要從一大堆基因里面找出表達水平變化的基因來,需要統計分析和顯著檢驗;而要把我們的數據更直觀地展示出來,最好的方式就是圖形了吧。這兩個需要,R都能滿足。當然matlab也是可以的,區別在于R是開源工具。
-具備了上述技能,那么常用的軟件就能用起來了。隨著學習的深入,可能你的問題別人也沒遇到過,這時候就需要自己動手,要么修改現成的工具,要么自己做一個出來。這時候,除了python/perl,或許還可以學學C/C++/java,或許需要研究下比如BWT、De Bruijn Graph背后的原理。
在一個繁忙的火車站,監控攝像頭正全方位追蹤站臺的情況,乘客流量、軌道占用、衛生狀況……所有信息實時傳輸給中央人工智能(AI)系統。這個系統的任務是幫助調度列車,讓它們安全準點進站。然而,一旦有人惡意干......
為推動地方數據集團創新發展,服務全國一體化數據市場培育建設,7月23日,國家數據局組織召開座談會。國家數據局黨組書記、局長劉烈宏出席會議并講話,局黨組成員、副局長沈竹林、夏冰、余英出席會議。局黨組成員......
隨著人工智能(AI)、自動化等技術的持續突破,利用傳感器進行數據采集與高速傳輸,并通過物聯網存儲海量數據,正持續推進智能化養殖業發展,逐漸成為推動豬育種向精準化、高效化、智能化轉型的核心驅動力。從整個......
國家知識產權局辦公室關于印發《知識產權數據使用手冊及開放目錄》的通知國知辦函服字〔2025〕153號各省、自治區、直轄市和新疆生產建設兵團知識產權局,各地方有關中心:為促進知識產權數據開發利用,提高知......
2月23日,記者從海南醫科大學獲悉,該校熱帶醫學院楊國靜教授團隊近日在國際醫學期刊《英國醫學雜志》在線發表論文《中國被忽視熱帶病負擔估計的差異:真實世界數據與GBD2021的比較研究(2004—202......
人工智能(AI)初創公司xAI創始人埃隆·馬斯克近日表示:“在AI訓練中,我們現在基本上耗盡了人類知識的累積總和。”之前研究也表明,人類生成的真實數據將在2到8年內消耗殆盡。鑒于真實數據日益稀缺,為滿......
12月28日,由人民數據開發的“數融平臺”正式上線試運營。平臺整體依托區塊鏈、人工智能和企業經營相關數據要素,實現鏈上信息全透明、全上鏈,實現數據資產情況全穿透,實時追蹤一手風控數據,對潛......
隨著新一輪科技革命和產業變革深入發展,數據作為關鍵生產要素的價值日益凸顯。五部門:制定數據產業發展促進政策近日,國家數據局聯合中央網信辦、工業和信息化部、公安部、國務院國資委印發了《關于促進企業數據資......
2024年12月3日,自然科學基金委管理科學部、信息科學部在北京召開專項項目“數據市場制度設計與關鍵技術”評審會議。自然科學基金委黨組成員、副主任江松院士出席會議并講話。國家數據局政策與規劃司副司長欒......
2024年度國家自然科學基金指南引導類原創探索計劃項目“數據流通市場的基礎理論與治理方法”項目指南以數據要素為核心引擎推動數字經濟深化發展,有利于構建新發展格局、建設現代化經濟體系、構筑國家競爭新優勢......