自1998年美國塞萊拉遺傳公司組建以來,人類基因組研究開始由兩部分科學家同時展開,分別是由公共經費支持的人類基因組工程和美國塞萊拉遺傳公司。在研究過程中,他們也分別采用了兩種不同的測序和分析的方法。塞萊拉公司的核心分析方法被稱為"霰彈法",人類基因組工程則采用了"克隆法"。
所謂"霰彈法",其實是一種高度計算機化的方法,它先把基因組隨機分成已知長度(2000個堿基對、1萬個堿基對、5萬個堿基對)的片段,然后用數學算法將這些片段組裝成毗鄰的大段并確定它們在基因組上的正確位置。
塞萊拉公司的科學家先用霰彈法測序DNA,并將整個基因組覆蓋8次,然后用兩個數學公式將人類基因組序列多次組裝起來,確定出基因中的轉錄單元,預測出60%的已識別基因的分子功能。最后研究人員將人類基因組信息與此前已完成的果蠅和線蟲的基因組序列進行比較,從而找出了三者共有的核心功能。
而人類基因組工程采用的"克隆法"則通過先復制更大段的人類基因序列,然后將它們繪制到基因組的適當區域進行研究。這種方法需要研究人員在早期把較多的時間和精力放到克隆和繪制草圖上。
兩個研究組將所得數據進行對比,經人類基因組工程的科學家、《科學》和《自然》雜志高級指導編輯評估,表明塞萊拉公司的基因組分析與人類基因組工程的分析結果雖然存在一些差異,但大部分地方都有極高的吻合度。
塞萊拉公司測定的序列覆蓋了95%以上的人類基因組,其中約85%的人類基因組存在于按照正確順序排列、至少包含50萬個堿基對的片段中。這一序列為人類至少擁有2.6383萬個控制合成蛋白質的基因提供了有力的證據,也為另外1.2731萬個假設基因的存在提供了較弱的證據