截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。其中,在1月22日以前獲取的31份測序數據幾乎全部來自于中國(僅有1例來自于美國)。然而1月22日以后,余下的24份數據一律源于境外,包括日本、韓國、新加坡、澳大利亞、美國、法國、英國等。
國內學術界對于所謂“高影響因子期刊”發表文章的強烈需求,遠遠超乎國際的慣例。扣留數據其實也反映了國內論文發表的評價體系。
研究人員對“高分期刊”過度看重的不良風氣, 在這次疫情里已顯示不僅僅是學術圈內的問題了。扣留數據通常不會干擾社會的正常運行,但在當前的危急情形下, 影響會是嚴重而深遠的。
現在不要求你寫大文章,也不要求你的寫作符合高水平期刊的要求,請大家把數據及時共享到開放的平臺上!
兩周前,中山大學生命科學學院教授、臺灣“中研院”院士吳仲義和中科院腦科學與智能技術卓越創新中心學術主任、中科院院士蒲慕明在《國家科學評論》撰文,呼吁同行將新冠病毒的基因組數據盡快公開。
“數據背景的斷層,使我們很難在時間與地理上找到連續的規律。數據不規范公開的趨勢彰顯了學術界的矛盾。”
2月18日,兩人再次撰文指出,在當前的危急情形下,科學家扣留數據的影響會是嚴重而深遠的,并呼吁國內學者即時公布和共享新型冠狀病毒測序數據。
《中國科學報》:為什么關心新型冠狀病毒的基因測序數據?
吳仲義:目前,新型冠狀病毒可能已經達到頂峰,不會再進化;但也可能蓄勢待發,正要進入危險期。
在兩級分化的不確定下,只有公開數據,才能讓科學家知道下一步怎么走。
病毒感染人群后可能會發生快速演變,而自然選擇偏好高傳染力的突變。17年前SARS的爆發也體現出這樣的傳播規律:2002年11月至2003年1月底,SARS病毒的傳播速度較為緩慢,2003年2月起開始迅速加快,這種趨勢一直延續至疫情晚期。
傳播加速與病毒RNA序列的改變息息相關;尤其是病毒S蛋白在傳播前期快速積累了5個氨基酸突變。這說明SARS病毒從果子貍躍染到人之后,經歷了一系列的遺傳適應性改變。
目前我們已經看到,兩場流行病的特征有諸多不同,但這大多是臨床分析上的。如果能盡快獲得病毒基因組數據,就可以通過對比兩種病毒進化動態的差異,更準確地判斷疫情,也更精準地進行防控。
蒲慕明:作為作為科研人員,在很急切地尋找基礎數據、想研究這個病毒到底有沒有變異時,我們卻發現,很難找到較新的國內研究數據,
這很不正常。因為國內有更多的病毒材料,也掌握了更多的相關數據,能開展測序工作的科研人員也并不少。
《中國科學報》:國內哪些機構能獲得新型冠狀病毒基因組的最新序列數據?
蒲慕明:很多地方能做,要求就是第一能拿到病毒,第二具備有資質的病毒實驗室。理論上1月22日以前發表序列的這些機構都能做。
《中國科學報》:如此重要的測序數據,在公共平臺上卻難以查找,這是什么原因導致的?
吳仲義:數據是有的,為何不發我們不知道。
蒲慕明:我們國內沒有一個公開的地方可以去查這些數據,這的確很奇怪。我們只能推測有可能是科研人員希望用這些數據去寫論文,發表在高影響因子的期刊上。
《中國科學報》:如果真是這樣,那是違背學術道德和科研倫理的吧?
蒲慕明:鑒于當前疫情的嚴峻形勢,是這樣的。
因此我們建議采用“胡蘿卜加大棒”的方式促進數據的發表。
所謂“胡蘿卜”,就是建議期刊接收發表初步處理的組學數據。即便沒有新的數據產出,基于先期數據完善的分析結果也應該繼續接收。
所謂“大棒”,就是期刊應當對那些隱瞞公共衛生安全數據的論文嚴肅對待,拒絕發表這種基于不道德學術行為的研究。
應對數據發布,國內已經建立了一些開放數據庫(例如https://bigd.big.ac.cn/,https://db.cngb.org,或開放數據分析平臺(例如https://fight-sars2.genowis.com) 。
現在不要求你寫大文章,也不要求你的寫作符合高水平期刊的要求,請大家把數據及時共享到開放的平臺上!
以下為吳仲義和蒲慕明2月18日在《國家科學評論》發表的呼吁原文:
來源 | 中國科學雜志社
作者 | 吳仲義 蒲慕明
翻譯 | 呂雪梅 (中國科學院昆明動物研究所)
學術道義與社會職責——呼吁即時公布和共享2019-nCov測序數據
2020年伊始,由SARS-CoV-2 (原稱2019-nCov) 病毒引發的COVID-19 (2019冠狀病毒病) 席卷全國。兩周前,疫情日益嚴峻,我們曾在本欄目呼吁同行,將此病毒的基因組數據盡快公開[1]。
因為這些數據對全球公共衛生安全有重大意義,國際學術界也通過不同渠道緊急敦促數據共享[2]。然而事與愿違,需求越來越迫切,而國內數據的發布卻非常緩慢。
現在,我們再次呼吁加快新冠病毒的數據發布速度。基于專家初步分析病毒進化的結果,我們有更充分的理由重復前述倡議(請參閱致謝部分,本文對相關研究結果的引用皆得到許可)。
在疫情防控的關鍵時期, 及時發布病毒數據更該是我們的道義和責任。希望學術界能夠促進數據的傳播與共享,避免不必要的發布延誤。
病毒的進化
根據進化的基本原理,病毒感染人群后可能會發生快速演變——這是迅速公布數據的關鍵科學依據。自然選擇偏好高傳染力的突變,進而增強了毒株的進化優勢。而病毒傳染力增強,也有可能伴隨著毒力降低。
17年前,這樣的進化規律已經在SARS的爆發中得到過例證[3]。在2002年至2003年的流行周期中,SARS病毒早期的傳播速度較為緩慢(2002年11月24日~2003年1月30日),在流行中期迅速增快(2003年2月)。
這一趨勢延續了幾個月直至疫情晚期。傳播加速與病毒DNA序列的改變息息相關;尤其是病毒S蛋白在傳播前期快速積累了5個氨基酸突變。這說明SARS病毒從果子貍躍染到人之后,經歷了一系列的遺傳適應性改變。
本次COVID-19的防控可以借鑒SARS的經驗,但也可能有相當的不同。
因此,如果快速發布病毒基因組數據,我們通過對比2019-nCoV與SARS-CoV得以盡快了解它們進化動態的差異。目前臨床分析已經揭示了兩場流行病的特征有諸多不同,基因組的分析迫在眉睫。
2019-nCoV的緩慢進化可望稍慰人心
目前,病毒在人群中進化的初步分析(崔杰、陸劍,未發表的研究)僅能基于有限的公共數據(https://www.gisaid.org/)。
截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。
其中,在1月22日以前獲取的31份測序數據幾乎全部來自于中國(僅有1例來自于美國)。然而1月22日以后,余下的24份數據一律源于境外,包括日本、韓國、新加坡、澳大利亞、美國、法國、英國等。
數據背景的斷層,使我們很難在時間與地理上找到連續的規律。數據不規范公開的趨勢彰顯了學術界的矛盾。
目前的分析結果提示了幾個重要的科學問題。最關鍵的是,“2019-nCoV是否在人群中持續的進化?” 如果這一問題的答案是否定的,病毒沒有快速變異, 對于抵抗疫情是個定心丸。
從疫情剛開始至2020年2月早期,病毒的變化是相對緩慢的。出現在多例樣本中(>=2)的氨基酸突變只有8個。
更重要的是,這些突變的分布與 “沉默”突變(沒功能效應的突變)非常相似。這說明,2019-nCoV在傳播的過程中沒有發生劇烈的適應性變化,這與2002 年SARS病毒非常不同。
簡單的說,2019-nCoV可能在野生動物與人之間已經“磨牙”好些時候了,現已進入適應性進化的遲緩期了。我們希望這個推測是對的。如果得到證明,也許可以緩解公眾的不安。
隱現危機的可能性
雖然看起來病毒似乎進化遲緩,但是有一些信號不能掉以輕心。
首先, 大部分的氨基酸序列突變都出現在近期國外報道的數據中,隱示病毒也許正進化中。
其次,8個氨基酸序列突變是成簇出現的, 一個突變似乎促進另一個突變的發生。
第三,尤其需要警惕的是位于病毒ORF8基因中28144位點上的突變—— 在1月5日以前于武漢采集的13例樣本中只出現了1次(7.8%),但在1月10日之后于武漢之外采集的42例樣本中,出現了18次(43%)。
這樣的躍變看起來很驚人,但樣本數量不夠大,統計學上未必可靠。我們需要更多的數據來查清楚這個突變是否是個危險訊號。
另一個突變,在55例樣本中僅出現了五次:橙縣(CA2/2020,美國)、巴黎(IDF0373, 0373/2020,法國)、高雄(2/2020,中國)、克萊頓(VIC01/2020,澳大利亞),但全部是在大陸境外。這也是值得密切關注的。
最壞的可能性是, 經歷了兩個月的“慢進化”模式之后,2019-nCoV“摸索”出了進化的途徑,開始蠢蠢欲動。SARS病毒進化的第一階段也恰好是兩個月。
上面兩個推測,不確定性都很高。因為樣本數實在不夠大。只有完整并及時地發布數據, 才有可能塵埃落定。
數據(不)公開的文化根源
數據共享與否背后有科學文化的不良背景。新發布的數據主要來自于國外而不是疫情嚴重的國內。關于測序數據是否應該公開發布和自由獲取,在國內網絡上頗有爭論。根源在于如何保護研究貢獻、影響知識產權。
更具體來講,國內學術界對于所謂“高影響因子期刊”發表文章的強烈需求,遠遠超乎國際的慣例[4]。扣留數據其實也反映了國內論文發表的評價體系。一篇論文不管是在A期刊還是B期刊上發表,還是同一篇論文。
研究人員對“高分期刊”過度看重的不良風氣, 在這次疫情里已顯示不僅僅是學術圈內的問題了。扣留數據通常不會干擾社會的正常運行,但在當前的危急情形下, 影響會是嚴重而深遠的。
的確,第一批發布病毒序列的論文闡明病毒有人傳人的可能,但是沒及時告知社會。未來回顧這次疫情,這幾天的延遲可能是關鍵。
關于科研人員道義責任的幾點提議
鑒于當前疫情的嚴峻形勢,選擇不公開病毒相關的數據是有悖科研道德的。應對數據發布,國內已經建立了一些開放數據庫(例如https://bigd.big.ac.cn/,https://db.cngb.org,或開放數據分析平臺(例如https://fight-sars2.genowis.com) 。
學術期刊,包括《國家科學評論》(National Science Review),應該采用“胡蘿卜加大棒”的方式促進數據的發表。
一方面(胡蘿卜),我們建議期刊接收發表初步處理的組學數據[1]。更進一步, 基于先期提交的數據完善的分析結果(即便沒有新的數據產出),也應該隨后繼續接收。
另一方面(大棒),期刊應當對那些隱瞞公共衛生安全數據的論文嚴肅對待,拒絕發表這種不道德學術行為的研究。正如不符合動物實驗倫理的研究無可轉圜地拒稿, 隱瞞對公共衛生安全至關重要數據的行為,業內更應該秉持零容忍的態度。
致謝
數據分析由中國科學院上海巴斯德研究所崔杰研究員指導的課題組完成,并得到了北京大學陸劍教授課題組的補充;中國科學院昆明動物研究所呂雪梅研究員課題組對本文提供了寶貴的意見;志諾維思(北京)基因科技有限公司凌少平博士提供了組學數據分析平臺。為避免致COVID-19與SARS的病毒名稱混雜,我們使用2019-nCoV的舊名, 最新定名應為SARS-CoV-2。
參考文獻:
[1] Wu CI, Poo MM. Natl Sci Rev 2020; Very fast evolution, not-so-fast publication – A proposed solution. https://doi.org/10.1093/nsr/nwaa010
[2] Nature Editorial. Calling all coronavirus researchers: keep sharing, stay open. Nature 578, 7 (2020). https://doi.org/10.1038/d41586-020-00307-x.
[3] He JF, Peng GW and Min J et al. Science 2004; 303:1666-1669.
[4] Wu CI, Poo MM. Natl Sci Rev 2017; 4:518-519. What went wrong in science publishing?
“科研人員要有分寸地傳播成果,過度宣傳會讓社會過分期待,若目標不能實現,最終將造成社會對科學家和科學的不信任。”面對科研界的宣傳“浮夸風”,中國科學院院士、中國科學院腦科學與智能技術卓越創新中心學術主......
如何培養你的下一代科學家?每個有遠見的科學家,幾乎都思考過這個問題。這是一個科學家超脫生物本性之上,更高級的“延續香火”。近日,Nature邀請了五位資深科學家,來提出他們對這一問題的建議。Natur......
“2022年,‘中國腦’要再出發!”2021年末中國科學院院士上海腦科學與類腦研究中心主任蒲慕明向上海科技表示:“如果要再加一個詞的話,那就是——反思,再出發!”蒲慕明說:“基礎研究的終極目標,除了對......
截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。其中,在1月22日以前獲取的31份測序數據幾乎全部來自于中國(僅有1例來自于美國)。然而1月22日以后,余下的24份數據一......
截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。其中,在1月22日以前獲取的31份測序數據幾乎全部來自于中國(僅有1例來自于美國)。然而1月22日以后,余下的24份數據一......
截至2020年2月10日,共有55條2019-nCoV的病毒基因組可公開獲取。其中,在1月22日以前獲取的31份測序數據幾乎全部來自于中國(僅有1例來自于美國)。然而1月22日以后,余下的24份數據一......
日前,中國科學院院士、中國科學院腦科學與智能技術卓越創新中心(以下簡稱中科院腦智卓越中心)學術主任蒲慕明首次開設視頻直播課程,課程持續2小時,為“延期開學”的年輕學子送上了一份精神大餐。近期,中科院腦......
近幾年,全世界除掀起來人工智能的浪潮之外,還有腦科學的浪潮,這個浪潮在歐美、日本都引發了國家性的腦科學計劃。我們中國科學家在過去幾年中也做了很大的努力——啟動了中國腦計劃。中國腦計劃是在全球興起的大型......
科研誠信是科技創新的基石。最近,中共中央辦公廳、國務院辦公室印發《關于進一步加強科研誠信建設的若干意見》,要求嚴查科研不端行為。不久前,神經科學家、中國科學院院士蒲慕明在中科院神經科學研究......
盡管收集可獲得的在線學術材料的想法日益增多,如從文章和數據集到會議報告和講座,但有一種學術文獻卻幾乎未得到審核。那就是教學大綱:列出閱讀材料、話題以及大學課程所期望的材料。至少,在今年1月,當美國紐約......