對于科研人員來說,人工智能時代產生一個問題是:論文會交給 AI 來處理嗎?
同行評審有其缺陷。人類(即便是科學家也會)有偏向、懶惰和自私。而且即使是科學工作者,有時候數學也會不很靈光。所以不可避免的是,有人提議將人工從同行評審中剔除,以人工智能取而代之。計算機以其公正、不知疲倦和無自我身份定位著稱,而且它們天生精通算數。科學家并不只是干等著 AI 專家來參與科研同行評審,期刊出版商已經在著手相關事宜。
最近,一個名為“ScienceIE”的競賽為程序開發者設下挑戰。參賽團隊需要開發程序,要求這些程序能夠從科學論文的句子中提取基本事實,并將其同其他論文所提取的基本事實進行比較。“項目的大目標是幫助科學家和從業者更快速地獲得有關其研究領域的知識。”倫敦大學學院博士后 AI 研究員、競賽設計者 Isabelle Augenstein 說。
競賽涉及到處理自然人類語言,這是諸多人工智能難題之一。參賽者設計程序要解決三個子任務:閱讀每篇論文并確定其關鍵概念,按類型組織關鍵詞,以及識別不同關鍵短語之間的關系。這次競賽不僅僅是一場學術活動:Augenstein 與世界最大的科學出版商之一的 Elsevier 簽訂了為期兩年的合同,為后者的圖書館開發計算機工具。
Elsevier 出版超過2500種不同期刊。每個期刊的編輯都必須為每篇論文找到合適的審稿人。(2015年,70萬同行評審人員在 Elsevier 上評審了超過180萬份稿件,其中40萬份最終出版。)“能夠評審論文的人通常僅限于該領域的專家。”數字地圖公司 Descartes 的 CEO 邁克·沃倫(Mike Warren)說。“你將這么一小群擁有博士學位的專家按學科和子學科進行細分,最后,全世界可能只有100人有資格審閱某論文。”Augenstein 幫助 Elsevier 使用科技手段為每篇論文自動尋找合適的審稿人。
Elsevier 開發了一套名為“Evise”的自動化工具來幫助進行同行評審。該程序能夠檢查抄襲(這只是搜索和匹配功能,還談不上 AI),為審稿做最基礎的把關。此外還有處理作者、編輯和審稿人之間的工作流程。另外幾家主要的出版商也都有輔助同行評審的自動化軟件。Springer-Nature 當下正在測試一個名為“StatReviewer”的軟件,確保每份來稿具有完整、準確的統計數據。
不過這些同行在展示能力和愿景上并不像 Elsevier 這么開放。“我們正在探索更宏偉的任務,”Augenstein 說。“當你對一篇論文有疑問,機器學習模型能夠通讀論文并回答你的問題。”
不過并非所有人都沉醉于“機器人博士”的前景。今年年初,芬蘭赫爾辛基大學環境政策教授 Janne Hukkinen 和 Elsevier 雜志《生態經濟學》的編輯為 WIRED 撰寫了一篇警示性文章,文中設想未來可能會有完全自動化的 AI 同行評審:
“通過查詢出版商的審稿人數據庫,分析過往評審中審稿人和編輯之間的交流,并識別從提交到最終編輯拍板這一整個流程中稿件的變化,學習型算法完全可以接管從最初提交到最終決定的整個評審過程。更重要的是,將人工從同行評審之中剔除,能夠減輕力求開放的學者與反對開放的商業出版商之間的緊張關系。”
按照 Hukkinen 的邏輯,一個能夠勝任同行評審的 AI 同樣也可以動筆寫論文。最終,人類將成為科研中的遺留系統——冗余、低效且過時。他最終的觀點是:“不經人類產生的新知將會動搖人類文化的基礎。”
不過 Hukkinen 的警惕有點憂慮過早。“盡管 AI 在象棋、圍棋和撲克這樣的游戲中取得巨大成功,但仍然不能理解大多數普通的英文句子,更別說科學文本了。”艾倫人工智能研究所(Allen Institute for Artificial Intelligence)首席執行官Oren Etzioni 說。ScienceIE 競賽團隊的實例或可為其提供佐證:最終獲勝的團隊在三個子任務挑戰中的得分只有43%。
充斥著被動句式的科學論文晦澀至極,即便是在人腦看來也很難理解。所描述的對象經常隱身于層層前述之后,被動句式在日常語言面前顯得深奧難懂。語言學家將任何人類所寫的東西稱為“自然語言”,而自然語言在計算機科學家看來實在是一團亂麻。
“自然語言給 AI 帶來的一大難題是其模糊性。”紐約大學計算機科學家 Ernest Davis 說。斯坦福大學名譽計算機科學家 Terry Winograd 有一個經典的歧義例子:
市議會拒絕給示威者許可,因為他們(擔心/主張)暴力。
The city councilmen refused the demonstrators a permit because they [feared/advocated] violence.
這句子你我都能看明白,動詞“擔心”暗示了“他們”指的是“市議會”而非示威者。我們輕而易舉地明白:示威者“主張”暴力;市議會“擔心”暴力。但是一個計算機大腦可是會在此花費經年累月的時間最終也還是搞不清楚到底哪個動詞指向哪個代詞。這種類型的歧義只是自然語言纏結的一個縮影,同形異義詞和敘事邏輯將讓 AI 更加困擾。
這還沒涉及科學論文中的具體問題,比如將文本論點同數據模式進行連接等。即便在純數學論文中這一需求也很常見。“從英語到數學中的形式邏輯不是我們能自動化的。”Davis 說。“這是最簡單的工作之一。它是高度限制性的,而我們理解目標。”心理學等同數學比較遠的學科更是如此。”在心理學論文中,我們幾乎無法檢查其論證的合理性。”Davis 說。“我們不知道如何以計算機能用的方式來表達一個實驗。”
當然,一個完全自動的 AI 同行評審不僅需要對人類有所了解,還必須對其進行深入思考。“說起 AI 問題,同行評審可能是最難的一部分。因為同行評審最重要的職責是確保研究新穎,沒有重復前人老路。”沃倫說。計算機程序能夠查閱文獻,找出那些問題仍懸而未決。但它可能無力辨認顛覆性的科學新發現。
俄勒岡州立大學 AI 研究員 Tom Dietterich 說:“也許我么只是需要改變科學出版的方式。別把我們的研究用英語寫成一個故事,應該把我們的意見和論據套入一個類似數據庫的正規架構中,比如一個涵蓋人類在某主題下所有知識的數據庫。”換句話說,同行評審 AI 化是途徑而非解決方案。在這一點上,人們所要重新編程的不是計算機,而是人類行為。
近年來,隨著計算能力的提升和數據的爆發式增長,人工智能技術取得了巨大的突破和進展。彭博富豪排行榜顯示,四名富豪超級富翁因人工智能(AI),財富增長表現最優,他們分別為Meta創始人扎克伯格、甲骨文創始......
近年來,隨著計算能力的提升和數據的爆發式增長,人工智能技術取得了巨大的突破和進展。彭博富豪排行榜顯示,四名富豪超級富翁因人工智能(AI),財富增長表現最優,他們分別為Meta創始人扎克伯格、甲骨文創始......
當人工智能與健康醫療相遇,會擦出怎樣的火花?日前,在天津舉行的第七屆世界智能大會上,在人工智能的持續賦能下,醫藥、醫療發展的潛力正逐漸釋放。不但疑難雜癥的破解迎來曙光,而且將更多醫生從基礎性工作中解脫......
理解提問,快速給出回答;訓練聲音,翻唱經典歌曲;根據描述,繪出趣味畫作……近期,基于大模型研發的生成式人工智能,展示了在語言理解和內容生成等方面的出色能力,引發社會關注。大模型賦能,生成式人工智能正在......
一段時間以來,以ChatGPT為代表的人工智能大模型攪動了全球人工智能技術發展的浪潮。從寫代碼到講故事,從撰寫文章到自動制作數據表格……人工智能正在給人類的工作、學習、生活帶來諸多變化。我們距離“無所......
原文地址:http://news.sciencenet.cn/htmlnews/2023/6/503038.shtm6月16日,人工智能框架生態峰會2023在上海舉辦。峰會現場,昇思MindSpore......
·“大學炸彈客”泰德·卡欽斯基自1978年至1995年共寄出16枚郵件炸彈,炸死3人,炸傷23人,襲擊對象主要是大學的理工科教授、大型企業主管及航空公司,因為他們是推動技術進步的主要力量。·卡欽斯基威......
·“大學炸彈客”泰德·卡欽斯基自1978年至1995年共寄出16枚郵件炸彈,炸死3人,炸傷23人,襲擊對象主要是大學的理工科教授、大型企業主管及航空公司,因為他們是推動技術進步的主要力量。·卡欽斯基威......
美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結構的密集型步驟。......
美國麻省理工學院和塔夫茨大學研究人員設計出一種基于大型語言模型(如ChatGPT)的人工智能算法,這種稱為ConPLex的新模型可將目標蛋白與潛在的藥物分子相匹配,而無需執行計算分子結構的密集型步驟。......