一種新的論文偽造方式,即用同義詞替換常規用語以躲過查重,正在浮出水面。
法國研究人員對部分此類短語進行了檢索,在引文數據庫中發現860多篇論文涉及此類情況。其中,500篇來自同一本期刊《微處理器和微系統》(Microprocessors and Microsystems,影響因子1.525)。
對這些論文進行人工檢查后,他們發現,這些論文還涉及引用虛假文獻、重復使用他人圖片等問題。其中,大部分論文的作者來自中國。
最近,該雜志的出版商——愛思唯爾對其中400多篇論文表達關切,目前調查工作仍在進行中。
據Nature網站日前報道,今年4月,法國圖盧茲大學計算機科學家Guillaume Cabanac等人對論文中的奇怪短語產生了興趣。
這些短語通常有約定俗成的術語,但論文作者故意回避常規叫法,而用同義詞來替換,顯得非常奇怪。Cabanac等人稱之為“扭曲短語”。其研究結果于7月12日發布在arXiv預印本網站上。
計算機科學論文中的扭曲短語。截圖自自然網站
誠信研究調查人員說,這是一種新的偽造論文方法,這一研究可能只暴露了偽造論文的冰山一角。
為了解到底多少論文存在這類問題,研究人員在引文數據庫中搜索了30個扭曲短語,結果涉及860多篇文章。令人驚訝的是,其中有500篇論文都來自同一本雜志:《微處理器和微系統》。
“這是對科學的損害。你不能相信這些論文,我們需要找到并撤回它們。”Cabanac說。他們懷疑,這是使用了自動翻譯或文本轉換軟件的結果。
研究者借助了一種名為GPT的工具,它能識別文本是否由人工智能轉寫工具生成。他們利用GPT對《微處理器和微系統》和其他期刊上的一些摘要進行篩查,并對被標記的論文再次人工檢查后發現,其中一些論文存在“嚴重錯誤”,如奇怪扭曲的寫作風格、引用不存在的文獻、重復使用他人的圖像。
為更深入地了解問題,研究人員下載了2018-2021年間在《微處理器和微系統》上發表的所有論文。
分析顯示,2021年2月后,論文的平均接收時間比原來縮短5倍,發表的論文數量比此前發表總數還要多。
這些論文中有很大一部分來自中國的作者。還有一部分論文的提交日期、修訂日期和接收日期完全相同,大部分發表在該期刊的特刊上。
研究人員認為這很可疑。不同于常規標準期刊,特刊通常由總編輯提出,由客座編輯監督,專注于特定的研究領域。
除《微處理器和微系統》外,研究人員還在其他35種期刊的論文中發現了扭曲短語。
該研究論文寫道:“初步調查顯示,在主要數據庫中有數千篇帶有扭曲短語的論文被編入索引”,并補充說“其他科學領域的扭曲短語尚未被揭露”。
針對這些情況,《微處理器和微系統》的出版商——愛思唯爾發起了一項調查。7月中旬,愛思唯爾對該期刊6個特刊上的400多篇論文表達關切,涉及對特刊論文正在逐一“重新獨立評估”。截至目前,調查工作仍在進行中。
愛思唯爾的一位發言人透露,調查發現,這些作者可能使用了反向翻譯軟件來掩飾剽竊行為,這很可能是這些扭曲短語的來源。
調查還顯示,49篇被Cabanac等人標記為可疑的論文,最初是提交給特刊的,也被客座編輯接受了,而后卻發表在了正刊上。聲明中提到,是應作者的要求在正刊上發表的,這也是愛思唯爾調查的一部分。
著名學術“打假人”Elisabeth Bik認為,“Cabanac的研究結果‘令人震驚’,這是一種非常新且令人不安的論文編造方式”。
澳大利亞悉尼大學分子腫瘤學研究者Jennifer Byrne表示,這可能是冰山一角,對于有些人工智能生成的、可信度更高的論文,更難發現其問題。
這并不是學術界第一次發現奇怪的用詞與問題論文之間的關系。
一項2015年發表于《語言和社會心理學期刊》的研究中,美國斯坦福大學的研究者對已撤回的253篇生物醫藥研究領域的文章進行了分析。
他們發現,問題論文讀起來更晦澀、專業術語更多,文章更含混不清。
不過,他們同時指出,語言識別并非揭示科研造假的完美方法,他們的試驗準確率僅為57.2%。誠信文章也有可能被“誤傷”,因為有些人是故意欺騙,而有些人可能只是不擅長寫文章。
參考資料:
https://www.nature.com/articles/d41586-021-02134-0
https://arxiv.org/abs/2107.06751
https://www.sciencedirect.com/journal/microprocessors-and-microsystems/about/aims-and-scope
http://news.sciencenet.cn/htmlpaper/201512310245547337912.shtm
在近日愛思唯爾發布的2023“中國高被引學者”榜單中,太原科技大學機械工程學院教授馬立峰和計算機科學與技術學院教授崔志華再次上榜。圖片來源:太原科技大學據悉,愛思唯爾2023“中國高被引學者”榜單主要......
10年內禁止申報基金!她偽造384張圖片,騙得480萬資助美國研究誠信辦公室(ORI)將2022年最重的一起學術不端處罰,施加給一位華人學者AliceC.Chang。在長達10年時間里,禁止她申請任何......
最高人民法院最高人民檢察院關于辦理環境污染刑事案件適用法律若干問題的解釋《最高人民法院、最高人民檢察院關于辦理環境污染刑事案件適用法律若干問題的解釋》已于2023年3月27日由最高人民法院審判委員會第......
2022年5月9日,JournalofClinicalAnesthesia(IF=9.38,麻醉科領域排名第一的雜志)撤回了HironobuUeshima發表題為的“Cerebralinfarctio......
聲明近日,我們發現某微信公眾號偽造并發布“關于2022年國家自然科學基金集中接收申請項目評審結果的通告”,誘導項目申請人及社會公眾點擊,謀取不正當利益,嚴重誤導社會公眾,擾亂了網絡秩序,侵犯了我委合法......
免疫分子,包括補體蛋白C1q和C3,已成為突觸細化和可塑性的關鍵介質。補體通過突觸的C3依賴性小膠質細胞吞噬作用定位于突觸并細化發育中的視覺系統。視網膜神經節細胞(RGC)在視黃原體細化過程中表達C1......
5日,科研和醫療信息分析公司愛思唯爾發布《凈零之路:全球清潔能源研究現狀》報告。報告顯示,清潔能源領域相關研究成為全球科研熱點,中國清潔能源領域相關發文量及近5年獲取授權ZL數量均居全球領先地位。報告......
5日,科研和醫療信息分析公司愛思唯爾發布《凈零之路:全球清潔能源研究現狀》報告。報告顯示,清潔能源領域相關研究成為全球科研熱點,中國清潔能源領域相關發文量及近5年獲取授權ZL數量均居全球領先地位。報告......
一種新的論文偽造方式,即用同義詞替換常規用語以躲過查重,正在浮出水面。法國研究人員對部分此類短語進行了檢索,在引文數據庫中發現860多篇論文涉及此類情況。其中,500篇來自同一本期刊《微處理器和微系統......
一種新的論文偽造方式,即用同義詞替換常規用語以躲過查重,正在浮出水面。法國研究人員對部分此類短語進行了檢索,在引文數據庫中發現860多篇論文涉及此類情況。其中,500篇來自同一本期刊《微處理器和微系統......