科技日報北京6月5日電 (記者張夢然)《自然》5日發表的一篇論文報道了一個Meta人工智能(AI)模型的底層技術。該模型能翻譯200種不同語言,增加了機器翻譯的語言數量。
神經機器翻譯模型利用人工神經網絡翻譯各種語言。這些模型通常需要大量可在線獲取的數據加以訓練,但并非所有語言數據都是公開、低成本或是普遍可及的,這類語言被稱為低資源語言。一味地增加模型翻譯語言數量,可能會影響模型的翻譯質量。
此次,Meta的法國研究團隊和“不落下任何語言”(NLLB)團隊開發了一種跨語言技術,能讓神經機器翻譯模型學習如何利用翻譯高資源語言的預存能力,實現對低資源語言的翻譯。研究團隊開發了一個在線多語言翻譯工具,名為“NLLB-200”。該工具能容納200種語言,其低資源語言數量是高資源語言數量的3倍,翻譯表現則比當今已有系統高44%。
由于團隊在許多低資源語言上只能獲取1000—2000例樣本,為了擴大“NLLB-200”的訓練數據量,他們用一個語言識別系統發現了這些特定語言的更多實例。團隊還從互聯網存檔中挖掘雙語文本數據,幫助提升其翻譯質量。
研究團隊指出,這個工具可以幫助很少被翻譯的那些語言的使用者,讓他們也能用上互聯網和其他技術。此外,教育是一個非常重要的應用,因為這個模型可以幫助低資源語言使用者獲取更多圖書和研究文章。但團隊也表示,目前誤譯的情況仍有可能出現。
10月14日,2024國際光化學技術與產業大會在武漢開幕。參加會議的2021年諾貝爾化學獎獲得者、德國馬克斯·普朗克煤炭研究所教授本杰明·李斯特(BenjaminList),在會議期間接受了《中國科學......
在最新的直播中,馬斯克一如既往的語出驚人,透露了特斯拉的許多重大信息。第一,馬斯克承認了他的AI大模型Grok要集成到特斯拉汽車上,這可以說是特斯拉車型機器人最重要的一步。Grok相當于給這些車型機器......
在最新的直播中,馬斯克一如既往的語出驚人,透露了特斯拉的許多重大信息。第一,馬斯克承認了他的AI大模型Grok要集成到特斯拉汽車上,這可以說是特斯拉車型機器人最重要的一步。Grok相當于給這些車型機器......
近日,由中國科學院上海天文臺葛健教授帶領的國際團隊,創新了一種深度學習算法,成功在開普勒衛星2017年釋放的恒星測光數據中發現了五顆直徑小于地球、軌道周期短于1天的超短周期行星,其中四顆是迄今為止發現......
近日,由中國科學院上海天文臺葛健教授帶領的國際團隊,創新了一種深度學習算法,成功在開普勒衛星2017年釋放的恒星測光數據中發現了五顆直徑小于地球、軌道周期短于1天的超短周期行星,其中四顆是迄今為止發現......
Meta首席人工智能科學家、有“AI教父”之稱的楊立昆(YannLeCun)似乎并不不擔心人工智能會對人類構成威脅。他在接受最新采訪時詳細闡述了自己的觀點,并在回答有關AI是否聰明到足以對人類構成威脅......
Meta首席人工智能科學家、有“AI教父”之稱的楊立昆(YannLeCun)似乎并不不擔心人工智能會對人類構成威脅。他在接受最新采訪時詳細闡述了自己的觀點,并在回答有關AI是否聰明到足以對人類構成威脅......
Meta首席人工智能科學家、有“AI教父”之稱的楊立昆(YannLeCun)似乎并不不擔心人工智能會對人類構成威脅。他在接受最新采訪時詳細闡述了自己的觀點,并在回答有關AI是否聰明到足以對人類構成威脅......
2024年10月10日,深化部市合作推動人工智能賦能新型工業化座談會在京召開,北京市委書記尹力,工業和信息化部黨組書記、部長金壯龍,北京市委副書記、市長殷勇講話。工業和信息化部黨組成員、副部長單忠德,......
“我整個職業生涯一直在做這個東西,但心里很清楚,同行也這么認為——在我們有生之年,‘蛋白質的折疊’問題是不可能解決的,尤其是蛋白質結構預測問題。結果AlphaFold出來了!”10月9日,博士生導師、......