<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2024-07-26 12:49 原文鏈接: 谷歌推出兩大數學模型,19秒解開IMO2024幾何問題

    ·六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統在今年國際數學奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達到了這一門檻。

    ·DeepMind表示,盡管基于自然語言的方法可以訪問更多數據,但會產生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優勢,即涉及數學推理的證明可以被形式化地驗證其正確性。


    DeepMind人工智能系統在IMO 2024上相對于人類競爭者的表現。在42分的總分中,人工智能系統獲得了28分。

    谷歌DeepMind的AI模型解決了今年國際數學奧林匹克競賽(IMO)六個問題中的四個問題,人工智能首次達到了銀牌標準。

    當地時間7月25日,谷歌DeepMind公布專用于數學推理的模型AlphaProof,以及專注于幾何的模型更新版本AlphaGeometry 2。DeepMind表示,AlphaProof和AlphaGeometry 2解決了數學中的高級推理問題,具有先進數學推理能力的通用人工智能或開啟科學和技術的新領域。

    IMO是歷史最悠久、規模最大、最負盛名的青年數學家競賽,自1959年以來每年舉辦一次。選手要解決代數、組合學、幾何和數論方面六個異常困難的問題。菲爾茲獎是數學家的最高榮譽之一,菲爾茲獎獲得者也會代表他們的國家參加IMO。

    近年來,IMO競賽被認為是機器學習領域的重大挑戰,也是衡量人工智能系統高級數學推理能力的理想基準。

    谷歌DeepMind表示,IMO的數學問題被人工翻譯成數學語言,供系統理解。在正式比賽中,學生們分兩次提交答案,每次4.5小時。而人工智能系統在幾分鐘內解決了一個問題,花了三天時間來解決其他問題。基于強化學習的推理系統AlphaProof解決了兩個代數問題和一個數論問題并被證明答案正確,這些問題包括今年IMO比賽中只有5名選手解決的最難的問題。AlphaGeometry 2證明了幾何問題,但兩個組合問題仍未解決。

    六道題每題可得7分,總分最高可達42分。DeepMind的人工智能系統最終得分28分。DeepMind表示,今年金牌的門檻從29分開始,在正式比賽的609名選手中,有58名達到了這個門檻。

    “事實上,這個程序能想出這樣一個不明顯的結構是非常令人印象深刻的,遠遠超出了我認為的最先進的水平。”IMO金牌得主和菲爾茲獎牌得主蒂莫西·高爾斯(Timothy  Gowers)表示。

    在大量書面文本上訓練的人工智能模型歷來在數學推理方面很困難,往往傾向于語言智能而非數學智能,解決數學問題需要更復雜的推理技能。AlphaProof將預先訓練好的語言模型與AlphaZero強化學習算法結合在一起,AlphaZero此前自學了如何掌握國際象棋、將棋和圍棋。

    大語言模型容易產生幻覺,或以令人信服的方式傳遞錯誤信息。DeepMind表示,盡管基于自然語言的方法可以訪問更多數據,但會產生看似合理但不正確的中間推理步驟和解決方案。而形式語言提供了一個重要優勢,即涉及數學推理的證明可以被形式化地驗證其正確性。“我們通過微調Gemini模型,在這兩個互補的領域之間建立了一座橋梁,自動將自然語言問題語句轉換為形式語句,創建了一個不同難度的龐大形式問題庫。”

    當遇到一個數學問題時,AlphaProof會生成候選解決方案,然后搜索可能的證明步驟來證明或反駁它們。每一個被發現和驗證的證明都被用來強化AlphaProof的語言模型,增強其解決后續更具挑戰性問題的能力。


    AlphaGeometry 2解決的幾何問題:證明∠KIL與∠XPY之和等于180°。AlphaGeometry 2提出在直線BI上構造點E,使∠AEB=90°。點E有助于為AB的中點L提供作用,創造了許多對相似三角形,如三角形ABE和三角形YBI、三角形ALE和三角形IPC,以證明結論。

    AlphaGeometry 2是AlphaGeometry的一個改進版本。AlphaGeometry 2是一個神經符號混合系統,其中的語言模型基于Gemini模型,并在比前身多一個數量級的合成數據上從零開始訓練。這幫助模型解決更具挑戰性的幾何問題,包括物體運動問題和角度、比例或距離方程。在今年的比賽之前,AlphaGeometry 2可以解決過去25年中IMO歷史幾何問題的83%,而AlphaGeometry只有53%。在今年的比賽中,AlphaGeometry 2收到形式語言后19秒內解決了問題。

    但谷歌研究人員也表示,人工智能遠不能以其解決問題的能力取代人類數學家。“即使我們有最大的雄心壯志,我認為我們的目標是提供一個可以證明任何事情的系統。”谷歌DeepMind強化學習副總裁大衛·西爾弗(David Silver)表示,“但這并不是數學家工作的終點。”

    西爾弗說,DeepMind的人工智能模型更類似于強大的計算工具,有朝一日可能會幫助人類提出數學證明,但人工智能系統缺乏的是想象力,而“數學家提出了有趣的問題”。

     


    相關文章

    谷歌DeepMind推出“驚艷”的通用科學AI系統

    谷歌DeepMind利用聊天機器人模型成功解決了數學和計算機科學領域的重大難題。據《自然》報道,5月14日,DeepMind推出能夠自主生成、改進算法代碼的通用科學人工智能(AI)系統AlphaEvo......

    谷歌公司因涉嫌違反中國反壟斷法被立案調查

    國家市場監督管理總局近日發布公告稱,國際互聯網科技企業谷歌(Google)公司因涉嫌違反《中華人民共和國反壟斷法》,已被市場監管總局依法立案調查。此次調查的具體細節尚未披露,但分析認為可能與谷歌在中國......

    科學家構建丙烷及前體物高維同位素數學模型

    中國科學院院士、中國科學院廣州地球化學研究所研究員彭平安團隊,通過構建丙烷及前體物同位素體反應圖譜,進而建立并驗證丙烷及前體物高維同位素數學模型方法。相關成果近日發表于《創新:地球科學》(TheInn......

    OpenAI又失大將!Sora研發負責人跳槽谷歌

    OpenAI再走一員大將。當地時間10月4日,人工智能(AI)巨頭OpenAI的文生視頻大模型Sora團隊研發負責人蒂姆·布魯克斯(TimBrooks)宣布離職,加入谷歌DeepMind。TimBro......

    一周熱聞回顧(2024年7月28日)

    多校通報!遏制高校教師性騷擾亂象,不能只靠“事后的堅決”連日來,多起高校教師師德失范事件頻發,令人怒不可遏。7月22日,中國人民大學發布通告稱,該校教授王某某強制猥褻學生事件,經查證屬實。給予王某某開......

    谷歌推出兩大數學模型,19秒解開IMO2024幾何問題

    ·六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統在今年國際數學奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達到了這一門檻。·Deep......

    谷歌推出兩大數學模型,19秒解開IMO2024幾何問題

    ·六道題每題可得7分,總分最高42分。谷歌DeepMind的人工智能系統在今年國際數學奧林匹克競賽中最終得分28分。今年金牌的門檻是29分,在正式比賽的609名選手中,58名達到了這一門檻。·Deep......

    OpenAI和谷歌再度燃起爭霸烽火

    谷歌ProjectAstra亮相發布會。圖片來源:美國Gizmodo網站OpenAI與谷歌的又一次技術交鋒剛剛落下帷幕。北京時間5月14日凌晨,OpenAI發布了新一代多模態人工智能(AI)大模型GP......

    全面叫板OpenAI!谷歌發布多模態大模型全家桶:從AI助手到文生視頻模型

    被OpenAI搶先一天后,科技巨頭谷歌不甘示弱,推出了自己的最新多模態AI(人工智能)產品。當地時間5月14日,在谷歌I/O開發者大會上的主題演講中,谷歌展示了由升級后Gemini模型驅動的AI助手項......

    谷歌I/O大會提“AI”121次,發布十余項更新及新品

    ·本次開發者全程兩個小時,谷歌CEO共提及“AI”121次,此次開發者大會,谷歌將搜索業務做了最徹底的AI改造,還更新升級了Gemini1.5Pro版本,同時推出Gemini1.5Flash輕量化小模......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频