<li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 發布時間:2023-06-26 11:06 原文鏈接: 商湯大模型多個評測表現超ChatGPT

    本報訊 (記者沈湫莎)商湯科技近日公布了自研中文語言大模型“商量SenseChat 2.0”在MMLU、AGIEval、C-Eval三個權威大語言模型評測基準的成績。評測顯示,“商量”在這三個測試集中的表現均領先ChatGPT,實現了我國語言大模型研究的突破。      全球三大權威語言模型測評基準分別為由美國加州大學伯克利分校等高校構建的多任務考試評測集MMLU、由微軟研究院推出的學科考試評測集AGIEval(含中國高考、司法考試及美國SAT、LSAT、GRE和GMAT等),以及由上海交通大學、清華大學和英國愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集C-Eval。      截至6月,全球范圍內正式發布的大語言模型已超過40款,其中由中國廠商、高校、科研院所等發布的大語言模型近20款。在MMLU測評中,“商量2.0”綜合得分為68.6,超ChatGPT(67.3分),僅落后于GPT-4(86.4分)位居第二;在AGIEval測評中,“商量2.0”得分49.9分,超ChatGPT(42.9分),僅次于GPT-4的56.4分。在C-Eval測評中,“商量2.0”得分66.1分,在參評的18個大模型中,僅次于GPT-4(68.7分)。      4月,商湯發布“日日新”大模型體系以及中文語言大模型“商量”。目前,“商量”已在眾多行業和場景中落地應用,已有近千家企業客戶通過申請,應用和體驗“商量2.0”的長文本理解、邏輯推理、多輪對話、情感分析、內容創作、代碼生成等綜合能力。在服務客戶過程中,“商量2.0”持續迭代和提升,并實現知識的實時更新。

    相關文章

    OpenAI再出王炸,視頻生成大模型Sora備受關注

    人工智能(AI)領域的巨頭OpenAI再次引發關注,其最新推出的視頻生成大模型Sora因其出色的逼真度和想象力廣受贊譽。相較于傳統視頻生成領域的平均4秒長度,Sora能夠生成長達60秒的視頻,這一創新......

    哈佛校長辭職引發學界“抄襲”爭議,人工智能將抄襲檢測規則?

    抄襲是最古老、也是最普遍的學術違規行為之一。但近日,美國哈佛大學校長ClaudineGay因抄襲指控而辭職一事引發了一場新的網上大辯論:在論文中引用多少他人的內容才應被認定為抄襲?一些學者主張采用更寬......

    新進展!開發出尋找新型磁性材料的新方法

    美國艾姆斯國家實驗室(AmesNationalLaboratory)的科研人員開發出一個新的機器學習模型,該模型可預測新材料組合的居里溫度(材料保持磁性的最高溫度),用于尋找不含關鍵元素的永磁材料。科......

    百度CTO王海峰:通用人工智能曙光已現

    “過去一段時間,以大語言模型為代表的人工智能技術取得了令人震撼的成績,而這些已經讓我們看到了通用人工智能的曙光。”近日,在由深度學習技術及應用國家工程研究中心主辦的WAVESUMMIT深度學習開發者大......

    商湯大模型多個評測表現超ChatGPT

    本報訊(記者沈湫莎)商湯科技近日公布了自研中文語言大模型“商量SenseChat2.0”在MMLU、AGIEval、C-Eval三個權威大語言模型評測基準的成績。評測顯示,“商量”在這三個測試集中的表......

    商湯大模型多個評測表現超ChatGPT

    本報訊(記者沈湫莎)商湯科技近日公布了自研中文語言大模型“商量SenseChat2.0”在MMLU、AGIEval、C-Eval三個權威大語言模型評測基準的成績。評測顯示,“商量”在這三個測試集中的表......

    商湯大模型多個評測表現超ChatGPT

    本報訊(記者沈湫莎)商湯科技近日公布了自研中文語言大模型“商量SenseChat2.0”在MMLU、AGIEval、C-Eval三個權威大語言模型評測基準的成績。評測顯示,“商量”在這三個測試集中的表......

    港科大(廣州)面向全校上線GPT服務

    記者從香港科技大學(廣州)獲悉,該校GPT服務已經完成聯調測試,并于6月5日正式上線,服務全校教職工及學生。此前,香港科技大學宣布,自6月1日起為全校教職工及學生提供ChatGPT3.5服務。港科大(......

    BrainX:3D打印全尺寸人腦模型及臨床應用前景

    目前,手術仍然是治療腦部腫瘤以及多種原因造成腦外傷的有效手段之一。但由于人類大腦的復雜結構,極大提高了手術過程的難度。因此,根據患者病情而定制的術前大腦模型能夠幫助外科醫生精準分析病灶和提高手術熟練度......

    北大教授劉宏:GPT技術正處在從“玩具”向工具快速發展

    IT之家4月9日消息,據財聯社報道,今日在杭州蕭山舉行的“GPT4技術創新帶來的產業發展機遇及挑戰”專題論壇上,北京大學教授、CAAI副理事長劉宏表示,目前GPT技術正處在從“玩具”向工具的快速發展過......

    <li id="omoqo"></li>
  • <noscript id="omoqo"><kbd id="omoqo"></kbd></noscript>
  • <td id="omoqo"></td>
  • <option id="omoqo"><noscript id="omoqo"></noscript></option>
  • <noscript id="omoqo"><source id="omoqo"></source></noscript>
  • 1v3多肉多车高校生活的玩视频