<fieldset id="oy6kw"></fieldset>

<fieldset id="oy6kw"></fieldset>

<fieldset id="oy6kw"></fieldset>

直播
榜單
7x24h快訊

極客網(wǎng) > 人工智能 >

OpenAI宣布o3系列大模型：能力較o1大幅提升 Codeforces測試強于OpenAI首席科學(xué)家

人閱讀

2024-12-21 10:00:10

來源：TechWeb.com.cn
相關(guān)關(guān)鍵詞

12月21日消息，據(jù)外媒報道，在發(fā)布o1滿血版、視頻生成模型Sora等之后，OpenAI連續(xù)12天的直播活動在當(dāng)?shù)貢r間周五進入了最后1天，他們在當(dāng)天的發(fā)布會上宣布了更強的o3系列人工智能模型。

同第1天、第3天和第5天的直播一樣，OpenAI CEO 薩姆·奧爾特曼（Sam Altman）也參與了他們第12天的直播，o3系列大模型也是由他在直播中宣布的。

OpenAI在9月份推出了o1系列大模型，他們周五推出o3系列，在命名上就越過了o2，沒有遵循數(shù)字一樣的連續(xù)命名方式。對于越過o2，有外媒在報道中稱可能是為了避免和英國電信運營商O2在命名上產(chǎn)生紛爭。而在當(dāng)天的直播中，薩姆·奧爾特曼承認了他們在命名上的不足，他表示基于OpenAI不太擅長命名的傳統(tǒng)，新的大模型被命名為o3。

同9月份推出的o1系列大模型一樣，OpenAI新宣布的o3系列大模型也有o3和o3 mini兩款，不過尚未正式發(fā)布，o3 mini是預(yù)計會在明年年初發(fā)布。

在OpenAI此前推出的大模型中，能力在持續(xù)提升，新宣布的o3系列也不例外。

從OpenAI方面公布的消息來看，o3大模型在測試中的表現(xiàn)明顯強于他們之前推出的大模型，在部分測試中的表現(xiàn)已經(jīng)達到了人類的水平。

在ARC-AGI測試中，o3在低推理能力設(shè)置下的得分達到了75.7%，是o1的3倍，在高推理能力設(shè)置下則是高達87.5%，超過了85%的人類門檻。

在數(shù)學(xué)推理及解決問題的能力方面，o3也表現(xiàn)不俗，在2024年AIME測試中，o3的準確率達到了96.7%。

在編碼和軟件工程方面，o3的能力較o1也有大幅提升，在SWE-Bench認證中，o3的得分為71.7%，較o1提升了22.8個百分點。

值得注意的是，有外媒在報道中提到，在Codeforces的測試中，o3的得分為2727，比OpenAI首席科學(xué)家的得分還高。

雖然OpenAI的o3系列大模型要在明年才會正式發(fā)布，但他們在官網(wǎng)已表示，安全研究人員可以申請用于測試，從當(dāng)?shù)貢r間周五開始接受申請，截止時間為明年1月10日。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性，但不保證有關(guān)資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時，應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明，并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后，將會依法盡快聯(lián)系相關(guān)文章源頭核實，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）

為您推薦

極客觀察

欄目相關(guān)

贊助商

極客網(wǎng)熱搜關(guān)鍵詞

人工智能 AI OpenAI ChatGPT 機器學(xué)習(xí) 生成式AI AI芯片 AIGC U-Mail AI大模型世界人工智能大會 AIoT AirPods Airbnb Rushmail 人工智能AI 生成式人工智能 Akamai AI人工智能昇騰AI AIPC xAI Air 蘋果AI AI技術(shù) AI模型谷歌AI GenAI AI手機百度AI AI+ 科大訊飛AI學(xué)習(xí)機微軟AI CAICT 阿爾法蛋AI詞典筆T10 華為AI 松鼠AI 昇騰AI創(chuàng)新大賽 AIS Airdoc 智譜AI AI眼鏡 WAIC AITO 京東AI 阿爾法蛋AI詞典筆 AI服務(wù)器 AI算力 aigo SoleusAir AI應(yīng)用 AI機器人 SoleusAir舒樂氏 AI醫(yī)療 2019世界人工智能大會 LIFAair 移動AI時代人工智能大會 AI創(chuàng)企 AI搜索人工智能技術(shù) Airtag 阿里AI AI人才 AI智能體浙大AIF Zain 人工智能芯片 AI投資 AI教育騰訊AI 聯(lián)想AI AI算法 AI編程 AI時代 AI基礎(chǔ)設(shè)施 Gmail AI框架 BrainCo 通用人工智能 Airwallex空中云匯 Coremail 人工智能計算中心浪潮KaiwuDB VAIO 人工智能+ 人工智能大賽 AI助手 OPENAIGC開發(fā)者大賽 Chain AI賦能人工智能機器人谷歌人工智能 Airwheel 人工智能名片昇騰AI開發(fā)者創(chuàng)享日 Mirai AI聊天機器人 BrainCo強腦科技端側(cè)AI

上一篇

豆包大模型全面升級，相關(guān)概念股瘋漲，字節(jié)發(fā)布緊急警示

下一篇

消息稱OpenAI新模型GPT-5研發(fā)未達到預(yù)期：成本高昂效果欠佳

簡版
原版
投稿
回頂部

2024-12-21

OpenAI宣布o3系列大模型：能力較o1大幅提升 Codeforces測試強于OpenAI首席科學(xué)家

在發(fā)布o1滿血版、視頻生成模型Sora等之后，OpenAI連續(xù)12天的直播活動在當(dāng)?shù)貢r間周一進入了最后1天，他們在當(dāng)天的發(fā)布會上宣布了更強的o3系列人工智能模型

長按掃碼閱讀全文

<fieldset id="oy4kk"><delect id="oy4kk"></delect></fieldset>

<strike id="oy4kk"></strike>