亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

<sup id="ekc2w"><delect id="ekc2w"></delect></sup>

<tfoot id="ekc2w"><input id="ekc2w"></input></tfoot>

<strike id="ekc2w"><input id="ekc2w"></input></strike>

<del id="ekc2w"></del>

<ul id="ekc2w"></ul>

首個OpenAI免費推理模型o3-mini發布 DeepSeek讓奧特曼反思：不開源我們錯了

訪客 10個月前 (02-02) 閱讀數 9306 #區塊鏈

文章標簽前沿文章

DeepSeek真算是給大模型圈提了個速——

就在剛剛，OpenAI深夜緊急發布了最新推理模型，o3-mini系列。

一共包含三個版本：low、medium和high。

其中o3-mini和o3-mini-high已經上線：

根據官方口徑，o3系列模型，目標是推動低成本推理的邊界。

ChatGPT Plus、團隊和Pro用戶從今天起可以訪問OpenAI o3-mini，企業級訪問將在一周后開放。

免費用戶也可以通過選擇“Search+Reason”來使用o3-mini來體驗搜索。

或許是被DeepSeek逼急了，這是OpenAI首次向用戶免費推出的推理模型。

甚至在隨后的Reddit“有問必答”活動中，CEO奧特曼也罕見公開反思：

在開源權重AI模型這個問題上，(個人認為）我們站在了歷史錯誤的一邊。

與此同時，短短數小時內，網友們已經開始瘋狂實測ing……

針對STEM推理優化，但價格相較DeepSeek-R1依舊貴出天際

還是先來看看技術報告都寫了啥。

去年年底，OpenAI上線了o3-mini預覽版，再次刷新小模型能力邊界。（在成本和低延遲上與o1-mini相當）

當時CEO奧特曼預告稱，正式版將在今年1月發布。而卡在ddl的最后時刻，正式版o3-mini終于上桌。

整體而言，和前一代o1-mini類似，它也針對STEM（Science、Technology、Engineering、Mathematics）進行了優化，延續了mini系列小而美的風格。

僅o3-mini（medium），不但在數學編碼上的表現與o1系列相當，而且響應更快。

人類專家測評顯示，大多數情況下o3-mini比o1-mini產生更準確、更清晰的答案，獲得了56%的偏好度，同時在處理復雜現實問題時的重大錯誤率更是降低了39%。

數學能力上，低推理強度下的o3-mini（low）達到了與o1-mini相當的水平；中等推理強度下能力媲美滿血版o1；而一旦推理強度拉滿（high），其表現直接超越o1系列一眾模型。

在由60多位頂尖數學家準備的FrontierMath難題測試中，高推理強度下的o3-mini相較o1系列也有了大幅提升。

官方甚至特意注明，如果搭配Python工具使用，o3-mini（high）在第一次嘗試時就解決了超過32%的問題，其中包括28%以上的T3級問題。

科學能力方面，在PhD水平的物化生問題上，低推理強度下的o3-mini就已經和o1-mini拉開了層級。

當然，在編碼這項重要能力上，o3-mini更是在各層級上領先o1系列。

根據它們在LiveBench的表現可以看出，隨著推理強度升級，o3-mini的優勢還在不斷擴大。

而且需要提醒，o3-mini在取得上述領先的同時響應更快，其平均響應時間為7.7秒，較o1-mini的10.16秒提升了24%。

最后在安全評估方面，o3-mini在多項安全評估中明顯超過了GPT-4o。

價格方面，相比于輸入/輸出分別為0.14/0.55美元的DeepSeek-R1，o3-mini依舊貴出天際。

根據網友辣評，DeepSeek-R1目前還是性價比之王：更快、更好、更便宜。

BTW，OpenAI此次照例公布了o3-mini背后團隊。可以看出，這一次是由奧特曼本人親自帶隊，研究項目主管分別為Carpus Chang和Kristen Ying（名單中也有很多我們熟悉的老朋友如任鴻宇、趙盛佳等）。

網友瘋狂實測中

正如我們剛才所提到的，目前網友們已經開始瘋狂實測中。

不過從評價上來看，大伙兒對o3-mini的表現褒貶不一。

例如在用Python實現“球在四維體內部彈跳”的任務上，有人認為o3-mini是最好的LLM：

效果是這樣的：

然后有網友嘗試用DeepSeek來做同樣的任務，從效果上來看，認為o3-mini稍微勝出一些：

更直接的對比，讓一個球在旋轉的六邊形內彈跳，球應受到重力和摩擦力的影響，o3-mini和DeepSeek R1的效果差距就比較明顯了：

包括更復雜的一些的任務，在球體內創建100個彈跳的黃色球，o3-mini現在也是可以做到：

再如讓o3-mini設計兩個貪吃蛇互相競爭的游戲：

除了DeepSeek之外，網友也用o1和o3-mini的效果做了對比，例如生成一座龐大、驚人的史詩級漂浮城市。

還有一位網友提出了令幾乎所有大模型都會出錯的迷惑性題目，但讓他較為震驚的是，o3-mini竟然答對了：

不過知名播客博主Lex Fridman對o3-mini的評價卻是：

OpenAI o3-mini是一個好模型，但DeepSeek R1性能相似，價格更低，并揭示了其推理過程。

更好的模型將會出現（迫不及待想要 o3-pro），但“DeepSeek 時刻”是真實的。我認為五年后它仍會被記住，作為科技歷史上的一個轉折點。

One More Thing

就在o3-mini上線幾小時后，奧特曼本人也攜團隊參與了Reddit的“有問必答”活動。

考慮到開源DeepSeek最近攪動了AI圈，奧特曼罕見公開反思：

在開源權重AI模型這個問題上，(個人認為）我們站在了歷史錯誤的一邊。

甚至也承認，OpenAI的領先優勢不會像以前那么大了。

DeepSeek的確很優秀，我們也會繼續研發更好的模型，但領先優勢將更小。

與此同時，OpenAI的一些未來計劃也曝光了。

比如高級語音模式即將迎來更新，OpenAI會直接稱它為GPT-5，而不是GPT-5o，不過目前還沒有具體時間表。

另外，推理模型也將支持調用更多工具。

最后，滿血版o3也被提及，不過看起來距離還相當遙遠……

上一篇：金色晨訊 | 2月2日隔夜重要動態一覽下一篇：CZ：歐盟需要比特幣

相關文章

亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

<strike id="ykeqq"><input id="ykeqq"></input></strike>

<strike id="ykeqq"><menu id="ykeqq"></menu></strike>

<strike id="ykeqq"></strike>

<fieldset id="ykeqq"></fieldset>

<del id="ykeqq"><dfn id="ykeqq"></dfn></del>

欧美成人69av| 国产精品成人免费| 国产日韩精品一区| 欧美午夜精品久久久久久超碰| 欧美成人蜜桃| 国产精品卡一卡二| 国产精品久久综合| 亚洲性感美女99在线| 亚洲一区二区三区高清| 美女图片一区二区| 久久综合国产精品台湾中文娱乐网| 欧美中文字幕精品| 久久久综合视频| 美国成人毛片| 欧美另类视频| 欧美日韩一区二区精品| 国产精品爱久久久久久久| 亚洲视频在线观看免费| 亚洲一区二区在线播放| 欧美电影免费观看高清| 欧美日韩国产首页| 欧美亚洲第一页| 亚洲深夜影院| 欧美精品一线| 亚洲午夜三级在线| 欧美日本高清一区| 国产精品色午夜在线观看| 国产欧美一二三区| 久久成人人人人精品欧| 国产精品免费小视频| 欧美亚洲一级片| 久久免费视频在线观看| 国产农村妇女精品一二区| 极品少妇一区二区三区精品视频| 亚洲视频高清| 欧美成人精品一区二区三区| 一区在线观看视频| 欧美在线网址| 国产精品一区视频| 一区二区视频在线观看| 欧美成年人网| 亚洲午夜伦理| 国产精品久久久91| 久久精品国产2020观看福利| 欧美激情第10页| 国产精品一区二区三区四区| 欧美在线首页| 国产日韩欧美一区| 欧美高清视频在线| 午夜伦欧美伦电影理论片| 美女亚洲精品| 激情综合网激情| 欧美美女bbbb| 久久99伊人| 激情一区二区| 国产精品狼人久久影院观看方式| 久久久久久久综合狠狠综合| 欧美日韩一区三区| 欧美在线啊v一区| 欧美精品一区二区三区蜜桃| 亚洲男人的天堂在线aⅴ视频| 久久午夜色播影院免费高清| 韩国美女久久| 久久久久国产精品厨房| 国产亚洲成av人在线观看导航| 亚洲欧美日韩国产一区| 国产精品普通话对白| 欧美成人午夜激情在线| 午夜精品久久久久久久99热浪潮| 国产香蕉97碰碰久久人人| 欧美日韩精品三区| 久久在线播放| 西瓜成人精品人成网站| 国内精品免费在线观看| 欧美网站在线观看| 欧美xx视频| 久久精品视频99| 亚洲图片在区色| 国产日韩欧美制服另类| 欧美日韩精品免费| 免费h精品视频在线播放| 午夜天堂精品久久久久| 好吊色欧美一区二区三区视频| 欧美午夜一区二区三区免费大片| 免费看成人av| 久久精品国产精品亚洲综合| 亚洲综合首页| 欧美日韩mp4| 老司机精品视频网站| 性色一区二区| 亚洲午夜高清视频| 国产亚洲精品久久久久久| 国产精品高潮视频| 欧美日韩三级| 欧美1级日本1级| 久久久精品一品道一区| 先锋资源久久| 亚洲自拍偷拍一区| 亚洲视频专区在线| 国产精品视频一二三| 午夜精品久久久久久久久久久| 国产精品久久久久久亚洲毛片| 一区二区在线视频| 国产精品一区毛片| 欧美日韩中文字幕在线| 欧美不卡福利| 猫咪成人在线观看| 久久亚洲国产精品一区二区| 久久国产精品久久久| 欧美在线free| 欧美一区二区三区婷婷月色| 亚洲欧美日韩国产一区| 亚洲天堂男人| 1024国产精品| 久久亚洲国产精品一区二区| 欧美在线视频网站| 国产精品www994| 国产精品综合色区在线观看| 欧美日韩亚洲在线| 欧美日韩精品在线视频| 美日韩精品视频免费看| 久久婷婷色综合| 老司机成人在线视频| 美腿丝袜亚洲色图| 男女精品网站| 老司机精品视频网站| 另类专区欧美制服同性| 你懂的国产精品| 欧美国产综合视频| 欧美精品亚洲一区二区在线播放| 欧美国产一区视频在线观看| 欧美激情免费观看| 欧美日韩国产综合久久| 欧美日韩高清在线播放| 欧美视频久久| 国产精品福利在线观看网址| 国产精品蜜臀在线观看| 国产欧美在线视频| 国产综合色产在线精品| 伊人夜夜躁av伊人久久| 亚洲一二三区视频在线观看| 午夜激情久久久| 欧美在线精品一区| 久久久一区二区| 欧美电影免费观看大全| 欧美日韩在线免费| 国产精品免费一区二区三区在线观看| 国产精品人人做人人爽| 国产亚洲美州欧州综合国| 宅男66日本亚洲欧美视频| 欧美久久视频| 欧美日韩一区二区三区| 国产精品久久久久久久午夜片| 国产亚洲欧美日韩精品| 一区二区视频免费在线观看| 亚洲免费人成在线视频观看| 久久福利一区| 欧美第十八页| 国产精品第三页| 黄色精品在线看| 欧美亚洲日本国产| 欧美成人高清视频| 欧美午夜精品一区| 国产一区激情| 国产精品国产福利国产秒拍| 国产精品成人在线| 国产在线国偷精品产拍免费yy| 在线一区亚洲| 久久久蜜桃精品| 欧美日韩三级视频| 国产女优一区| 亚洲一区二区伦理| 久久久水蜜桃av免费网站| 欧美日本久久| 国产一级揄自揄精品视频| 亚洲免费视频中文字幕| 久久在线免费观看视频| 欧美午夜免费电影| 在线播放一区| 久久久国产成人精品| 欧美日韩视频免费播放| 国产一区二区激情| 亚洲欧美日韩国产综合精品二区| 免费不卡欧美自拍视频| 国产精品婷婷午夜在线观看| 一区二区三区无毛| 久久久青草婷婷精品综合日韩| 欧美日韩免费一区| 黄色一区二区三区四区| 久久黄金**| 欧美午夜免费电影| 亚洲视频一区在线| 蜜臀va亚洲va欧美va天堂| 国产精品亚洲产品| 午夜精品一区二区三区在线播放| 欧美激情一区二区三区四区| 国产一区二区三区精品欧美日韩一区二区三区 | 国产精品国产三级国产aⅴ入口| 一区二区亚洲欧洲国产日韩| 久久精品国产亚洲一区二区三区|

<fieldset id="aey8s"></fieldset>

<fieldset id="aey8s"><menu id="aey8s"></menu></fieldset><tfoot id="aey8s"><input id="aey8s"></input></tfoot>

<ul id="aey8s"></ul>

<tfoot id="aey8s"><input id="aey8s"></input></tfoot>