作者:Carl Franzen;編譯:深潮 TechFlow
就在幾天前,只有最專業(yè)的極客們(作為其中一員,我這樣說)才聽說過 DeepSeek,這是一家中國 AI 公司,是同樣具有獨(dú)特名字的 High-Flyer Capital Management(一家于 2015 年成立的量化分析公司)的子公司。然而在過去的幾天里,它可能成為了硅谷最受關(guān)注的公司。
這主要?dú)w功于 DeepSeek-R1 的發(fā)布,這是一個(gè)新的大語言模型(LLM),它能夠進(jìn)行類似于 OpenAI 當(dāng)前最佳模型 o1 的“推理”——在回答困難問題和解決復(fù)雜問題時(shí)需要花費(fèi)數(shù)秒或數(shù)分鐘,通過步驟式或“思維鏈”的方式對(duì)自身的分析進(jìn)行反思。
不僅如此,DeepSeek-R1 在各種第三方基準(zhǔn)測(cè)試(用于測(cè)量 AI 在各種主題上回答問題的性能的測(cè)試)中的得分與 OpenAI 的 o1 持平或更高,而且據(jù)報(bào)道其訓(xùn)練成本僅為約 500 萬美元,使用的圖形處理器(GPU)數(shù)量也遠(yuǎn)遠(yuǎn)少于美國(OpenAI 的大本營(yíng))嚴(yán)格禁運(yùn)的數(shù)量。
但與 o1 不同的是,o1 只向付費(fèi)的 ChatGPT Plus 級(jí)別訂閱者(每月 20 美元)和更高級(jí)別的訂閱者(如每月 200 美元的 Pro 級(jí)別)開放,而 DeepSeek-R1 是作為完全開源模型發(fā)布的,這也解釋了為什么它迅速攀升至 AI 代碼共享社區(qū) Hugging Face 最受歡迎和最活躍模型的榜首。
而且,由于它是完全開源的,人們已經(jīng)對(duì)該模型進(jìn)行了多種微調(diào)和訓(xùn)練,以適應(yīng)不同的特定任務(wù),比如使其小到可以在移動(dòng)設(shè)備上運(yùn)行,或者與其他開源模型結(jié)合使用。即使你想將其用于開發(fā)目的,DeepSeek 的 API 成本也比 OpenAI 的同等 o1 模型低 90%?以上。
最令人印象深刻的是,你甚至不需要是軟件工程師就能使用它:DeepSeek 為美國用戶提供了免費(fèi)的網(wǎng)站和移動(dòng)應(yīng)用,其 R1 驅(qū)動(dòng)的聊天機(jī)器人界面與 OpenAI 的 ChatGPT 非常相似。不過,DeepSeek 再次通過將這個(gè)強(qiáng)大的推理模型與網(wǎng)絡(luò)搜索連接起來超越了 OpenAI——這是OpenAI目前還沒有實(shí)現(xiàn)的(網(wǎng)絡(luò)搜索目前只在功能較弱的GPT系列模型上可用)。
考慮到 OpenAI 最初致力于為大眾民主化 AI 的目標(biāo),這里存在著一個(gè)相當(dāng)有趣,或者說令人不安的諷刺。正如 Nvidia 高級(jí)研究經(jīng)理 Jim Fan 在 X 上所說:“我們正生活在這樣一個(gè)時(shí)間線里:一家非美國公司正在延續(xù)著 OpenAI 的原始使命——真正開放的前沿研究,賦能所有人。這說不通。但最有趣的結(jié)果往往就是最可能發(fā)生的。”
又如 X 用戶@SuspendedRobot 所說(引用了有關(guān) DeepSeek 似乎是在 ChatGPT 生成的問答輸出和其他數(shù)據(jù)上訓(xùn)練的報(bào)道):“OpenAI 從整個(gè)互聯(lián)網(wǎng)竊取數(shù)據(jù)來讓自己變得更富有,而 DeepSeek 從他們那里竊取后又免費(fèi)回饋給大眾,這讓我想起了一個(gè)英國民間故事。”
但不只是 Fan 注意到了 DeepSeek 的成功。基于我與各種工程師、思想家和領(lǐng)導(dǎo)者的交談和閱讀,DeepSeek-R1 的開源可用性、其高性能表現(xiàn),以及它似乎“突然冒出來”就挑戰(zhàn)了前生成式 AI 領(lǐng)導(dǎo)者的事實(shí),在整個(gè)硅谷及其他地方引起了震動(dòng)。如果不是像我夸張的標(biāo)題所說的“所有人”都在為之瘋狂,它至少是科技和商業(yè)圈子里的熱門話題。
一條發(fā)布在 Blind(硅谷匿名八卦分享應(yīng)用)上的消息正在廣泛傳播,暗示 Meta 因 DeepSeek 的成功而陷入危機(jī),因?yàn)樗绱搜杆俚爻搅?Meta 自身通過 Llama 模型成為開源 AI 之王的努力。

X 用戶@tphuang 發(fā)表了令人信服的觀點(diǎn):“DeepSeek 已經(jīng)在最頂級(jí)之外實(shí)現(xiàn)了 AI 的商品化。第一張圖片讓我豁然開朗。R1 比美國的勞動(dòng)力成本低得多,這意味著未來 5 年內(nèi)許多工作將被自動(dòng)化取代。”他后來還指出了為什么 DeepSeek 的 R1 比 OpenAI 的 o1 對(duì)用戶更具吸引力:
“o1 有 3 個(gè)巨大問題:
1) 太慢
2) 太貴
3) 最終用戶缺乏控制權(quán)/過度依賴 OpenAI。
R1 解決了所有這些問題。公司可以購買自己的 Nvidia GPU 來運(yùn)行這些模型,不用擔(dān)心額外成本或 OpenAI 服務(wù)器反應(yīng)慢/不響應(yīng)的問題。”
@tphaung 還提出了一個(gè)發(fā)人深省的類比問題:“DeepSeek 會(huì)成為 LLM 領(lǐng)域的 Android 嗎?”
網(wǎng)絡(luò)企業(yè)家 Arnaud Bertrand 在 X 上直言不諱地談到了 DeepSeek 成功的驚人影響:“這對(duì)整個(gè)游戲規(guī)則的改變程度怎么強(qiáng)調(diào)都不過分。這不僅關(guān)系到 AI,也是對(duì)美國試圖阻止中國技術(shù)發(fā)展這一誤導(dǎo)性嘗試的巨大諷刺,如果沒有這種限制,DeepSeek 可能就不會(huì)出現(xiàn)(正如諺語所說,需求是發(fā)明之母)。”
然而,也有人對(duì) DeepSeek 的快速崛起提出警告,認(rèn)為作為一家在中國運(yùn)營(yíng)的初創(chuàng)公司,它必然要遵守該國的法律和內(nèi)容審查要求。事實(shí)上,在我本人在美國使用 iOS 版 DeepSeek 時(shí)就發(fā)現(xiàn),它不會(huì)回答某些問題。
作為新聞媒體的一員,我當(dāng)然非常重視言論和表達(dá)自由,這是我堅(jiān)定支持的最基本的理念之一。
然而,我也不得不指出,OpenAI 的模型和產(chǎn)品(包括 ChatGPT)同樣會(huì)拒絕回答一系列問題——特別是涉及人類性行為和成人/NSFW 內(nèi)容的問題,即使這些問題很普通。
當(dāng)然,這不是一個(gè)完全對(duì)等的比較。對(duì)某些人來說,對(duì)依賴外國技術(shù)的抵觸會(huì)讓他們對(duì) DeepSeek 的最終價(jià)值和實(shí)用性持懷疑態(tài)度。但其性能和低成本是無可否認(rèn)的。
在美國 16.5% 的商品都從中國進(jìn)口的時(shí)代,我很難僅僅基于審查擔(dān)憂或安全風(fēng)險(xiǎn)來警告不要使用 DeepSeek-R1——特別是當(dāng)模型代碼可以免費(fèi)下載、離線使用、在安全環(huán)境中設(shè)備上運(yùn)行,并且可以隨意微調(diào)的情況下。
我確實(shí)察覺到圍繞 DeepSeek 的熱烈討論中有一些關(guān)于“西方衰落”和“中國崛起”的存在主義危機(jī)思維。有人已經(jīng)將此與美國用戶在 TikTok 短暫被禁時(shí)加入小紅書(Xiaohongshu)App 的情況聯(lián)系起來,當(dāng)時(shí)他們對(duì)在那里分享的視頻中展示的中國生活質(zhì)量感到驚訝。DeepSeek-R1 的出現(xiàn)就發(fā)生在這樣的敘事背景下——在這個(gè)背景下,中國看起來(且在許多指標(biāo)上確實(shí))正在崛起,而美國看起來(且在許多指標(biāo)上也確實(shí))在衰落。
這也不會(huì)是最后一個(gè)威脅硅谷巨頭主導(dǎo)地位的中國 AI 模型——即使這些巨頭像OpenAI一樣,正在為其開發(fā)通用人工智能(AGI,即在大多數(shù)具有經(jīng)濟(jì)價(jià)值的工作中超越人類的程序)籌集比以往更多的資金。
就在昨天,另一個(gè)來自 TikTok 母公司字節(jié)跳動(dòng)的中國模型——Doubao-1.5-pro發(fā)布,其在第三方基準(zhǔn)測(cè)試中的表現(xiàn)與 OpenAI 的非推理型 GPT-4o 模型相當(dāng),但成本僅為后者的 1/50。
中國模型發(fā)展得如此之快、如此之好,以至于連科技行業(yè)之外的人也注意到了:《經(jīng)濟(jì)學(xué)人》雜志剛剛發(fā)表了一篇關(guān)于 DeepSeek 的成功和其他中國 AI 努力的文章,政治評(píng)論員 Matt Bruenig 在 X 上發(fā)文稱:“我已經(jīng)使用 Gemini、ChatGPT 和 Claude 進(jìn)行 NLRB 文檔總結(jié)將近一年了。Deepseek 在這方面比它們都要好。它的聊天機(jī)器人版本是免費(fèi)的。使用其 API 的價(jià)格比 OpenAI 的 API 低 99.5%。[聳肩表情]”
難怪 OpenAI 聯(lián)合創(chuàng)始人兼 CEO Sam Altman 今天表示,公司將把尚未發(fā)布的第二代推理模型系列 o3 引入 ChatGPT,甚至免費(fèi)用戶也可以使用。OpenAI 似乎仍在通過更專有和先進(jìn)的模型開辟自己的道路——設(shè)定行業(yè)標(biāo)準(zhǔn)。
但問題在于:隨著 DeepSeek、字節(jié)跳動(dòng)和其他中國 AI 公司緊隨其后,OpenAI 還能在制作和發(fā)布新的前沿 AI 模型方面保持領(lǐng)先多久?如果它真的落后了,其衰落會(huì)有多快、多嚴(yán)重?
不過,OpenAI 確實(shí)有另一個(gè)歷史先例可以借鑒。如果 DeepSeek 和中國 AI 模型確實(shí)像谷歌的開源 Android 之于移動(dòng)領(lǐng)域那樣——在一段時(shí)間內(nèi)占據(jù)了市場(chǎng)的大部分份額——你只需要看看蘋果 iPhone 是如何通過其封閉、專有、全內(nèi)部的方法占據(jù)了市場(chǎng)的高端部分,并從那里穩(wěn)步向下擴(kuò)張,特別是在美國,以至于現(xiàn)在擁有近 60% 的國內(nèi)智能手機(jī)市場(chǎng)份額。
盡管如此,對(duì)于所有正在花大價(jià)錢使用領(lǐng)先實(shí)驗(yàn)室 AI 模型的人來說,DeepSeek 表明,相同的功能可能以更低的價(jià)格獲得,并且能獲得更大的控制權(quán)。在企業(yè)環(huán)境中,這可能足以贏得勝利。