DeepSeek為什么讓西方 AI 從業(yè)者人人自危？

訪客 10個(gè)月前 (01-27) 閱讀數(shù) 3948 #區(qū)塊鏈

文章標(biāo)簽前沿文章

作者：Carl Franzen；編譯：深潮 TechFlow

就在幾天前，只有最專業(yè)的極客們（作為其中一員，我這樣說）才聽說過 DeepSeek，這是一家中國 AI 公司，是同樣具有獨(dú)特名字的 High-Flyer Capital Management（一家于 2015 年成立的量化分析公司）的子公司。然而在過去的幾天里，它可能成為了硅谷最受關(guān)注的公司。

這主要?dú)w功于 DeepSeek-R1 的發(fā)布，這是一個(gè)新的大語言模型（LLM），它能夠進(jìn)行類似于 OpenAI 當(dāng)前最佳模型 o1 的“推理”——在回答困難問題和解決復(fù)雜問題時(shí)需要花費(fèi)數(shù)秒或數(shù)分鐘，通過步驟式或“思維鏈”的方式對(duì)自身的分析進(jìn)行反思。

不僅如此，DeepSeek-R1 在各種第三方基準(zhǔn)測(cè)試（用于測(cè)量 AI 在各種主題上回答問題的性能的測(cè)試）中的得分與 OpenAI 的 o1 持平或更高，而且據(jù)報(bào)道其訓(xùn)練成本僅為約 500 萬美元，使用的圖形處理器（GPU）數(shù)量也遠(yuǎn)遠(yuǎn)少于美國（OpenAI 的大本營(yíng)）嚴(yán)格禁運(yùn)的數(shù)量。

但與 o1 不同的是，o1 只向付費(fèi)的 ChatGPT Plus 級(jí)別訂閱者（每月 20 美元）和更高級(jí)別的訂閱者（如每月 200 美元的 Pro 級(jí)別）開放，而 DeepSeek-R1 是作為完全開源模型發(fā)布的，這也解釋了為什么它迅速攀升至 AI 代碼共享社區(qū) Hugging Face 最受歡迎和最活躍模型的榜首。

而且，由于它是完全開源的，人們已經(jīng)對(duì)該模型進(jìn)行了多種微調(diào)和訓(xùn)練，以適應(yīng)不同的特定任務(wù)，比如使其小到可以在移動(dòng)設(shè)備上運(yùn)行，或者與其他開源模型結(jié)合使用。即使你想將其用于開發(fā)目的，DeepSeek 的 API 成本也比 OpenAI 的同等 o1 模型低 90%?以上。

最令人印象深刻的是，你甚至不需要是軟件工程師就能使用它：DeepSeek 為美國用戶提供了免費(fèi)的網(wǎng)站和移動(dòng)應(yīng)用，其 R1 驅(qū)動(dòng)的聊天機(jī)器人界面與 OpenAI 的 ChatGPT 非常相似。不過，DeepSeek 再次通過將這個(gè)強(qiáng)大的推理模型與網(wǎng)絡(luò)搜索連接起來超越了 OpenAI——這是OpenAI目前還沒有實(shí)現(xiàn)的（網(wǎng)絡(luò)搜索目前只在功能較弱的GPT系列模型上可用）。

一個(gè)顯而易見的諷刺

考慮到 OpenAI 最初致力于為大眾民主化 AI 的目標(biāo)，這里存在著一個(gè)相當(dāng)有趣，或者說令人不安的諷刺。正如 Nvidia 高級(jí)研究經(jīng)理 Jim Fan 在 X 上所說：“我們正生活在這樣一個(gè)時(shí)間線里：一家非美國公司正在延續(xù)著 OpenAI 的原始使命——真正開放的前沿研究，賦能所有人。這說不通。但最有趣的結(jié)果往往就是最可能發(fā)生的。”

又如 X 用戶@SuspendedRobot 所說（引用了有關(guān) DeepSeek 似乎是在 ChatGPT 生成的問答輸出和其他數(shù)據(jù)上訓(xùn)練的報(bào)道）：“OpenAI 從整個(gè)互聯(lián)網(wǎng)竊取數(shù)據(jù)來讓自己變得更富有，而 DeepSeek 從他們那里竊取后又免費(fèi)回饋給大眾，這讓我想起了一個(gè)英國民間故事。”

Meta 陷入危機(jī)，因開源 Llama 落后？

但不只是 Fan 注意到了 DeepSeek 的成功。基于我與各種工程師、思想家和領(lǐng)導(dǎo)者的交談和閱讀，DeepSeek-R1 的開源可用性、其高性能表現(xiàn)，以及它似乎“突然冒出來”就挑戰(zhàn)了前生成式 AI 領(lǐng)導(dǎo)者的事實(shí)，在整個(gè)硅谷及其他地方引起了震動(dòng)。如果不是像我夸張的標(biāo)題所說的“所有人”都在為之瘋狂，它至少是科技和商業(yè)圈子里的熱門話題。

一條發(fā)布在 Blind（硅谷匿名八卦分享應(yīng)用）上的消息正在廣泛傳播，暗示 Meta 因 DeepSeek 的成功而陷入危機(jī)，因?yàn)樗绱搜杆俚爻搅?Meta 自身通過 Llama 模型成為開源 AI 之王的努力。

“這改變了整個(gè)游戲規(guī)則”

X 用戶@tphuang 發(fā)表了令人信服的觀點(diǎn)：“DeepSeek 已經(jīng)在最頂級(jí)之外實(shí)現(xiàn)了 AI 的商品化。第一張圖片讓我豁然開朗。R1 比美國的勞動(dòng)力成本低得多，這意味著未來 5 年內(nèi)許多工作將被自動(dòng)化取代。”他后來還指出了為什么 DeepSeek 的 R1 比 OpenAI 的 o1 對(duì)用戶更具吸引力：

“o1 有 3 個(gè)巨大問題：

1) 太慢

2) 太貴

3) 最終用戶缺乏控制權(quán)/過度依賴 OpenAI。

R1 解決了所有這些問題。公司可以購買自己的 Nvidia GPU 來運(yùn)行這些模型，不用擔(dān)心額外成本或 OpenAI 服務(wù)器反應(yīng)慢/不響應(yīng)的問題。”

@tphaung 還提出了一個(gè)發(fā)人深省的類比問題：“DeepSeek 會(huì)成為 LLM 領(lǐng)域的 Android 嗎？”

網(wǎng)絡(luò)企業(yè)家 Arnaud Bertrand 在 X 上直言不諱地談到了 DeepSeek 成功的驚人影響：“這對(duì)整個(gè)游戲規(guī)則的改變程度怎么強(qiáng)調(diào)都不過分。這不僅關(guān)系到 AI，也是對(duì)美國試圖阻止中國技術(shù)發(fā)展這一誤導(dǎo)性嘗試的巨大諷刺，如果沒有這種限制，DeepSeek 可能就不會(huì)出現(xiàn)（正如諺語所說，需求是發(fā)明之母）。”

審查問題

然而，也有人對(duì) DeepSeek 的快速崛起提出警告，認(rèn)為作為一家在中國運(yùn)營(yíng)的初創(chuàng)公司，它必然要遵守該國的法律和內(nèi)容審查要求。事實(shí)上，在我本人在美國使用 iOS 版 DeepSeek 時(shí)就發(fā)現(xiàn)，它不會(huì)回答某些問題。

作為新聞媒體的一員，我當(dāng)然非常重視言論和表達(dá)自由，這是我堅(jiān)定支持的最基本的理念之一。

然而，我也不得不指出，OpenAI 的模型和產(chǎn)品（包括 ChatGPT）同樣會(huì)拒絕回答一系列問題——特別是涉及人類性行為和成人/NSFW 內(nèi)容的問題，即使這些問題很普通。

當(dāng)然，這不是一個(gè)完全對(duì)等的比較。對(duì)某些人來說，對(duì)依賴外國技術(shù)的抵觸會(huì)讓他們對(duì) DeepSeek 的最終價(jià)值和實(shí)用性持懷疑態(tài)度。但其性能和低成本是無可否認(rèn)的。

在美國 16.5% 的商品都從中國進(jìn)口的時(shí)代，我很難僅僅基于審查擔(dān)憂或安全風(fēng)險(xiǎn)來警告不要使用 DeepSeek-R1——特別是當(dāng)模型代碼可以免費(fèi)下載、離線使用、在安全環(huán)境中設(shè)備上運(yùn)行，并且可以隨意微調(diào)的情況下。

我確實(shí)察覺到圍繞 DeepSeek 的熱烈討論中有一些關(guān)于“西方衰落”和“中國崛起”的存在主義危機(jī)思維。有人已經(jīng)將此與美國用戶在 TikTok 短暫被禁時(shí)加入小紅書（Xiaohongshu）App 的情況聯(lián)系起來，當(dāng)時(shí)他們對(duì)在那里分享的視頻中展示的中國生活質(zhì)量感到驚訝。DeepSeek-R1 的出現(xiàn)就發(fā)生在這樣的敘事背景下——在這個(gè)背景下，中國看起來（且在許多指標(biāo)上確實(shí)）正在崛起，而美國看起來（且在許多指標(biāo)上也確實(shí)）在衰落。

第一個(gè)但絕非最后一個(gè)震撼世界的中國 AI 模型

這也不會(huì)是最后一個(gè)威脅硅谷巨頭主導(dǎo)地位的中國 AI 模型——即使這些巨頭像OpenAI一樣，正在為其開發(fā)通用人工智能（AGI，即在大多數(shù)具有經(jīng)濟(jì)價(jià)值的工作中超越人類的程序）籌集比以往更多的資金。

就在昨天，另一個(gè)來自 TikTok 母公司字節(jié)跳動(dòng)的中國模型——Doubao-1.5-pro發(fā)布，其在第三方基準(zhǔn)測(cè)試中的表現(xiàn)與 OpenAI 的非推理型 GPT-4o 模型相當(dāng)，但成本僅為后者的 1/50。

中國模型發(fā)展得如此之快、如此之好，以至于連科技行業(yè)之外的人也注意到了：《經(jīng)濟(jì)學(xué)人》雜志剛剛發(fā)表了一篇關(guān)于 DeepSeek 的成功和其他中國 AI 努力的文章，政治評(píng)論員 Matt Bruenig 在 X 上發(fā)文稱：“我已經(jīng)使用 Gemini、ChatGPT 和 Claude 進(jìn)行 NLRB 文檔總結(jié)將近一年了。Deepseek 在這方面比它們都要好。它的聊天機(jī)器人版本是免費(fèi)的。使用其 API 的價(jià)格比 OpenAI 的 API 低 99.5%。[聳肩表情]”

OpenAI 如何應(yīng)對(duì)？

難怪 OpenAI 聯(lián)合創(chuàng)始人兼 CEO Sam Altman 今天表示，公司將把尚未發(fā)布的第二代推理模型系列 o3 引入 ChatGPT，甚至免費(fèi)用戶也可以使用。OpenAI 似乎仍在通過更專有和先進(jìn)的模型開辟自己的道路——設(shè)定行業(yè)標(biāo)準(zhǔn)。

但問題在于：隨著 DeepSeek、字節(jié)跳動(dòng)和其他中國 AI 公司緊隨其后，OpenAI 還能在制作和發(fā)布新的前沿 AI 模型方面保持領(lǐng)先多久？如果它真的落后了，其衰落會(huì)有多快、多嚴(yán)重？

不過，OpenAI 確實(shí)有另一個(gè)歷史先例可以借鑒。如果 DeepSeek 和中國 AI 模型確實(shí)像谷歌的開源 Android 之于移動(dòng)領(lǐng)域那樣——在一段時(shí)間內(nèi)占據(jù)了市場(chǎng)的大部分份額——你只需要看看蘋果 iPhone 是如何通過其封閉、專有、全內(nèi)部的方法占據(jù)了市場(chǎng)的高端部分，并從那里穩(wěn)步向下擴(kuò)張，特別是在美國，以至于現(xiàn)在擁有近 60% 的國內(nèi)智能手機(jī)市場(chǎng)份額。

盡管如此，對(duì)于所有正在花大價(jià)錢使用領(lǐng)先實(shí)驗(yàn)室 AI 模型的人來說，DeepSeek 表明，相同的功能可能以更低的價(jià)格獲得，并且能獲得更大的控制權(quán)。在企業(yè)環(huán)境中，這可能足以贏得勝利。

上一篇：奧地利加密獨(dú)角獸公司Bitpanda獲德國MiCA牌照下一篇：ZK Nation：AAVE DAO空投申領(lǐng)延期申請(qǐng)投票已達(dá)法定人數(shù)

相關(guān)文章