亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app

AI交易大賽落幕 國產模型奪冠 GPT-5虧損60%

訪客 2周前 (11-04) 閱讀數 216 #區塊鏈
文章標簽 前沿文章

作者:Sleepy.txt

11月4日凌晨,備受矚目的 Alpha Arena AI 交易大賽落幕。

結果出乎所有人的意料,阿里巴巴的 Qwen 3 Max 以 22.32% 的收益率奪冠,另一家中國公司 DeepSeek 位居第二,收益率 4.89%。

而來自硅谷的四位明星選手則全線潰敗。OpenAI 的 GPT-5 虧損 62.66%,Google 的 Gemini 2.5 Pro 虧損 56.71%,馬斯克旗下的 Grok 4 虧損 45.3%,Anthropic 的 Claude 4.5 Sonnet 也虧損了 30.81%。

所有模型的交易曲線|圖源:nof1

這場比賽其實是一場特殊的實驗。10 月 17 日,美國研究公司 Nof1.ai 將六個全球頂尖的大語言模型投入真實的加密貨幣市場,每個模型都獲得 1 萬美元初始資金,在去中心化交易平臺 Hyperliquid 上進行為期 17 天的永續合約交易。永續合約是一種沒有到期日的衍生品,允許交易者通過杠桿放大收益,不過與此同時也會放大風險。

這些 AI 的起點相同,市場數據也相同,但最終結果卻完全不同。

這不是一次在虛擬環境中的跑分測試,而是一場真金白銀的生存游戲。當 AI 離開實驗室的「無菌」環境,第一次面對動態、對抗、充滿不確定性的真實市場,它們的選擇將不再由模型參數決定,而是由對風險、貪婪與恐懼的理解決定。

這場實驗讓人們第一次看到當所謂的「智能」面對真實世界的復雜性時,模型的優雅表現往往難以為繼,暴露出訓練之外的缺陷。

從做題家到交易員

長久以來,人們用各種靜態基準來衡量 AI 的能力。

從 MMLU 到 HumanEval,AI 在這些標準化考卷上拿到越來越高的分數,甚至已經超過人類。但這些測試的本質,就像在一間安靜的房間里做題,而且題目和答案都是固定的,AI 只需要在海量數據中尋找最優解。哪怕是最復雜的數學題,它也可以把答案背下來。

而真實世界,尤其是金融市場,完全不同。

那不是一個靜止的題庫,而是一座不斷變化、充滿噪音與欺騙的競技場。這里是零和博弈,一個人的盈利必然意味著另一個人的虧損。價格的波動從來不只是理性的計算結果,也被人類的情緒裹挾著,貪婪、恐懼、僥幸、猶豫,在每一次價格跳動中都清晰可見。

更復雜的是,市場本身會對人的行為做出反應,當所有人都相信價格會漲時,價格往往已經漲到了頂點。

這種反饋的機制不斷修正、反噬、懲罰確定性,也讓任何靜態測試都顯得蒼白無力。

Nof1.ai 發起的 Alpha Arena 就是想把 AI 扔進一個真實的社會熔爐。每個模型都被給予真金白銀,虧損是真虧,盈利也是真賺。

模型必須獨立完成分析、決策、下單和風控。這等于是給了每個 AI 一間獨立的交易室,讓它從「做題家」變成「交易員」。它要決定的不只是開倉方向,還包括倉位的大小、出手的時機,以及要不要止損或者止盈。

不同模型的操作記錄|圖源:nof1

更重要的是,它們的每一個決策都會改變實驗環境,買入推高價格,賣出壓低價格,止損可能保命,也可能錯過反彈。市場是流動的,任何一步都在塑造下一步的局面。

這場實驗想回答的是一個更根本的問題,AI 是否真正理解風險。

在靜態測試中,它可以靠記憶與模式匹配無限接近「正確答案」;但在一個沒有標準答案、充滿噪音與反饋的真實市場里,當它必須在不確定中行動時,它的「智能」還能維持多久?

市場給 AI 上了一課

比賽的進程比想象中更戲劇性。

10 月中旬,加密貨幣市場波動劇烈,比特幣的價格幾乎每天都在上躥下跳。六個 AI 模型,就是在這樣的環境里開始了它們的首次實盤交易。

競賽期間比特幣價格走勢|圖源:TradingView

到 10 月 28 日,也就是比賽過半時,中期榜單出爐。DeepSeek 的賬戶價值飆升至 2.25 萬美元,收益率高達 125%。換句話說,它在短短 11 天內就讓資金翻了一倍還多。

阿里巴巴的 Qwen 緊隨其后,收益率突破 100%。就連后來敗下陣來的 Claude 和 Grok,當時也還保持著 24% 和 13% 的盈利。

社交媒體迅速沸騰起來。有人開始討論是否該把自己的投資組合交給 AI 管理,也有人半開玩笑地說也許 AI 真的找到了穩賺不賠的交易密碼。

然而,市場的殘酷很快顯現出來。

進入 11 月初,比特幣在 11 萬美元附近徘徊,波動性急劇放大。那些在上漲階段一路加碼的模型,在市場掉頭的瞬間遭遇重創。

最后,只剩下兩個來自中國的模型守住了利潤,美國陣營的表現則是一場潰敗。這場過山車般的比賽,讓我們第一次清楚地看到,那些我們原以為遙遙領先的 AI,在真實市場面前并沒有想象中那樣聰明。

交易策略的分野

從交易數據里,能看出每個 AI 的「性格」。

Qwen 在 17 天里只交易了 43 次,平均每天不到三次,是所有選手中最克制的一個。它的勝率并不突出,但每次出手的盈虧比極高,單筆最大盈利達到 8176 美元。

換句話說,Qwen 并不是「預測最準」,而是「下注最有紀律」。它只在確定的時刻行動,而在不確定時選擇按兵不動。這種高信號質量策略,讓它在市場回調時回撤有限,最終保住了勝利果實。

DeepSeek 的出手次數與 Qwen 相近,17 天里只有 41 次,但它的表現更像一名謹慎的基金經理。它的夏普比率在所有選手中最高,達到 0.359,在高波動的加密貨幣市場,這個數字已經相當難得。

放在傳統金融市場,夏普比率通常用來衡量風險調整后的收益。數值越高,說明策略越穩健。但在這樣短的周期、這樣劇烈的行情里,任何能保持正值的模型都不簡單。DeepSeek 的成績說明它并不追求最大化收益,而是在高噪音環境下努力維持平衡。

整個比賽期間,它始終保持節奏,不追漲、不盲動。更像一個有嚴格系統的交易員,寧可放棄機會,也不讓情緒主導決策。

相比之下,美國 AI 陣營的表現暴露出明顯的風險控制問題。

Google 的 Gemini 在 17 天里共下了 238 單,平均每天 13 次以上,是所有選手中最頻繁的。如此高頻的出手也帶來了巨大的成本,光手續費就耗掉 1,331 美元,占初始本金的 13%。在起始資金只有 1 萬美元的比賽里,這是一種巨大的自我消耗。

更糟的是,這種頻繁交易并沒有帶來額外收益。Gemini 不斷地試錯、止損、再試錯,像一個沉迷盯盤的散戶,被市場的噪音牽著鼻子走。每一次細微的價格波動,都會觸發它的交易指令。它對波動的反應過快,卻對風險的感知過慢。

在行為金融學里,這種失衡有個名字,過度自信。交易者高估了自己的預測能力,卻忽視了不確定性和成本的積累。Gemini 的失敗正是這種盲目自信的典型后果。

GPT-5 的表現最讓人失望。它的出手次數并不算多,17 天里一共 116 次,但幾乎沒有風險控制。最大單筆虧損達到 622 美元,而最大盈利只有 271 美元,盈虧比嚴重失衡。它像一個被信心驅動的賭徒,在行情順風時偶爾能贏上一局,但一旦市場反轉,虧損便成倍放大。

它的夏普比率為 -0.525,這意味著承擔的風險沒有換來任何回報。放在投資領域,這樣的結果幾乎等于「還不如不操作」。

這場實驗再次證明,真正決定勝負的不是模型預測的準確率,而是它如何處理不確定性。Qwen 和 DeepSeek 的勝出本質上是風控的勝出。它們似乎更理解,在市場里,先活下來才有資格談聰明。

真實市場是 AI 的照妖鏡

Alpha Arena 的結果,對當下的 AI 評測體系是一記重重的嘲諷。那些在 MMLU 等基準測試中名列前茅的「聰明模型」來到真實市場時卻節節敗退。

這些模型是由無數文本堆疊出來的語言大師,能生成邏輯嚴密、語法完美的答案,卻未必懂得那些文字真正指向的現實。

一個 AI 可以在幾秒鐘里寫出一篇關于風險管理的論文,引用得體、推理完備;它也能準確解釋什么是夏普比率、最大回撤和風險價值。但當它真正握著資金時,卻可能做出最冒險的決定。因為它只是「知道」,并不「理解」。

知道和理解,是兩回事。

能說和能做,更是天差地別。

這種差距,在哲學上叫作知識論問題。柏拉圖曾經區分了知識和真實信念。知識不僅僅是正確的信息,還需要理解為什么它是正確的。

今天的大語言模型,也許擁有無數「正確的信息」,但它并沒有那種理解。它可以告訴你風險管理的重要性,卻不知道那份重要性是如何在恐懼與損失中被人類學會的。

真實的市場,才是檢驗理解能力的終極場所。它不會因為你是 GPT-5 而網開一面,每一個錯誤的決策都會立刻以資金的虧損形式反饋到賬戶上。

在實驗室里,AI 可以無數次重來,不斷調參、回測,直到找到所謂的「正確答案」。但在市場里,每一次失誤都意味著真金白銀的損失,而這種損失沒有回頭路。

市場的邏輯也遠比模型想象得復雜。當本金虧損 50% 時,需要 100% 的收益才能回到起點;當虧損擴大到 62.66% 時,回本所需的收益將飆升至 168%。這種非線性的風險,使得錯誤的代價被成倍放大。AI 在訓練中可以通過算法最小化損失,卻無法真正體會這種由恐懼、猶豫和貪婪共同塑造的市場懲罰機制。

正因如此,市場才成了檢驗智能真偽的照妖鏡,它能讓人,也讓機器,看清自己究竟懂了什么,又真正害怕什么。

這場比賽也讓人重新思考中美在 AI 研發思路上的差異。

美國的幾家主流公司依然堅持通用模型路線,希望構建能夠在廣泛任務中展現穩定能力的系統。OpenAI、Google、Anthropic 的模型都屬于這種類型,它們的目標是追求廣度與一致性,讓模型具備跨領域的理解與推理能力。

而中國團隊更傾向于在模型研發的早期就考慮具體場景的落地與反饋機制。阿里巴巴的 Qwen 雖然同樣是一款通用大模型,但它的訓練和測試環境更早與實際業務系統打通,這種來自真實場景的數據回流,可能在無形中讓模型更敏感于風險與約束。DeepSeek 的表現也顯示出類似特征,它似乎在動態環境中能更快地校正決策。

這并不是「誰贏誰輸」的問題。這場實驗提供了一個窗口,讓我們看到不同訓練哲學在現實世界中的表現差異。通用模型強調普適性,卻容易在極端環境下暴露出反應遲鈍的問題;而那些更早接觸真實反饋的模型,可能在復雜系統中顯得更靈活、更穩當。

當然,一場比賽的結果可能并不能代表中美 AI 的整體實力。十七天的交易周期太短,運氣的影響難以排除;如果時間拉長,走勢或許會完全不同。更何況這次測試只涉及加密貨幣永續合約交易,既不能外推到所有金融市場,也不足以概括 AI 在其他領域的表現。

但它足以讓人重新思考什么才算真正的能力。當 AI 被放進真實環境、需要在風險與不確定中作出決策時,我們看到的不只是算法的勝負,更是路徑的差異。在把 AI 技術轉化為實際生產力的這條賽道上,中國的模型在某些具體領域,已經走在了前面。

比賽結束的那一刻,Qwen 的最后一個比特幣持倉被平掉,賬戶余額定格在 12,232 美元。它贏了,但它并不知道自己贏了。那 22.32% 的收益對它來說沒有意義,這只是又一次的執行指令。

在硅谷,工程師們或許還在為 GPT-5 的 MMLU 分數又提高了 0.1% 而慶祝。而在地球的另一端,來自中國的 AI,剛剛在真金白銀的賭場里,用最樸素的方式證明了,能賺錢的才是好 AI。

Nof1.ai 宣布下一季比賽即將啟動,周期會更長,參與者會更多,市場環境也會更復雜。那些在第一季中失手的模型,會從虧損中學到什么嗎?還是會在更大的波動里重演同樣的命運?

沒有人知道答案。但可以確定的是,當 AI 開始走出象牙塔,用真金白銀證明自己時,一切都變得不一樣了。

熱門
亚洲日本一区二区三区在线_久久久不卡国产精品一区二区_精品日韩一区二区_国产一区二区在线观看app
  • <strike id="ykeqq"><input id="ykeqq"></input></strike>
  • <strike id="ykeqq"><menu id="ykeqq"></menu></strike>
    <strike id="ykeqq"></strike>
    <fieldset id="ykeqq"></fieldset>
    <del id="ykeqq"><dfn id="ykeqq"></dfn></del>
    午夜视频精品| 欧美色区777第一页| 猫咪成人在线观看| 欧美视频在线观看| 尤物九九久久国产精品的特点| 先锋影音国产精品| 欧美国产日韩一区| 国产日韩视频| 久久国产视频网| 欧美三级资源在线| 亚洲视频精品在线| 蜜臀a∨国产成人精品| 国产精品中文在线| 欧美影院在线播放| 欧美午夜www高清视频| 亚洲午夜性刺激影院| 欧美顶级大胆免费视频| 国产有码一区二区| 久久人人九九| 国产视频精品网| 久久精品动漫| 国产精品一二三视频| 欧美与黑人午夜性猛交久久久| 欧美日本在线观看| 亚洲小视频在线观看| 欧美精品一区二区三| 在线综合亚洲欧美在线视频| 欧美成人资源| 尤物精品在线| 欧美日韩国产二区| 亚洲综合精品四区| 国产精品久久久久9999吃药| 欧美一区2区三区4区公司二百| 欧美性猛交xxxx乱大交退制版| 亚洲中字黄色| 国产精品久久久久久久久久久久久 | 国产精品久久久一区二区| 亚洲免费影院| 国产精品高潮呻吟久久av黑人| 午夜国产精品影院在线观看| 欧美图区在线视频| 欧美一区二区三区日韩| 国产精品人人爽人人做我的可爱| 久久成人精品无人区| 国产精品永久免费视频| 久热精品视频在线观看| 韩国av一区二区三区在线观看| 欧美jjzz| 亚洲一区二区在线播放| 国产精品久久久久婷婷| 久久在线精品| 中文在线不卡视频| 国产精品成人一区二区艾草| 久久久精品国产一区二区三区| 国产亚洲欧美在线| 欧美激情一区三区| 午夜激情亚洲| 国产伊人精品| 欧美日韩一区二区三区四区五区| 欧美在线播放| 极品尤物久久久av免费看| 欧美视频在线看| 久久永久免费| 亚洲欧美日韩另类| 国产深夜精品福利| 欧美日韩一区二区三区在线| 久久精品免费电影| 在线观看欧美亚洲| 国产精品日本精品| 欧美精品色网| 久久久久五月天| 亚洲欧美国产精品专区久久| 国产午夜精品在线观看| 欧美日韩一区二区三区视频| 久久色在线观看| 午夜精品久久久久久久蜜桃app | 极品日韩av| 国产精品男人爽免费视频1| 欧美大色视频| 久久手机精品视频| 亚洲欧美激情视频| 一区福利视频| 国产欧美精品va在线观看| 欧美人体xx| 麻豆av福利av久久av| 欧美一级片在线播放| 揄拍成人国产精品视频| 国产伦精品一区二区三区四区免费 | 久久三级视频| 性欧美18~19sex高清播放| 一区二区在线观看av| 国产农村妇女毛片精品久久麻豆 | 亚洲欧美日韩成人高清在线一区| 国产有码一区二区| 国产精品爽爽爽| 欧美日韩亚洲一区二| 欧美xx69| 久久性天堂网| 欧美中文字幕在线| 亚洲女优在线| 1024亚洲| 伊人久久亚洲影院| 国产一区二区电影在线观看| 国产精品欧美风情| 欧美性猛交99久久久久99按摩 | 欧美在线不卡视频| 亚洲综合日韩在线| 中文日韩在线| 中日韩视频在线观看| 国内免费精品永久在线视频| 国产乱码精品一区二区三区忘忧草| 欧美日韩国产精品成人| 欧美黄色网络| 嫩草国产精品入口| 女同性一区二区三区人了人一| 久久婷婷一区| 久久一综合视频| 久久永久免费| 六十路精品视频| 牛牛精品成人免费视频| 免费成人性网站| 欧美69wwwcom| 欧美大片免费观看| 欧美高潮视频| 欧美风情在线观看| 欧美精品三区| 欧美日韩在线电影| 欧美性大战久久久久| 国产精品另类一区| 国产精品美女在线观看| 国产精品综合| 国产一区二区三区不卡在线观看| 国产在线精品一区二区夜色| 狠狠操狠狠色综合网| …久久精品99久久香蕉国产 | 久久久久久网站| 久久久久久久一区二区三区| 久久久久久999| 裸体歌舞表演一区二区| 欧美成人午夜激情在线| 欧美理论电影在线观看| 欧美日韩亚洲一区二区三区| 欧美色视频日本高清在线观看| 国产精品福利在线| 国产精品视频大全| 国产日韩一级二级三级| 狠狠色狠狠色综合| 亚洲亚洲精品在线观看 | 1000精品久久久久久久久 | 欧美日韩亚洲一区二区三区四区| 欧美性做爰毛片| 国产日韩欧美不卡在线| 精品成人久久| 午夜精品一区二区三区四区| 久久精品人人爽| 欧美a级片网站| 国产精品成人v| 国语自产精品视频在线看抢先版结局| 狠狠色综合一区二区| 亚洲一区二区在| 久久精品电影| 欧美精品一区二区三区蜜桃 | 欧美一区亚洲一区| 米奇777在线欧美播放| 欧美日韩人人澡狠狠躁视频| 国产精品爽爽爽| 亚洲视屏在线播放| 久久精品一级爱片| 欧美女同视频| 国产一区二区精品在线观看| 亚洲小说区图片区| 久久亚洲美女| 欧美午夜片在线观看| 国模大胆一区二区三区| 性做久久久久久久免费看| 美日韩精品免费观看视频| 欧美视频福利| 一区二区三区在线视频播放| 欧美在线地址| 欧美日韩国产精品成人| 国内精品久久久久久久影视麻豆| 午夜国产精品视频免费体验区| 麻豆成人91精品二区三区| 国产精品久久久久久久久免费 | 国产精品视频精品视频| 亚洲无亚洲人成网站77777| 久久天堂av综合合色| 欧美日韩一区二区免费视频| 国产一区二区精品在线观看| 午夜精品亚洲| 欧美欧美在线| 精品99视频| 鲁大师成人一区二区三区| 国产精品久久久久秋霞鲁丝| 亚洲先锋成人| 欧美成人精品在线| 国产免费一区二区三区香蕉精| 午夜精品视频网站| 欧美精品久久久久久久久久| 国外成人在线视频网站|