超越OpenAI o1! DeepSeek-R1升至全球風(fēng)格控制類第一，“中國模型”震動華爾街

俞俊江 2025-01-25 滾動科技 13 次瀏覽 0個評論

21世紀(jì)經(jīng)濟(jì)報道記者趙云帆報道

距離深度求索推理大模型 DeepSeek-R1 發(fā)布已經(jīng)過去約一周時間。

然而，在海外社交媒體，乃至于華爾街上， DeepSeek-R1 的熱度竟然才剛剛開始螺旋式上升。

1月24日，在國外大模型排名 Arena 上，DeepSeek-R1 基準(zhǔn)測試已經(jīng)升至全類別大模型第三，其中在風(fēng)格控制類模型（StyleCtrl）分類中與 OpenAI o1 并列第一。而其競技場得分達(dá)到1357分，略超 OpenAI o1 的1352分。

這是繼 DeepSeek-V3 在剔除 OpenAI o1 等閉源模型排名開源模型類第一后，DeepSeek-R1 向全球最強(qiáng) AI 大模型的再一次進(jìn)擊。

就在 Arena 放榜之后，全球關(guān)于 DeepSeek 的討論再次升級。驚嘆，溢美，甚至陰謀論都層出不窮。與此同時，美股市場 AI經(jīng)濟(jì)的狂歡，也開始在 DeepSeek 的影響下顫動。

美股的警鐘

就在 DeepSeek-R1 獲得風(fēng)格控制類模型得分第一之后，鮮有發(fā)聲的圖靈獎得主，Meta AI 首席科學(xué)家 Yann LeCun 24日在社交媒體上表示：“當(dāng)人們看到 DeepSeek 的表現(xiàn)，驚呼‘中國AI正在趕超美國’，但這種解讀有誤。更準(zhǔn)確的結(jié)論是：開源模型正在超越閉源系統(tǒng)。DeepSeek的成功得益于開放生態(tài)，其創(chuàng)新基于前人成果的持續(xù)迭代。

DeepSeek-R1 的發(fā)布，宛如一顆沉重的石子打入AI行業(yè)與AI投資的湖水之中，甚至開始令越來越多人警覺 AI 投資可能存在的泡沫。

美股大V “THE SHORT BEAR”在社交媒體上表示，DeepSeek 創(chuàng)造了一個 AI 巨頭們的痛苦時刻，而投資者必須對此敲響警鐘。

“如果擊敗 OpenAI 所需要的金額是 5500萬美元（包括5000個 H800 GPU和500萬預(yù)訓(xùn)練費用），那么這個行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多。”

該博客還指出：“根據(jù)紅杉，美國AI公司每年必須產(chǎn)生約6000億美元收入來支付其AI硬件費用。如果不跟進(jìn)（投資支出）就會被淘汰，那么大額資本支出以保持競爭力就是必要的——但現(xiàn)在看來，這種冒險行為變得越來越無利可圖。”

包括海外媒體 Vital Knowledge，德國世界報知名市場評論員 Holger Zschaepitz，都不約而同地把 DeepSeek 稱之為“美國股市最大的威脅”。

海外知名財經(jīng)博客 Zerohedge 24日撰文，稱 DeepSeek 的出現(xiàn)和其廉價的訓(xùn)練成本，正在對美國此前宣布的5000億美元AI基建計劃形成巨大的打擊。

網(wǎng)絡(luò)社群里，越來越多的人把 DeepSeek 的出現(xiàn)與近期英偉達(dá)的回調(diào)聯(lián)系在一起。

1月24日，英偉達(dá)股價大跌3.12%，報142.62美元/股，創(chuàng)下公司在年初 CES 展產(chǎn)品不及預(yù)期表現(xiàn)后的最大跌幅。

人紅是非多

DeepSeek 火到什么程度？海外社交媒體已經(jīng)對其進(jìn)行“花式贊美”，稱其不僅成本便宜，甚至只不過是一家對沖基金（幻方量化）的副產(chǎn)品。

當(dāng)然，人紅是非多——一個側(cè)寫來自于關(guān)于DeepSeek陰謀論的不斷出現(xiàn)：一部分北美AI從業(yè)者普遍不相信 DeepSeek 的預(yù)訓(xùn)練費用只有區(qū)區(qū)不到 550 萬美元。

一個極端例子是 AI 科技初創(chuàng)公司 Scale AI 創(chuàng)始人 Alexandr Wang——其在2025年達(dá)沃斯論壇上接受采訪時，在未經(jīng)任何證實的情況下聲稱 DeepSeek 囤有五萬張英偉達(dá) H100 GPU，但因為芯片禁運并未對外公布。

也有AI行業(yè)人士懷疑，DeepSeek可能存在過度擬合基準(zhǔn)測試，在實際使用中可能會表現(xiàn)不佳。

“讓硅谷的AI模型創(chuàng)業(yè)者相信這些數(shù)字是不現(xiàn)實的，許多人一年的工資都比 DeepSeek 的訓(xùn)練費用高。”有人對此評論道。

好在，DeepSeek 選擇了最為開放的 MIT 標(biāo)準(zhǔn)作為開源協(xié)議。訓(xùn)練成本是否真的如此之低，有待公論。

近期，一則來自 Meta 匿名員工的消息稱，Meta 內(nèi)部近日啟動了一項通過 DeepSeek 開源論文復(fù)現(xiàn)其大模型的工作，試圖挖掘其是否真的只需要極低的預(yù)訓(xùn)練成本。

而屆時，DeepSeek 是否真的能改變整個AI經(jīng)濟(jì)的模型架構(gòu)，可能將會有一個分曉。

你可能想看：

阿里巴巴漲近4% 公司發(fā)布AI模型聲稱超越DeepSeek

中國大模型掀起滔天巨浪！華爾街頂級風(fēng)投：“DeepSeek是AI的斯普特尼克時刻”

全球汽車銷量榜TOP10國家榜出爐：中國第一超美日德之和

今年大漲30%后，明年誰還會買黃金？摩根大通：全球央媽，中國大媽和西方黃金ETF都有空間

OpenAI將于幾周內(nèi)推出o3 mini推理AI模型

進(jìn)軍文生圖 DeepSeek發(fā)布多模態(tài)模型Janus-Pro