21世紀(jì)經(jīng)濟(jì)報道記者 趙云帆 報道
距離深度求索推理大模型 DeepSeek-R1 發(fā)布已經(jīng)過去約一周時間。
然而,在海外社交媒體,乃至于華爾街上, DeepSeek-R1 的熱度竟然才剛剛開始螺旋式上升。
1月24日,在國外大模型排名 Arena 上,DeepSeek-R1 基準(zhǔn)測試已經(jīng)升至全類別大模型第三,其中在風(fēng)格控制類模型(StyleCtrl)分類中與 OpenAI o1 并列第一。而其競技場得分達(dá)到1357分,略超 OpenAI o1 的1352分。
這是繼 DeepSeek-V3 在剔除 OpenAI o1 等閉源模型排名開源模型類第一后,DeepSeek-R1 向全球最強(qiáng) AI 大模型的再一次進(jìn)擊。
就在 Arena 放榜之后,全球關(guān)于 DeepSeek 的討論再次升級。驚嘆,溢美,甚至陰謀論都層出不窮。與此同時,美股市場 AI經(jīng)濟(jì)的狂歡,也開始在 DeepSeek 的影響下顫動。
美股的警鐘
就在 DeepSeek-R1 獲得風(fēng)格控制類模型得分第一之后,鮮有發(fā)聲的圖靈獎得主,Meta AI 首席科學(xué)家 Yann LeCun 24日在社交媒體上表示:“當(dāng)人們看到 DeepSeek 的表現(xiàn),驚呼‘中國AI正在趕超美國’,但這種解讀有誤。更準(zhǔn)確的結(jié)論是:開源模型正在超越閉源系統(tǒng)。DeepSeek的成功得益于開放生態(tài),其創(chuàng)新基于前人成果的持續(xù)迭代。
DeepSeek-R1 的發(fā)布,宛如一顆沉重的石子打入AI行業(yè)與AI投資的湖水之中,甚至開始令越來越多人警覺 AI 投資可能存在的泡沫。
美股大V “THE SHORT BEAR”在社交媒體上表示,DeepSeek 創(chuàng)造了一個 AI 巨頭們的痛苦時刻,而投資者必須對此敲響警鐘。
“如果擊敗 OpenAI 所需要的金額是 5500萬美元(包括5000個 H800 GPU和500萬預(yù)訓(xùn)練費用),那么這個行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多。”
該博客還指出:“根據(jù)紅杉,美國AI公司每年必須產(chǎn)生約6000億美元收入來支付其AI硬件費用。如果不跟進(jìn)(投資支出)就會被淘汰,那么大額資本支出以保持競爭力就是必要的——但現(xiàn)在看來,這種冒險行為變得越來越無利可圖。”
包括海外媒體 Vital Knowledge,德國世界報知名市場評論員 Holger Zschaepitz,都不約而同地把 DeepSeek 稱之為“美國股市最大的威脅”。
海外知名財經(jīng)博客 Zerohedge 24日撰文,稱 DeepSeek 的出現(xiàn)和其廉價的訓(xùn)練成本,正在對美國此前宣布的5000億美元AI基建計劃形成巨大的打擊。
網(wǎng)絡(luò)社群里,越來越多的人把 DeepSeek 的出現(xiàn)與近期英偉達(dá)的回調(diào)聯(lián)系在一起。
1月24日,英偉達(dá)股價大跌3.12%,報142.62美元/股,創(chuàng)下公司在年初 CES 展產(chǎn)品不及預(yù)期表現(xiàn)后的最大跌幅。
人紅是非多
DeepSeek 火到什么程度?海外社交媒體已經(jīng)對其進(jìn)行“花式贊美”,稱其不僅成本便宜,甚至只不過是一家對沖基金(幻方量化)的副產(chǎn)品。
當(dāng)然,人紅是非多——一個側(cè)寫來自于關(guān)于DeepSeek陰謀論的不斷出現(xiàn):一部分北美AI從業(yè)者普遍不相信 DeepSeek 的預(yù)訓(xùn)練費用只有區(qū)區(qū)不到 550 萬美元。
一個極端例子是 AI 科技初創(chuàng)公司 Scale AI 創(chuàng)始人 Alexandr Wang——其在2025年達(dá)沃斯論壇上接受采訪時,在未經(jīng)任何證實的情況下聲稱 DeepSeek 囤有五萬張英偉達(dá) H100 GPU,但因為芯片禁運并未對外公布。
也有AI行業(yè)人士懷疑,DeepSeek可能存在過度擬合基準(zhǔn)測試,在實際使用中可能會表現(xiàn)不佳。
“讓硅谷的AI模型創(chuàng)業(yè)者相信這些數(shù)字是不現(xiàn)實的,許多人一年的工資都比 DeepSeek 的訓(xùn)練費用高。”有人對此評論道。
好在,DeepSeek 選擇了最為開放的 MIT 標(biāo)準(zhǔn)作為開源協(xié)議。訓(xùn)練成本是否真的如此之低,有待公論。
近期,一則來自 Meta 匿名員工的消息稱,Meta 內(nèi)部近日啟動了一項通過 DeepSeek 開源論文復(fù)現(xiàn)其大模型的工作,試圖挖掘其是否真的只需要極低的預(yù)訓(xùn)練成本。
而屆時,DeepSeek 是否真的能改變整個AI經(jīng)濟(jì)的模型架構(gòu),可能將會有一個分曉。
阿里巴巴漲近4% 公司發(fā)布AI模型 聲稱超越DeepSeek
中國大模型掀起滔天巨浪!華爾街頂級風(fēng)投:“DeepSeek是AI的斯普特尼克時刻”
今年大漲30%后,明年誰還會買黃金?摩根大通:全球央媽,中國大媽和西方黃金ETF都有空間
OpenAI將于幾周內(nèi)推出o3 mini推理AI模型
進(jìn)軍文生圖 DeepSeek發(fā)布多模態(tài)模型Janus-Pro
隔夜要聞:美股收高 神秘買家已盯上英特爾 Altman回應(yīng)OpenAI討好特朗普 IMF上調(diào)全球經(jīng)濟(jì)增長預(yù)期
摩根士丹利:DeepSeek的成功可能會挑戰(zhàn)現(xiàn)狀,并促使人們重新評估已有的AI模型開發(fā)方法