疯狂添女人下部视频免费_91啪国自产中文字幕在线_幸福宝8008app_黄色软件粉色视频

超越OpenAI o1! DeepSeek-R1升至全球風(fēng)格控制類第一,“中國模型”震動華爾街

超越OpenAI o1! DeepSeek-R1升至全球風(fēng)格控制類第一,“中國模型”震動華爾街

俞俊江 2025-01-25 滾動科技 13 次瀏覽 0個評論

21世紀(jì)經(jīng)濟(jì)報道記者 趙云帆 報道

距離深度求索推理大模型 DeepSeek-R1 發(fā)布已經(jīng)過去約一周時間。

然而,在海外社交媒體,乃至于華爾街上, DeepSeek-R1 的熱度竟然才剛剛開始螺旋式上升。

1月24日,在國外大模型排名 Arena 上,DeepSeek-R1 基準(zhǔn)測試已經(jīng)升至全類別大模型第三,其中在風(fēng)格控制類模型(StyleCtrl)分類中與 OpenAI o1 并列第一。而其競技場得分達(dá)到1357分,略超 OpenAI o1 的1352分。

這是繼 DeepSeek-V3 在剔除 OpenAI o1 等閉源模型排名開源模型類第一后,DeepSeek-R1 向全球最強(qiáng) AI 大模型的再一次進(jìn)擊。

就在 Arena 放榜之后,全球關(guān)于 DeepSeek 的討論再次升級。驚嘆,溢美,甚至陰謀論都層出不窮。與此同時,美股市場 AI經(jīng)濟(jì)的狂歡,也開始在 DeepSeek 的影響下顫動。

美股的警鐘

就在 DeepSeek-R1 獲得風(fēng)格控制類模型得分第一之后,鮮有發(fā)聲的圖靈獎得主,Meta AI 首席科學(xué)家 Yann LeCun 24日在社交媒體上表示:“當(dāng)人們看到 DeepSeek 的表現(xiàn),驚呼‘中國AI正在趕超美國’,但這種解讀有誤。更準(zhǔn)確的結(jié)論是:開源模型正在超越閉源系統(tǒng)。DeepSeek的成功得益于開放生態(tài),其創(chuàng)新基于前人成果的持續(xù)迭代。

DeepSeek-R1 的發(fā)布,宛如一顆沉重的石子打入AI行業(yè)與AI投資的湖水之中,甚至開始令越來越多人警覺 AI 投資可能存在的泡沫。

美股大V “THE SHORT BEAR”在社交媒體上表示,DeepSeek 創(chuàng)造了一個 AI 巨頭們的痛苦時刻,而投資者必須對此敲響警鐘。

“如果擊敗 OpenAI 所需要的金額是 5500萬美元(包括5000個 H800 GPU和500萬預(yù)訓(xùn)練費用),那么這個行業(yè)的商業(yè)化會比很多人預(yù)想的要快很多。”

該博客還指出:“根據(jù)紅杉,美國AI公司每年必須產(chǎn)生約6000億美元收入來支付其AI硬件費用。如果不跟進(jìn)(投資支出)就會被淘汰,那么大額資本支出以保持競爭力就是必要的——但現(xiàn)在看來,這種冒險行為變得越來越無利可圖。”

包括海外媒體 Vital Knowledge,德國世界報知名市場評論員 Holger Zschaepitz,都不約而同地把 DeepSeek 稱之為“美國股市最大的威脅”。

海外知名財經(jīng)博客 Zerohedge 24日撰文,稱 DeepSeek 的出現(xiàn)和其廉價的訓(xùn)練成本,正在對美國此前宣布的5000億美元AI基建計劃形成巨大的打擊。

網(wǎng)絡(luò)社群里,越來越多的人把 DeepSeek 的出現(xiàn)與近期英偉達(dá)的回調(diào)聯(lián)系在一起。

1月24日,英偉達(dá)股價大跌3.12%,報142.62美元/股,創(chuàng)下公司在年初 CES 展產(chǎn)品不及預(yù)期表現(xiàn)后的最大跌幅。

人紅是非多

DeepSeek 火到什么程度?海外社交媒體已經(jīng)對其進(jìn)行“花式贊美”,稱其不僅成本便宜,甚至只不過是一家對沖基金(幻方量化)的副產(chǎn)品。

當(dāng)然,人紅是非多——一個側(cè)寫來自于關(guān)于DeepSeek陰謀論的不斷出現(xiàn):一部分北美AI從業(yè)者普遍不相信 DeepSeek 的預(yù)訓(xùn)練費用只有區(qū)區(qū)不到 550 萬美元。

一個極端例子是 AI 科技初創(chuàng)公司 Scale AI 創(chuàng)始人 Alexandr Wang——其在2025年達(dá)沃斯論壇上接受采訪時,在未經(jīng)任何證實的情況下聲稱 DeepSeek 囤有五萬張英偉達(dá) H100 GPU,但因為芯片禁運并未對外公布。

也有AI行業(yè)人士懷疑,DeepSeek可能存在過度擬合基準(zhǔn)測試,在實際使用中可能會表現(xiàn)不佳。

“讓硅谷的AI模型創(chuàng)業(yè)者相信這些數(shù)字是不現(xiàn)實的,許多人一年的工資都比 DeepSeek 的訓(xùn)練費用高。”有人對此評論道。

好在,DeepSeek 選擇了最為開放的 MIT 標(biāo)準(zhǔn)作為開源協(xié)議。訓(xùn)練成本是否真的如此之低,有待公論。

近期,一則來自 Meta 匿名員工的消息稱,Meta 內(nèi)部近日啟動了一項通過 DeepSeek 開源論文復(fù)現(xiàn)其大模型的工作,試圖挖掘其是否真的只需要極低的預(yù)訓(xùn)練成本。

而屆時,DeepSeek 是否真的能改變整個AI經(jīng)濟(jì)的模型架構(gòu),可能將會有一個分曉。

你可能想看:

轉(zhuǎn)載請注明來自造財(上海)財務(wù)稅務(wù)代理有限公司,本文標(biāo)題:《超越OpenAI o1! DeepSeek-R1升至全球風(fēng)格控制類第一,“中國模型”震動華爾街》

每一天,每一秒,你所做的決定都會改變你的人生!
Top
網(wǎng)站統(tǒng)計代碼