21世紀經濟報道記者孔海麗 北京報道
從2024年12月發布V3大模型,到最近推出R1模型和多模態模型Janus-Pro,DeepSeek持續出圈,形成了全球AI界甚至整個科技圈的“DeepSeek現象”。
多次采訪馬斯克等AI企業家的知名播客主持人萊克斯·弗里德曼(Lex Fridman),用了一個詞叫做“DeepSeek 時刻”,“我認為 5年后它仍將作為科技史上的關鍵事件被人們銘記。”
DeepSeek出圈的原因之一是,它采用“更聰明”的算法,把AI訓練成本砍掉近60%,卻實現甚至超越了同類模型的性能。簡單來說,同樣的產品,別人花100塊訓練一個AI模型,它只要40元。這種“省錢打法”直接戳中了行業的痛點——過去拼的是誰能買更多高價芯片,現在比的是誰能把芯片用得更好。
DeepSeek不僅提供了新的AI技術路線,更重要的是,它在硅谷和華爾街聯合主導的AI敘事鐵墻上撕開了一道口子。
但自豪和興奮之余,還是要保持清醒的頭腦。且不說,在資金、技術、人才等方面,以DeepSeek為代表的新創AI企業,尚無法向OpenAI、Anthropic 這些巨頭發起全面挑戰,單單就V3、R1而言,其算法優化也有代價:處理復雜場景時,它的表現明顯不如燒錢堆出來的大模型。就像用精簡版PS軟件修圖——日常夠用,專業場景會露怯。何況,短時間內我們還不足以撼動英偉達巨頭們的硬件江湖。
擺脫硬件依賴尚不現實
在“DeepSeek現象”推動下,未來的算力圖景,并非單一曲線繪就。
一方面,像DeepSeek這樣的產品,更高流量、更低開發和消費成本,可能帶來AI應用的突然爆發,這是所有從業人員夢寐以求的場景。
另一方面,當訓練成本下降刺激更多公司入場,消費者應用呈指數級增加,催生AI生態鏈全面繁榮,芯片需求將迎來超乎預期的增長。
硬幣兩面,恰好構成了算力命題的悖論。
但是,業內人士援引騰訊之前發布的白皮書,AI Agent應用要實現跳躍式增長乃至爆發,必須闖過三關:場景滲透率大于15%、任務完成度大于80%、用戶信任度大于60%。
僅以信任度為例,此前Gartner的一項抽樣調查顯示,64%的人表示,不希望在客戶服務中使用人工智能。
目前AI Agent應用的技術能力僅滿足簡單場景,如客服、日程管理等。而復雜決策如醫療咨詢、法律建議等,仍存在難以填補的缺陷。AI最大的應用場景是教育、醫療、金融等,但是,誤診率5%的AI醫生看病,依然很難被接受。就好比,無人駕駛比人類更安全,但無人駕駛每出現一次事故都會被凝視。人類對AI的信任,只是處于初始水平,此外還面臨著各國隱私保護法規、用戶習慣、能源約束、技術路線分歧、多智能體協作、倫理困境等方面的挑戰。
業內此前預計,要到2026年前后,才將出現AI信任度的分水嶺(大于60%)。“DeepSeek現象”會不會加快這個時間表的到來?現在沒有人能夠斷定。
有人說,2025年將是AI Agent應用元年。而DeepSeek通過異構計算架構、CPU+FPGA+ASIC混合部署和動態負載均衡算法等創新,將單位算力產出提升2倍多,這是否意味著它探索的技術方向將打破算力壟斷,導致算力過剩?
這關系到算力現狀。其特點是嚴重不均衡。一是地區不均衡。北美尤其是美國占據了全球算力最大份額,其次是中國,但高端算力基本集中在北美。
二是供應不均衡。通用算力芯片廠商主要是英偉達,占據70%以上份額,2025年其GPU銷量預計可達700萬塊;BSIC芯片的主要廠商是博通和Marvell,合計占有超60%的份額;云計算方面,谷歌、微軟、亞馬遜占據全球65%的市場份額。這就是大家所說的算力壟斷。
三是企業不均衡。微軟、Meta、谷歌、亞馬遜、xAI幾大巨頭目前囤積的算力總共約合355萬塊等效H100,這還不包括AI新貴OpenAI在內。其他經濟體企業能拿到的芯片量,無法與之相比。
算力供需還存在結構性錯配的問題。從縱向看,隨著多模態應用的普及,推理側的算力需求增速已經超過訓練側,但算力還主要布局于訓練側,調整需要一點時間;從橫向看,大量算力被消耗在數據清洗和模型調試等非核心環節。
以大模型算力為例。2024年下半年以來,大模型算力已經從訓練向推理轉移,其中占據推理算力市場最大份額的,仍然是英偉達。
《中國算力發展報告(2024)》援引援引IDC報告,截至2023年四季度,英偉達全球市場份額達95.9%。英偉達通過在CUDA和GPU兩端同時發力,構筑了軟硬協同的護城河。有人說DeepSeek通過架構革新,繞開了CUDA,沖破了它的護城河,這其實是誤讀。多位專家研讀DeepSeek公開(開源))論文后表示,V3、R1的底層架構仍然是基于CUDA生態建構。
在這種市場格局下,其他區域及其廠商要發起挑戰,試圖打破巨頭壟斷,擺脫以英偉達為代表的算力依賴,更多是樂觀主義的展望式預期。除非量子芯片實現規模化商用,但那是5年甚至10年以后的事。
至于算力過剩,短期內不存在,整體上仍然是供大于求。《中國算力發展報告(2024)》援引中國信通院數據,截至2023年底,全球算力規模同比增長40%,但以CPU為代表但芯片年性能提升不足15%,無法滿足視頻、圖片等非結構化數據的處理需求。賽迪智庫2024年初測算,2023年中國智能算力需求達到123.6EFLOPS,但智能算力供給規模僅為57.9EFLOPS,嚴重供不應求。“DeepSeek現象”目前看來是增加了而不是減少了硬件需求。比如,32G的英偉達RTX50系顯卡,近半個月漲勢兇猛,最高已經炒到了6萬元以上。其中部分原因在于,消費者購入RTX50顯卡去做DeepSeek V3、R1本地化部署。
AI巨頭為何焦慮
既然DeepSeek尚未突破硬件限制,所做的也是巨人肩上的創新,但為什么還是引起美國AI巨頭的焦慮甚至恐慌?
從表層看,美國AI巨頭嗅到了危機,不是因為技術被超越,而是實現目標的技術路徑變了,新創企業有了更多選擇。就像燃油車時代比拼的是發動機,電動車時代比拼的是電池管理技術。DeepSeek證明了硅谷堆硬件堆數據的路線不是唯一選擇,高效用好現有資源同樣能打。
DeepSeek省錢省力的R1模型發布時,剛好是OpenAI、軟銀、英偉達等科技巨頭宣布5000億美元算力基建——星際之門計劃的時間段,放在這個背景下對比來看,美國AI巨頭的刺痛感就更強烈了。
一位資深AI觀察人士告訴21世紀經濟報道記者,DeepSeek發起的這場“效率革命”,是AI發展從技術理想主義轉向工程實用主義的標志性事件。它證明了,在現有硬件和物理約束條件下,通過計算拓撲結構優化獲得的邊際收益,遠高于單純增加芯片數量的線性增長。
這解釋了為何美國AI巨頭會產生戰略焦慮的深層因素——當工程創新能力開始在AI競爭中脫穎而出,硅谷長期主導的技術先發優勢就面臨重估,而且它也將帶來AI敘事的重估,背后是資本和資本市場的重估。
宏觀趨勢研究學者、經濟學家David Woo近日接受訪談時表示,過去兩年,人們一直在談論美國經濟的“例外主義”,而AI是推動這一論斷形成的重要因素。美股市值占全球資本市場的份額達63%,其中ChatGPT出現后的兩年,就增加了10個百分點,而七大科技巨頭又占美股市值的25%。這些巨頭正是依靠AI技術的強大優勢鞏固了它們的地位,從而間接鞏固了美國資本市場的優勢地位。
因此,AI與美國科技巨頭、資本市場其實是捆綁在一起的,也正是硅谷和華爾街聯合主導了全球AI敘事。
如今,來自東方的神秘力量DeepSeek向這套AI敘事發起了沖鋒。全球科技和資本領域持續10多天的熱烈反應,可以從側面解釋科技巨頭的焦慮和資本市場為何如此緊張。
前述資深AI分析人士認為,DeepSeek創造的歷史性價值有兩點:一是力行開源,本質上是人類資源的共享表達;二是提供了碓砌算力和數據之外的新的技術路徑。記者這幾天的采訪發現,DeepSeek以上兩點價值,基本已成為業內的共識。
在現實層面,DeepSeek耶揭示了一個殘酷的真相:當創新進入深水區,工程能力比學術突破更重要,成本控制比參數競賽更致命,社會接受度比算法精度更關鍵。
如果跳開地緣政治誰贏誰輸的問題,僅僅著眼于行業本身,商業本質在于,賺錢的公司才能活下去。當資本泡沫退去,或許我們會發現,技術強大固然重要,但應用和生存才是企業當下的現實,也是所有AI企業的必答題。
從 “誰能燒錢造最大模型”,過渡到“誰能用最少錢辦最多事” ;美國依然掌握著最先進的芯片,但中國找到了更省錢的玩法——這才是DeepSeek重新書寫的AI敘事。
畢竟,不是所有新創企業都像OpenAI、xAI動不動就能融資到60億美元。正是在這個意義上,DeepSeek的技術路線,受到全球大批AI企業的效仿,其開源策略受到全球研究機構的稱贊,其價格策略引發全球消費者的熱捧。
高效率低成本的技術創新,加上全球關注的巨大流量,讓DeepSeek贏得了寶貴的時間窗口。這是堆積美元也難以買到的,也是OpenAI、Anthropic等AI新創企業羨慕甚至嫉妒的。