人工智能計算市場可能會在 2025 年發生轉變,為小公司帶來機遇。
英偉達在人工智能計算領域占據主導地位。不斷變化的工作負載可以使競爭對手受益。
Groq、Positron 和 SambaNova 等公司專注于推理,以挑戰 Nvidia 的市場地位。
到 2025 年,對于希望在人工智能計算領域與價值 3 萬億美元的大猩猩競爭的公司來說,潮流可能會發生轉變。
Nvidia估計占據人工智能計算 90% 的市場份額。盡管如此,隨著人工智能使用的增長, 工作負載預計會發生變化,這種演變可能會給擁有有競爭力的硬件的公司帶來機會。
芯片初創公司 Positron AI 首席執行官 Thomas Sohmers 告訴 BI,到 2024 年,大部分人工智能計算支出將轉向推理。他補充說,這將“繼續沿著指數曲線增長”。
在人工智能中,推理是產生對用戶查詢或請求的響應所需的計算。向模型傳授回答所需的知識所需的計算稱為“訓練”。例如,創建OpenAI 的圖像生成平臺Sora就代表著訓練。每個指示其創建圖像的用戶都代表一個推理工作負載。
OpenAI 的其他模型讓 Sohmers 和其他人對 2025 年計算需求的增長感到興奮。
OpenAI 的 o1 和 o3、Google 的 Gemini 2.0 Flash Thinking以及一些其他 AI 模型使用 更多計算密集型策略來提高訓練后的結果。這些策略通常稱為推理時間計算、思維鏈、推理鏈或推理模型。
簡而言之,如果模型在回答之前思考得更多,那么答案就會更好。這種想法是以時間和金錢為代價的。
爭奪英偉達部分市場份額的初創公司正在嘗試優化其中一項或兩項。
Nvidia首席執行官黃仁勛在公司 11 月份的財報電話會議上表示,Nvidia 已經從這些創新中受益。黃的潛在競爭對手押注,到 2025 年,新的人工智能訓練后策略將使所有推理芯片供應商受益。
《商業內幕》采訪了三位挑戰者,講述了他們對 2025 年的希望和期望。以下是他們的新年決心。
在您的控制范圍內,有哪一件事可以讓2025年成為替代芯片的重要一年?
Groq 首席技術傳播者 Mark Heaps:
“執行、執行、執行。現在,Groq的每個人都決定今年不再休假。每個人都在執行和構建系統。我們都確保抓住我們所擁有的機會,因為在我們的掌控之中。
我告訴大家我們的漏斗現在充滿了碳酸并且冒著氣泡。客戶的興趣之大令人難以置信。我們必須建立更多的系統,并且必須維護這些系統,以便我們能夠滿足我們的需求。我們希望為所有這些客戶提供服務。我們希望提高每個人的費率限制。”
SambaNova Systems 首席執行官梁羅德里戈:
“對于SambaNova來說,最關鍵的因素是執行從訓練到推理的轉變。行業正在快速向實時應用發展,推理工作負載正在成為人工智能需求的最大份額。我們的重點是確保我們的技術能夠為企業提供支持有效且可持續地擴大規模。”
Positron 首席執行官托馬斯·索默斯 (Thomas Sohmers):
“我的信念是,如果我們實際上能夠部署足夠的計算——值得慶幸的是,我認為從供應鏈的角度來看我們可以——通過部署更多的特定于推理的計算,我們將能夠提高‘思想鏈’的采用率‘以及其他附加推理計算。”
2025 年,有哪一件事是你所希望但無法控制的?
Heaps:“這是關于客戶認識到相對于現有技術有新穎的進步。有很多人告訴我們,‘我們喜歡你所擁有的東西,但用一句古老的格言來說,重新表述一下:沒有人因為從以下地方購買而被解雇——現任插入。
但我們知道它已經開始沸騰了。人們意識到他們很難從現任者那里獲得芯片,而且它的性能也不如 Groq。所以我希望人們愿意抓住這個機會并實際研究其中的一些新技術。”
梁:“如果我有一根魔杖,我就能解決部署人工智能的功耗挑戰。如今,大多數市場都在使用高耗電的硬件,而這些硬件并不是為大規模推理而設計的。結果是一種不可持續的方法——經濟上和環保。
在 SambaNova,我們已經證明有更好的方法。我們的架構消耗的電量減少了 10 倍,使企業能夠部署實現其目標的人工智能系統,而不會超出其電力預算或碳目標。我希望看到市場更快地采用優先考慮效率和可持續性的技術,因為這就是我們如何確保人工智能能夠在全球范圍內擴展而不壓倒支持它的基礎設施。”
Sohmers:“我希望人們能夠以最快的速度真正采用這些思想鏈能力。我認為從能力的角度來看,這是一個巨大的轉變。你擁有 80 億個參數模型,超過 700 億個參數模型。所以我試圖盡我所能來實現這一目標。”
你的新年決心是什么?
Heaps:“在過去的六個月里,我參加了許多黑客馬拉松,并會見了開發人員。這非常鼓舞人心。因此,我的新年決心是努力放大人們利用人工智能所做的善事的信號。”
梁:“騰出時間聽音樂。彈吉他是我一直喜歡的事情,我很想重新開始。音樂有這種令人難以置信的方式來理清思緒并激發創造力,我發現這在我們努力將 SambaNova 的人工智能引入時非常寶貴。到地球的新角落。”
Sohmers:我想做同樣多的事情來鼓勵使用這些新工具來幫助我的媽媽。我進入技術領域的部分原因是因為我希望看到這些工具幫助人們能夠利用他們的時間做更多的事情——學習他們想要的一切,而不僅僅是他們從事的工作。我認為降低這些東西的成本將會促進這種擴散。
我個人也希望在我的工作環境之外看到并嘗試使用更多這些東西,因為過去幾周我一直癡迷于使用o1 Pro 模型,它對我的個人工作來說非常棒。但當我允許我媽媽做一些事情時,她會用它做的事情非常有趣——那些正常的、日常的人的任務,真正是作為一個助手。”
本文轉載自微信公眾號“半導體產業洞察”,智通財經編輯:徐文強。