來源:硬AI
美東時間周三,谷歌宣布,其最新AI模型套件Gemini 2.0正式向所有用戶開放使用。據谷歌表示,這是該公司迄今為止“最強大”的AI模型套件。
此前在去年12月,谷歌僅向開發者和受信任的測試者開放了部分功能,并將一些特性整合進谷歌的核心產品。如今全面開放后,所有新模型都可通過谷歌AI Studio和Gemini API供開發者使用。
Gemini 2.0套件包括三款針對不同應用場景的子模型:
2.0 Flash:被稱為“主力模型”,適用于高容量、高頻率任務。
2.0 Pro Experimental:專注提升編程性能,是迄今為止最出色的編程支持工具,支持200萬tokens的輸入容量,能夠一次性分析和處理大量信息。
2.0 Flash-Lite:谷歌稱其為“迄今為止最具成本效益的模型”,其成本和速度均優于1.5 Flash,具有100萬個tokens上下文窗口和多模式輸入。
在定價方面,2.0 Flash每處理百萬個tokens收費10美分,支持文本、圖像和視頻輸入。而更便宜的Flash-Lite版本,同樣的處理量僅需0.75美分。
有網友在社交媒體X上表示:
“這個定價確實太瘋狂了!干得太棒了。”
“確實,這是迄今為止我用過的最好的模型之一,甚至在編碼方面比OpenAI的o1更好!”
AI代理競賽升溫,巨頭爭相推出新功能
Gemini 2.0的全面發布是谷歌推動 “AI代理” 發展的最新舉措,AI代理就像一個超級智能的“任務管家”,不用用戶逐步操作提示,即可自動搞定復雜多步驟任務,可大幅提高工作效率,告別重復機械勞動。近年來,包括Meta、亞馬遜、微軟、OpenAI和Anthropic在內的科技巨頭都在這一領域加速布局。
谷歌在去年底的一篇博客文章中提到:
“在過去的一年里,我們一直在投資開發更多的代理AI模型。這些模型能更好地理解用戶周圍的世界,進行多步思考,并在用戶監督下代表用戶采取行動。”
“Gemini 2.0在多模態能力方面(支持文本、圖像、音頻等多種數據類型)取得了新進展。這一系列模型讓我們更接近通用助手的愿景。”
不只是谷歌在努力,當前科技行業AI軍備競賽進入白熱化階段。例如,亞馬遜支持的AI初創公司Anthropic在去年10月推出了可模擬人類使用計算機的AI代理,能完成幾十到上百步驟的復雜任務。
與此同時,微軟支持的OpenAI最近推出了名為Operator的功能,可自動執行諸如規劃度假、預訂餐廳、訂購雜貨等任務。此外,OpenAI本周還推出Deep Research工具,支持AI代理生成復雜研究報告,并分析用戶選擇的問題和主題。
值得注意的是,谷歌在去年12月也推出了同名工具Deep Research,旨在幫助用戶的“研究助手”,探索復雜主題并編寫報告。
綜合媒體消息,谷歌計劃在2025年初推出更多AI功能。谷歌CEO Sundar Pichai在一次戰略會議上強調:
“從歷史上看,你并不一定總是第一,但你必須執行力強,真正成為同類產品中最好的。我認為這就是2025年的全部意義所在。”
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。