來(lái)源:華爾街見(jiàn)聞
簡(jiǎn)單來(lái)說(shuō),ChatGPT的“深度研究”功能適用于那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個(gè)網(wǎng)站及其他信息來(lái)源,不斷深入挖掘直到找到最合適的答案的任務(wù)。Altman表示:“它真的很好,可以完成需要數(shù)小時(shí)/數(shù)天且花費(fèi)數(shù)百美元的任務(wù)。”
本文作者:蔣紫涵
來(lái)源:硬AI
OpenAI推出AI Agent“深度研究”,分析師要失業(yè)了?
當(dāng)?shù)貢r(shí)間2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名稱(chēng)叫做“深度研究”(Deep Research),旨在幫助用戶(hù)利用ChatGPT進(jìn)行深入、復(fù)雜的研究。
OpenAI表示,該功能專(zhuān)為“在金融、科學(xué)、政策和工程等領(lǐng)域從事高強(qiáng)度知識(shí)工作的人員”設(shè)計(jì),提供全面、精準(zhǔn)、可靠的研究支持,并且,該功能同樣適用于需要進(jìn)行細(xì)致調(diào)研的大宗消費(fèi)決策,例如汽車(chē)、家電、家具購(gòu)買(mǎi)等。
簡(jiǎn)單來(lái)說(shuō),ChatGPT的“深度研究”功能適用于那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個(gè)網(wǎng)站及其他信息來(lái)源,不斷深入挖掘直到找到最合適的答案的任務(wù)。
Altman寫(xiě)道:
“它可以去互聯(lián)網(wǎng),做復(fù)雜的研究和推理,然后給你一份報(bào)告。它真的很好,可以完成需要數(shù)小時(shí)/數(shù)天且花費(fèi)數(shù)百美元的任務(wù)。”
“它計(jì)算量很大且速度很慢,但它是第一個(gè)可以執(zhí)行如此廣泛復(fù)雜、有價(jià)值的任務(wù)的AI系統(tǒng)。”
對(duì)此,網(wǎng)友們躍躍欲試,有人“已經(jīng)準(zhǔn)備好使用它了”,還有人自報(bào)賬號(hào)請(qǐng)求先一步用上ChatGPT的“深度研究”功能:
也有人提出疑問(wèn),ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更強(qiáng)嗎?會(huì)不會(huì)存在隱私問(wèn)題?能不能把報(bào)告中每句話(huà)的首字母大寫(xiě)?
限定發(fā)布,未來(lái)將拓展至更多用戶(hù)
Altman表示,ChatGPT的“深度研究”功能目前僅向ChatGPT Pro訂閱用戶(hù)開(kāi)放,每月限額100次查詢(xún),隨后將逐步推廣至Plus和Team用戶(hù),最終擴(kuò)展至企業(yè)級(jí)(Enterprise)用戶(hù)。預(yù)計(jì)Plus版本將在約一個(gè)月后推出,并且未來(lái)付費(fèi)用戶(hù)的查詢(xún)限制將“顯著提高”。
對(duì)此,許多網(wǎng)友表示,200美元/月的ChatGPT Pro訂閱費(fèi)用太貴了:
不是免費(fèi)的誰(shuí)在意啊。
還有網(wǎng)友猜測(cè)道,等之后實(shí)現(xiàn)了AGI,是不是要每月收取2000美金,限額使用10次?
其實(shí),Altman表示,免費(fèi)用戶(hù)也能使用,但額度非常少。
需要注意的是,“深度研究”功能目前僅在特定地區(qū)推出,OpenAI尚未公布該功能何時(shí)向英國(guó)、瑞士及歐洲經(jīng)濟(jì)區(qū)(EEA)用戶(hù)開(kāi)放。
目前,ChatGPT 深度研究的輸出僅限于文本格式。不過(guò),OpenAI計(jì)劃在未來(lái)增加嵌入式圖像、數(shù)據(jù)可視化及其他“分析型”輸出。此外,OpenAI還表示,未來(lái)將支持接入“更多專(zhuān)業(yè)化的數(shù)據(jù)源”,包括“訂閱制”數(shù)據(jù)庫(kù)和內(nèi)部資源。
研究精度如何?AI仍存局限
分析師要大面積失業(yè)了嗎?關(guān)鍵在于,ChatGPT“深度研究”功能的精準(zhǔn)度能否滿(mǎn)足專(zhuān)業(yè)研究需求?畢竟,AI并不完美,仍然存在“幻覺(jué)”(hallucination)問(wèn)題,即生成錯(cuò)誤或虛假信息的可能性。
考慮到這一點(diǎn),OpenAI透露,每次深度研究的輸出都將“完整記錄,附帶清晰的引用來(lái)源及推理摘要,便于用戶(hù)參考和驗(yàn)證信息”。
不過(guò),分析認(rèn)為,這一舉措是否足以避免AI誤導(dǎo)用戶(hù)仍待觀(guān)察——此前,OpenAI在ChatGPT內(nèi)推出的AI搜索功能(ChatGPT Search)已被曝出存在錯(cuò)誤回答的問(wèn)題。TechCrunch評(píng)測(cè)發(fā)現(xiàn),ChatGPT Search在某些查詢(xún)上甚至不如谷歌搜索可靠。
增強(qiáng)精準(zhǔn)度:使用專(zhuān)門(mén)優(yōu)化的o3版本AI模型
為了提高深度研究的準(zhǔn)確性,OpenAI采用了一種特殊版本的o3“推理”AI 模型,該模型經(jīng)過(guò)強(qiáng)化學(xué)習(xí)(reinforcement learning)訓(xùn)練,專(zhuān)門(mén)針對(duì)“需要使用瀏覽器和Python工具的實(shí)際任務(wù)”。
OpenAI表示,該版本的o3模型“針對(duì)網(wǎng)頁(yè)瀏覽和數(shù)據(jù)分析進(jìn)行了優(yōu)化”,可以“利用推理能力搜索、解讀和分析互聯(lián)網(wǎng)海量文本、圖片及PDF,并根據(jù)新獲取的信息靈活調(diào)整策略。”
該模型還可以瀏覽用戶(hù)上傳的文件,繪制并迭代調(diào)整圖表,在回答中嵌入生成的圖表及網(wǎng)頁(yè)圖片,并引用來(lái)源中的具體句子或段落。
為了測(cè)試該模型的效果,OpenAI采用了一項(xiàng)名為“人類(lèi)終極考試”(Humanity’s Last Exam)的評(píng)估方法,該測(cè)試涵蓋3000多道高難度學(xué)術(shù)問(wèn)題,遠(yuǎn)超其他AI評(píng)估基準(zhǔn),以確保測(cè)試難度始終領(lǐng)先于模型的進(jìn)步水平。
ChatGPT“深度研究”功能所使用的o3模型在測(cè)試中的準(zhǔn)確率為26.6%——這一成績(jī)看似不高,但相比之下,已經(jīng)遠(yuǎn)超其他AI模型的得分:
谷歌 Gemini Thinking:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不過(guò),盡管如此,OpenAI仍然承認(rèn),ChatGPT“深度研究”功能存在局限性,可能會(huì)出現(xiàn)錯(cuò)誤推斷、誤解權(quán)威信息與謠言的情況,并且,在面對(duì)不確定性時(shí)往往無(wú)法明確表述。
本文來(lái)自微信公眾號(hào)“硬AI”,關(guān)注更多AI前沿資訊請(qǐng)移步這里
市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。
算力板塊全面領(lǐng)漲!銳捷網(wǎng)絡(luò)20CM漲停,科技ETF(515000)漲2.24%,機(jī)構(gòu):看好AI領(lǐng)域深度應(yīng)用前景
OpenAI將于幾周內(nèi)推出o3 mini推理AI模型
特朗普2.0恐令全球央行政策重陷分化,分析師們對(duì)明年怎么看?
OpenAI首席執(zhí)行官稱(chēng)美國(guó)在人工智能領(lǐng)域面臨“非常真實(shí)的競(jìng)爭(zhēng)”
工信部原部長(zhǎng)李毅中:大力加強(qiáng)基礎(chǔ)研究、原始創(chuàng)新,構(gòu)建適應(yīng)科技創(chuàng)新的科技金融體系
OpenAI入局AI搜索了,這一次能顛覆傳統(tǒng)搜索引擎嗎?