21世紀(jì)經(jīng)濟(jì)報道記者 孔海麗 彭新 北京報道
1月10日,在由清華大學(xué)基礎(chǔ)模型北京市重點實驗室、智譜AI發(fā)起的AGI-Next前沿峰會上,罕見集齊了騰訊“CEO/總裁辦公室”首席AI科學(xué)家姚順雨、Kimi創(chuàng)始人楊植麟、智譜創(chuàng)始人唐杰、阿里巴巴Qwen技術(shù)負(fù)責(zé)人林俊旸以及加拿大皇家學(xué)院院士、香港科技大學(xué)榮休教授楊強等AI界知名大咖,圍繞AI新范式、Agent、中國大模型公司的挑戰(zhàn)及機會等話題展開了討論。
其中,楊植麟首次深度分享了Kimi的技術(shù)重點,他透露,2025年,月之暗面的兩個技術(shù)進(jìn)化主線是提升“TokenEfficiency”,以在有限的數(shù)據(jù)下沖擊更高的智能上限;以及擴(kuò)展“長上下文”能力,以滿足Agentic時代越來越長程的任務(wù)對模型的記憶能力需求。
履新騰訊后,姚順雨首次公開亮相
值得注意的是,此次峰會是姚順雨加入騰訊后,首次對外界分享其對AI產(chǎn)業(yè)的觀察?,F(xiàn)年27歲的姚順雨畢業(yè)于清華大學(xué)姚班和普林斯頓大學(xué)。他在2024年加入OpenAI后,迅速成為團(tuán)隊核心研究者之一,參與推動 AI Agent和任務(wù)執(zhí)行系統(tǒng)方向的開發(fā)。
2025年12月17日,騰訊宣布升級大模型研發(fā)架構(gòu),新成立AI Infra部、AI Data部和數(shù)據(jù)計算平臺部,旨在全面強化大模型的研發(fā)體系與核心能力。其中,姚順雨出任“CEO/總裁辦公室”首席AI科學(xué)家,向騰訊總裁劉熾平匯報;同時兼任AI Infra部、大語言模型部負(fù)責(zé)人。
姚順雨指出,當(dāng)前中美大模型市場均呈現(xiàn)出明顯的分化特征,其中To C與To B市場的底層邏輯已截然不同。“對于To C市場,大部分用戶在大部分時間并不需要極強的智能?!币樣瓯硎?,雖然當(dāng)前模型在數(shù)學(xué)推導(dǎo)等高階能力上顯著增強,但對于普通用戶而言,ChatGPT等應(yīng)用更多是“搜索引擎的加強版”。在這一領(lǐng)域,為了提供更好的體驗,廠商傾向于走“垂直整合”路線,即模型層與應(yīng)用層緊密耦合、快速迭代。
而在To B領(lǐng)域,邏輯則完全相反。“智能越高,代表生產(chǎn)力越高,溢價空間也越大?!币樣暧^察到,企業(yè)級市場對模型能力的付費意愿呈現(xiàn)極端的頭部效應(yīng)。他舉例稱,市場愿意為頂級模型支付200美元/月的訂閱費用,而對次級模型(50美元或20美元/月)興趣寥寥。對此,姚順雨稱在編程等高頻且嚴(yán)肅的生產(chǎn)力場景中,較弱模型產(chǎn)生的錯誤需要人工耗費大量精力去排查和監(jiān)控,其隱性成本遠(yuǎn)超模型差價。因此,To B市場正走向分化,強模型和較弱模型的差距將更加明顯。
進(jìn)一步來看,姚順雨認(rèn)為,單純的模型參數(shù)競賽已不是C端產(chǎn)品的全部,未來的核心競爭力在于對“語境”(Context)的捕捉?!氨热鐔枴裉斐允裁础?,今年問和去年問,答案不應(yīng)一樣?!币樣杲忉尩?,更好的回答不單純依賴更強的推理能力,而在于模型是否掌握用戶的實時狀態(tài)、位置、歷史偏好甚至社交關(guān)系等“額外的Context”。
在To B端,鑒于國內(nèi)企業(yè)軟件市場付費意愿較弱的現(xiàn)實,姚順雨提出大型科技公司應(yīng)利用自身龐大的內(nèi)部場景進(jìn)行驗證。與初創(chuàng)公司依賴外部標(biāo)注商不同,一家擁有10萬員工的大廠本身就是巨大的實驗場?!霸趺窗颜鎸嵤澜绲臄?shù)據(jù)利用好,而不是僅僅依賴于標(biāo)注商或者外部采購。”
下一代AI范式是什么?
談及自主學(xué)習(xí)的發(fā)展信號,姚順雨提出了不同于普遍認(rèn)知的觀點,他認(rèn)為2025年就已出現(xiàn)相關(guān)信號,部分團(tuán)隊正采用最新用戶數(shù)據(jù)進(jìn)行實時學(xué)習(xí),新模型也在真實環(huán)境數(shù)據(jù)的支撐下開展訓(xùn)練。不過這些嘗試尚未帶來石破天驚的效果,核心原因在于其缺乏預(yù)訓(xùn)練能力,模型表現(xiàn)暫時不及OpenAI等頭部公司的產(chǎn)品。
姚順雨認(rèn)為,自主學(xué)習(xí)發(fā)展面臨的最大問題并非技術(shù)本身,而是“想象力”的缺失。他說,我們能夠大致構(gòu)想強化學(xué)習(xí)或推理范式落地后的形態(tài),比如chatGPT O1模型通過強化學(xué)習(xí)與思維鏈,將數(shù)學(xué)題得分從10分提升至80分,但對于自主學(xué)習(xí)真正實現(xiàn)時該呈現(xiàn)怎樣的具體任務(wù)與效果,尚未形成清晰認(rèn)知。他舉例說明,無論是能盈利的交易系統(tǒng),還是能攻克人類未解科學(xué)難題的工具,只有明確了這些具象化的目標(biāo),才能真正判定新范式的到來。
當(dāng)被問及2027年哪家公司最有可能實現(xiàn)新范式創(chuàng)新時,姚順雨認(rèn)為OpenAI的概率還是更大。盡管他坦言商業(yè)化等因素已在一定程度上削弱了OpenAI的創(chuàng)新基因,但綜合來看,OpenAI依然是全球范圍內(nèi)最有可能誕生新范式的企業(yè)。
林俊旸從更務(wù)實的角度切入,他認(rèn)為當(dāng)前RL(強化學(xué)習(xí))的潛力尚未充分釋放,相關(guān)探索仍處于早期階段,全球范圍內(nèi)都存在類似的發(fā)展瓶頸。對于下一代AI范式,他提出了兩個核心方向。
其一,AI的自主進(jìn)化。他提到有觀點認(rèn)為,人類與AI的持續(xù)交互只會讓上下文不斷拉長,反而導(dǎo)致AI“變笨”,這一現(xiàn)象值得深思。而實現(xiàn)自主進(jìn)化是否需要更新模型參數(shù),行業(yè)內(nèi)可采用不同技術(shù)路徑達(dá)成,暫無統(tǒng)一答案。
其二,AI的主動性提升。當(dāng)前AI的啟動與運行高度依賴人類協(xié)助,未來能否實現(xiàn)自主思考、主動行動,是新范式的重要特征。但這一方向也潛藏著嚴(yán)峻的安全風(fēng)險,他特別強調(diào),擔(dān)憂的并非AI“說不該說的話”,而是其可能主動實施危險行為,比如產(chǎn)生傷害他人的想法并付諸行動。因此,如同培養(yǎng)孩子一般為AI注入正確導(dǎo)向,是發(fā)展主動性過程中不可或缺的環(huán)節(jié)。
關(guān)于自主學(xué)習(xí)的落地場景,林俊旸認(rèn)為自動化AI研究員的實現(xiàn)或許無需依賴自主學(xué)習(xí),短期內(nèi)即可替代人工完成模型訓(xùn)練工作;而持續(xù)理解用戶需求、實現(xiàn)個性化交互,更有可能成為自主學(xué)習(xí)的首個突破口。
對于2026年Memory技術(shù)能否實現(xiàn)突破性跨越,林俊旸表示,技術(shù)本質(zhì)上呈線性發(fā)展,所謂“突破性”更多是人類的主觀感受。目前Memory技術(shù)僅能讓AI記住過往信息,卻無法像人類一樣深度理解運用。
林俊旸預(yù)測,Memory技術(shù)可能還需一年左右發(fā)展,當(dāng)算法與基礎(chǔ)設(shè)施實現(xiàn)更好融合,或許能達(dá)到“臨界點”,讓人類感受到類似人與人之間的記憶理解能力。
唐杰對2026年AI范式革新充滿信心,他認(rèn)為持續(xù)學(xué)習(xí)、Memory、多模態(tài)等方向均有望誕生新范式。而新范式的出現(xiàn),核心驅(qū)動力源于兩大趨勢。
一方面,學(xué)術(shù)界與工業(yè)界的創(chuàng)新差距顯著縮小。此前工業(yè)界在大模型領(lǐng)域遙遙領(lǐng)先,2023-2024年時,工業(yè)界擁有上萬片算力卡,而高校往往僅有0片或1片,差距高達(dá)萬倍;但到2025年底至2026年初,眾多高校已配備充足算力卡,不少老師及硅谷學(xué)者紛紛投身大模型架構(gòu)、持續(xù)學(xué)習(xí)等領(lǐng)域研究,盡管當(dāng)前雙方差距仍有10倍,但學(xué)術(shù)界已孵化出創(chuàng)新種子,具備了突破的潛力。
另一方面,大模型發(fā)展面臨效率瓶頸。當(dāng)前行業(yè)在大模型領(lǐng)域投入巨大,但效率低下的問題日益凸顯。數(shù)據(jù)規(guī)模從2025年初的10TB增長至當(dāng)前30TB,未來甚至可能擴(kuò)展到100TB,但規(guī)模擴(kuò)張帶來的收益與高昂的計算成本不成正比,盲目投入10億、20億資金可能僅獲微薄回報。同時,反復(fù)重訓(xùn)基座模型、過度依賴RL的模式,收益已逐漸遞減。因此,未來需明確“智能效率”(Intelligence efficiency)的核心地位,即在更少投入下實現(xiàn)更大的智能增量,這種對效率的追求將倒逼新范式誕生。
唐杰透露,其團(tuán)隊也在積極投身相關(guān)研究,期待成為新范式的推動者,但也坦言創(chuàng)新結(jié)果存在不確定性。
AI Agent今年如何走?
除了模型本身的演進(jìn),AI Agent(智能體)發(fā)展走向被視為2026年AI產(chǎn)業(yè)的關(guān)鍵變化。
對于Agent的發(fā)展階段,楊強提出了四階段演進(jìn)框架:從目標(biāo)和規(guī)劃均由人類定義,過渡到AI自動定義。他認(rèn)為,當(dāng)前的Agent系統(tǒng)仍處于初級階段,大部分依賴人工設(shè)定目標(biāo)和規(guī)劃;未來將出現(xiàn)原生系統(tǒng),即大模型將能夠觀察人類工作,自主利用數(shù)據(jù),內(nèi)生地定義目標(biāo)與規(guī)劃路徑。
林俊旸指出,通用Agent的核心能力在于解決長尾問題。他指出,解決頭部需求相對容易,但解決長尾需求極難,而今天AGI(通用人工智能)的價值,恰恰在于能解決用戶“到處找不到答案”的難題。
對于Agent領(lǐng)域,創(chuàng)業(yè)者與大模型公司的競爭問題,林俊旸直言這一問題“見仁見智”。他表示,如果創(chuàng)業(yè)者“善于套殼”,在產(chǎn)品化上能做得比模型公司更好,仍有創(chuàng)業(yè)機會;但對于模型公司而言,其優(yōu)勢在于踐行模型即產(chǎn)品原則,遇到問題時,可以通過重訓(xùn)模型、消耗算力來從底層解決。
然而,Agent商業(yè)化落地的現(xiàn)實挑戰(zhàn)依存在。唐杰指出了決定Agent的三個核心要素:價值、成本(Cost)與速度。他強調(diào),首先要看Agent是否解決了真正有價值的人類事務(wù);其次是成本問題,“如果調(diào)一個API就能解決問題,但Agent的成本特別大,那就構(gòu)成了矛盾”。