5月7日,騰訊混元公布最新數(shù)據(jù),自上線以來,Hy3 preview的 Token調(diào)用量持續(xù)增加,目前總量已經(jīng)超過上一代版本模型 Hy2的10倍,尤其是代碼和智能體類場景的 Token調(diào)用量增加明顯,并且騰訊的 WorkBuddy/Codebuddy以及 Qclaw類應(yīng)用中的總增長幅度超過16.5倍。
此外,來自 OpenRouter的公開數(shù)據(jù)顯示,Hy3 preview在過去一周的Token調(diào)用量排到了周榜總榜以及市場占有率“雙第一”,并且在編程和工具調(diào)用場景下的調(diào)用量也排在榜首。
圖:OpenRouter模型調(diào)用周榜(5月7日)
騰訊混元負(fù)責(zé)人表示:“Hy3 preview主打?qū)嵱茫瑸榱怂鸭脩舴答?,了解模型在真實場景中效果,Hy3 preview在上線之初便在 OpenRouter開啟限免活動,方便開發(fā)者免費試用模型。在這個過程中,我們看到模型的調(diào)用量持續(xù)增長,同時也搜集到不少正負(fù)面反饋,這為模型的后續(xù)迭代提供了方向,要特別感謝開發(fā)者對混元的關(guān)注和認(rèn)可。”
圖:OpenRouter模型市場占有率排名
在社交媒體上,我們也看到不少用戶對 Hy3 preview給出了積極的評價,比如:“模型在工具調(diào)用的成功率、代碼生成的可靠性上表現(xiàn)優(yōu)秀”,“是一個‘Agent-First’的模型”,同時“模型在指令遵循上準(zhǔn)確性上也令人印象深刻”。
Hy3 preview是騰訊混元進行技術(shù)重構(gòu)后推出的首個模型,采用快慢思考融合的混合專家(MoE)架構(gòu),總參數(shù)量達2950億,激活參數(shù)量為210億,支持256K的長上下文窗口。
大模型調(diào)用量的爆發(fā)式增長往往與“技術(shù)效能”強相關(guān)。性能上,騰訊業(yè)務(wù)此前的測試結(jié)果顯示,在 CodeBuddy和 WorkBuddy等智能體應(yīng)用中,Hy3 preview的首次響應(yīng)速度提升了54%,任務(wù)平均完成時間縮短47%,任務(wù)成功率維持在99.99%的高位。此外,接入該模型的騰訊文檔 AI PPT功能,其生成成功率較上一代提升了20%。目前,Hy3 preview已全面接入騰訊多個產(chǎn)品,包括騰訊元寶、QQ瀏覽器、微信讀書等多個業(yè)務(wù)場景。
值得注意的是,除了騰訊業(yè)務(wù)外,在 OpenRouter公布的 Hy3 preview調(diào)用量最多的 APP排行榜上,前5名均為國際主流智能體和代碼類應(yīng)用。
未來,騰訊混元還將繼續(xù)在OpenRouter上以極具性價比的價格提供 API接入服務(wù),并通過多樣化的 Token Plan以及開源等形式繼續(xù)服務(wù)全球開發(fā)者。