LMArena 聯(lián)合創(chuàng)始人阿納斯塔西奧斯?安杰洛普洛斯
據(jù) LMArena 公司透露,這家憑借人工智能模型性能排名體系廣受行業(yè)認(rèn)可的初創(chuàng)企業(yè),在新一輪融資中籌集到 1.5 億美元資金,投后估值(含本次融資額)達(dá)到 17 億美元。這一估值較 2025 年 5 月披露的種子輪融資估值增長(zhǎng)了近兩倍。
本輪融資由現(xiàn)有投資方菲利斯資本以及加州大學(xué)投資部門聯(lián)合領(lǐng)投。所籌資金將用于兩方面:一是為公司的人工智能模型測(cè)評(píng)業(yè)務(wù)購(gòu)置算力資源 —— 其測(cè)評(píng)客戶涵蓋 OpenAI、谷歌、xAI、微軟等行業(yè)巨頭;二是招募技術(shù)人才。目前,每月有數(shù)百萬(wàn)人訪問(wèn) LMArena 的網(wǎng)站,通過(guò)模型兩兩對(duì)比的方式對(duì)其進(jìn)行評(píng)分,這些評(píng)分結(jié)果將作為模型排名的重要依據(jù)。
2025 年 9 月,LMArena 的年化營(yíng)收規(guī)模為數(shù)百萬(wàn)美元,其最新?tīng)I(yíng)收數(shù)據(jù)暫未對(duì)外披露。該公司估算,按照近期客戶使用量推算的 “年化消費(fèi)營(yíng)收額” 已于上月突破 3000 萬(wàn)美元。
這家公司脫胎于近三年前啟動(dòng)的一個(gè)開(kāi)源項(xiàng)目,目前在全球 150 個(gè)國(guó)家和地區(qū)擁有超 500 萬(wàn)月活躍用戶,不過(guò)暫不清楚這一數(shù)據(jù)是否同時(shí)包含網(wǎng)站訪客與模型評(píng)分參與者。
LMArena 的網(wǎng)站向所有互聯(lián)網(wǎng)用戶開(kāi)放,訪客可以在平臺(tái)上提出問(wèn)題,或是調(diào)用模型生成圖像等內(nèi)容。用戶需要在兩個(gè)模型輸出結(jié)果中選出更優(yōu)的一個(gè),之后平臺(tái)才會(huì)揭曉每個(gè)結(jié)果對(duì)應(yīng)的模型。LMArena 會(huì)將所有評(píng)分結(jié)果匯總,形成涵蓋人工智能代碼生成、圖像生成、視頻生成等多個(gè)類別的模型排行榜。
這家初創(chuàng)企業(yè)有時(shí)還會(huì)在模型正式發(fā)布前,提前接入平臺(tái)供用戶測(cè)評(píng),幫助模型開(kāi)發(fā)企業(yè)獲取早期反饋。隨著行業(yè)內(nèi)各個(gè)人工智能模型的性能差距逐漸縮小,模型開(kāi)發(fā)商開(kāi)始將自家產(chǎn)品在 LMArena 上的排名作為對(duì)外宣傳的重要亮點(diǎn)。
公司首席執(zhí)行官兼聯(lián)合創(chuàng)始人阿納斯塔西奧斯?安杰洛普洛斯表示:“頭部人工智能實(shí)驗(yàn)室選擇與我們合作,是因?yàn)樗麄兒茈y自行判斷旗下模型的優(yōu)劣水平?!?/p>
不過(guò),部分模型開(kāi)發(fā)商對(duì) LMArena 的測(cè)評(píng)方式提出了質(zhì)疑。他們認(rèn)為,依靠無(wú)償互聯(lián)網(wǎng)用戶提供反饋的模式存在缺陷,不僅容易被人為操縱,而且結(jié)果也無(wú)法反映行業(yè)專家的專業(yè)意見(jiàn)。與之形成對(duì)比的是,LMArena 的競(jìng)爭(zhēng)對(duì)手 —— 例如數(shù)據(jù)標(biāo)注初創(chuàng)企業(yè) Scale AI—— 會(huì)聘請(qǐng)律師、教授等專業(yè)人士對(duì)模型進(jìn)行評(píng)估打分。
針對(duì)外界的質(zhì)疑,LMArena 回應(yīng)稱,普通用戶在評(píng)判與自身相關(guān)的問(wèn)題答案時(shí),往往具備更精準(zhǔn)的判斷力,而且不向?qū)<抑Ц秷?bào)酬的模式,能夠讓平臺(tái)獲取更真實(shí)客觀的反饋。
公司聯(lián)合創(chuàng)始人揚(yáng)?斯托伊卡于 2025 年末在接受《信息》采訪時(shí)表示:“能獲得的最高質(zhì)量測(cè)評(píng) —— 也就是業(yè)內(nèi)所說(shuō)的‘黃金標(biāo)準(zhǔn)’,往往來(lái)自人們對(duì)自己熟悉領(lǐng)域的評(píng)價(jià)?!?/p>
揚(yáng)?斯托伊卡是美國(guó)加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)教授,同時(shí)也是數(shù)據(jù)中臺(tái)公司 Databricks 的聯(lián)合創(chuàng)始人。他最初與伯克利分校研究生阿納斯塔西奧斯?安杰洛普洛斯、江偉霖合作,以 “聊天機(jī)器人競(jìng)技場(chǎng)(ChatBot Arena)” 為項(xiàng)目名啟動(dòng)了這一測(cè)評(píng)平臺(tái)。項(xiàng)目早期資金完全來(lái)自各類科研資助與社會(huì)捐贈(zèng),直至 2025 年 5 月才正式轉(zhuǎn)型為營(yíng)利性企業(yè)。
斯托伊卡此前曾透露,LMArena 正考慮拓展業(yè)務(wù)邊界,計(jì)劃利用平臺(tái)積累的數(shù)據(jù),通過(guò)強(qiáng)化學(xué)習(xí)技術(shù)訓(xùn)練人工智能模型。強(qiáng)化學(xué)習(xí)是一種獎(jiǎng)懲機(jī)制驅(qū)動(dòng)的訓(xùn)練方法,模型完成既定目標(biāo)會(huì)獲得獎(jiǎng)勵(lì),反之則會(huì)受到懲罰。雖然人類反饋可以用于模型訓(xùn)練,但隨著 “推理型” 人工智能模型的興起,行業(yè)內(nèi)越來(lái)越傾向于從其他人工智能模型中獲取反饋數(shù)據(jù)。而向強(qiáng)化學(xué)習(xí)相關(guān)服務(wù)領(lǐng)域拓展,或?qū)椭?LMArena 持續(xù)貼合客戶的核心需求。
本輪融資聯(lián)合領(lǐng)投方、菲利斯資本的普通合伙人彼得?鄧恩表示:“一旦成為行業(yè)公認(rèn)的測(cè)評(píng)基準(zhǔn)平臺(tái),產(chǎn)品的業(yè)務(wù)邊界自然會(huì)隨之拓展。其核心價(jià)值在于與人工智能實(shí)驗(yàn)室建立深度合作關(guān)系 —— 將實(shí)驗(yàn)室的內(nèi)部數(shù)據(jù)與平臺(tái)的外部對(duì)比數(shù)據(jù)相結(jié)合。”
除領(lǐng)投方外,安德森?霍洛維茨基金、眾議院基金、LDVP 資本、凱鵬華盈、光速創(chuàng)投、勞德創(chuàng)投等機(jī)構(gòu)也參與了本輪融資。至此,LMArena 的融資總額已突破 2.5 億美元。