伊人六月,97自拍超碰,久久精品亚洲7777影院,五月婷婷综合在线观看,日本亚洲欧洲无免费码在线,2019国产精品视频,国产精品第一页在线

首頁(yè)  ?  新聞?lì)l道  ?  國(guó)內(nèi)新聞

國(guó)內(nèi)多數(shù)模型訓(xùn)練使用中文數(shù)據(jù)占比超60%

2025-08-19 08:42:00

來(lái)源:人民網(wǎng)-人民日?qǐng)?bào)

  本報(bào)北京8月18日電  (記者王云杉)記者從國(guó)家數(shù)據(jù)局獲悉:中文數(shù)據(jù)在國(guó)內(nèi)大模型的訓(xùn)練性能提升方面發(fā)揮著重要作用。國(guó)內(nèi)多數(shù)模型訓(xùn)練使用的中文數(shù)據(jù)占比已經(jīng)超過(guò)60%,有的模型達(dá)到80%。中文高質(zhì)量數(shù)據(jù)的開(kāi)發(fā)和供給能力持續(xù)增強(qiáng),推動(dòng)我國(guó)人工智能模型性能快速提升。

  在人工智能時(shí)代,Token(通常所說(shuō)的詞元)是處理文本的最小數(shù)據(jù)單元。國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏介紹,2024年初,我國(guó)日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬(wàn)億,1年半時(shí)間增長(zhǎng)了300多倍,反映了我國(guó)人工智能應(yīng)用規(guī)模的快速增長(zhǎng)。

  《 人民日?qǐng)?bào) 》( 2025年08月19日 06 版)

  • 相關(guān)閱讀
免責(zé)聲明:本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類(lèi)版權(quán)申明,本網(wǎng)站無(wú)法鑒別所上傳圖片或文字的知識(shí)版權(quán),如果侵犯,請(qǐng)及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。