伊人六月,97自拍超碰,久久精品亚洲7777影院,五月婷婷综合在线观看,日本亚洲欧洲无免费码在线,2019国产精品视频,国产精品第一页在线

首頁  >  財(cái)經(jīng)  >  財(cái)經(jīng)要聞

OpenAI加碼音頻人工智能研發(fā),備戰(zhàn)首款硬件設(shè)備

2026-01-02 16:52:00

來源:環(huán)球市場播報(bào)

OpenAI 首席執(zhí)行官山姆?奧特曼

  作者:斯蒂芬妮?帕拉佐洛

  知情人士透露,OpenAI 正全力升級音頻人工智能模型,為最終推出首款人工智能驅(qū)動的個人硬件設(shè)備做準(zhǔn)備。另有三位知情人士表示,這款設(shè)備將以音頻交互為核心形態(tài)。

  用戶與 ChatGPT 語音對話時(shí),雖能得到語音回復(fù),但支撐該音頻功能的大語言模型,與 ChatGPT 文本回復(fù)所依托的模型并非同款。OpenAI 一位前員工和一位現(xiàn)任員工透露,公司研究人員認(rèn)為,當(dāng)前音頻模型在回復(fù)準(zhǔn)確率、響應(yīng)速度上,均落后于文本模型。

  核心要點(diǎn)

  ? OpenAI 整合多支團(tuán)隊(duì),為新一代硬件升級音頻 AI 模型

  ? 全新音頻模型架構(gòu),可實(shí)現(xiàn)更自然、精準(zhǔn)、富有情感的語音交互

  ? 首款設(shè)備定位智能陪伴助手,主動提供建議助力用戶達(dá)成目標(biāo)

  深耕研發(fā),攻堅(jiān)音頻技術(shù)

  知情人士表示,過去兩個月,OpenAI 已整合工程、產(chǎn)品、研究等多個核心團(tuán)隊(duì),專項(xiàng)攻堅(jiān)音頻模型優(yōu)化,全力適配未來硬件設(shè)備的需求。

  提升音頻模型準(zhǔn)確率,是 OpenAI 打造語音指令操控消費(fèi)級設(shè)備的關(guān)鍵前提。此前《信息報(bào)》曾報(bào)道,這款硬件設(shè)備預(yù)計(jì)至少還需一年才會正式發(fā)布。

  目前,OpenAI 的音頻模型升級已初見成效。上述知情人士稱,全新音頻模型架構(gòu)生成的回復(fù)語音更自然、更富情感,答案也更精準(zhǔn)、更具深度;該模型還將實(shí)現(xiàn)與用戶實(shí)時(shí)同聲對話(現(xiàn)有模型無法做到),并能更好地應(yīng)對用戶的中途插話。

  據(jù)悉,OpenAI 計(jì)劃于 2026 年第一季度推出這款全新音頻模型。OpenAI 發(fā)言人對此不予置評。

  與谷歌、亞馬遜、元宇宙平臺、蘋果等企業(yè)一樣,OpenAI 也在布局新一代個人人工智能設(shè)備,包括可穿戴設(shè)備。多家企業(yè)認(rèn)為,當(dāng)下主流設(shè)備(如蘋果手機(jī))并未針對未來人工智能技術(shù)做優(yōu)化適配。

  OpenAI 的硬件研發(fā)團(tuán)隊(duì)希望用戶通過語音而非屏幕與設(shè)備交互。包括前 OpenAI 首席技術(shù)官米拉?穆拉蒂聯(lián)合創(chuàng)立的人工智能初創(chuàng)公司思維機(jī)器實(shí)驗(yàn)室在內(nèi),眾多人工智能研究者均認(rèn)為,語音交流是人與人工智能更自然的交互方式 —— 畢竟人與人之間的溝通也以語音為主。

  無屏設(shè)計(jì),規(guī)避設(shè)備成癮問題

  部分研究者還認(rèn)為,無屏幕設(shè)計(jì)能降低用戶對設(shè)備的成癮風(fēng)險(xiǎn)。正與 OpenAI 合作研發(fā)硬件的前蘋果首席設(shè)計(jì)官喬尼?艾夫表示,這是他的核心設(shè)計(jì)考量,他希望通過新一代設(shè)備,彌補(bǔ)過往消費(fèi)電子產(chǎn)品的設(shè)計(jì)缺憾。

  艾夫在 2025 年 5 月接受支付公司 Stripe 首席執(zhí)行官帕特里克?科里森采訪時(shí)表示:“即便初衷無過,但若參與打造的產(chǎn)品帶來不良后果,就必須承擔(dān)責(zé)任。于我而言,這份責(zé)任驅(qū)動著我如今的所有工作?!?/p>

  不過上述前員工坦言,OpenAI 當(dāng)前面臨一大難題:多數(shù) ChatGPT 用戶并未使用語音交互功能,究其原因,一是音頻模型體驗(yàn)欠佳,二是用戶對該功能并不知曉。要打造音頻優(yōu)先的人工智能設(shè)備,OpenAI 首先要讓消費(fèi)者養(yǎng)成與 ChatGPT 等產(chǎn)品語音交互的習(xí)慣。

  核心團(tuán)隊(duì)領(lǐng)銜,多品類設(shè)備蓄勢待發(fā)

  據(jù)悉,OpenAI 音頻人工智能研發(fā)的核心領(lǐng)軍人物是昆丹?庫馬爾 —— 他于 2025 年夏季從 Character.AI 加盟 OpenAI,專職負(fù)責(zé)音頻 AI 研發(fā)。其他核心負(fù)責(zé)人還包括:產(chǎn)品研究主管本?紐豪斯,主導(dǎo)重構(gòu)了 OpenAI 原有的文本人工智能基礎(chǔ)設(shè)施,適配音頻 AI 需求;多模態(tài) ChatGPT 產(chǎn)品經(jīng)理杰姬?香農(nóng)。

  多位知情人士透露,OpenAI 并非研發(fā)單一硬件設(shè)備,而是規(guī)劃推出全系硬件產(chǎn)品矩陣,并分階段發(fā)布。公司已探討的產(chǎn)品形態(tài)包括智能眼鏡、無顯示屏智能音箱

  上述知情人士稱,硬件研發(fā)團(tuán)隊(duì)在 2025 年夏季的內(nèi)部匯報(bào)中表示,這款設(shè)備將定位智能陪伴助手,全程協(xié)助用戶,主動提供建議幫用戶實(shí)現(xiàn)目標(biāo),而非單純作為連接各類應(yīng)用和軟件的工具。經(jīng)用戶授權(quán)后,設(shè)備還可通過音頻、視頻感知周邊環(huán)境與用戶狀態(tài)。

  OpenAI 多個部門均參與該硬件項(xiàng)目,涵蓋供應(yīng)鏈、工業(yè)設(shè)計(jì)、模型研發(fā)等環(huán)節(jié)。2025 年初,OpenAI 以近 65 億美元收購了喬尼?艾夫聯(lián)合創(chuàng)立的設(shè)計(jì)公司 io,全權(quán)負(fù)責(zé)硬件設(shè)備的設(shè)計(jì)工作。

免責(zé)聲明:本網(wǎng)對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時(shí)通知我們,本網(wǎng)站將在第一時(shí)間及時(shí)刪除。