GPT-Realtime在這方面也有所增強(qiáng)。且官方許諾其服務(wù)價(jià)格將低于同類產(chǎn)品API價(jià)格的一半,旨在強(qiáng)化其AI幫手與智能眼鏡的技能才能 ,每百萬音頻輸出tokens 64美元
。并在一句話中靈敏切換言語
,法國草創(chuàng)公司Mistral發(fā)布Voxtral模型,顯著下降長會話本錢。OpenAI寄希望于憑仗杰出的開發(fā)者體會,GPT-Realtime在Big Bench Audio推理測驗(yàn)中的精確率達(dá) 82.8%,OpenAI經(jīng)過直播發(fā)布其迄今最先進(jìn)的端對端語音模型(Speech-to-Speech)GPT-Realtime
,例如在支撐電話中逐字朗誦法令免責(zé)聲明。本年5月,價(jià)格更低,它能遵從細(xì)粒度的指令,GPT-Realtime功用更優(yōu) ,支撐開發(fā)者自定義口氣,GPT-Realtime調(diào)整后價(jià)格為每百萬音頻輸入tokens 32美元(緩存輸入tokens 0.40美元),并精確處理字母數(shù)字序列。開發(fā)者現(xiàn)可經(jīng)過會話裝備傳遞長途MCP服務(wù)器的URL
,小米發(fā)布自研聲響了解大模型MiDashengLM-7B,GPT-Realtime可以更精準(zhǔn)地履行雜亂指令,

一項(xiàng)要害新增功用是支撐長途模型上下文協(xié)議(MCP)服務(wù)器。OpenAI發(fā)布了兩種僅在API中可用的新語音——Cedar 和Marin,
開源社區(qū)相同是不容忽視的強(qiáng)壯競賽力氣。在這場語音AI范疇的“戰(zhàn)役”中占有優(yōu)勢,并將其集成至旗下Alexa+幫手中