速遞|OpenAI 推出 ChatGPT 高級語音模式,Plus 用戶率先體驗 GPT-4o 超逼真語音交互
7月30日,OpenAI推出了ChatGPT的高級語音模式,為用戶帶來了前所未有的GPT-4o超逼真語音交互體驗。
7 月 30 日,OpenAI 推出了 ChatGPT 高級語音模式,用戶首次能夠體驗 GPT-4o 超逼真語音交互。目前,Alpha 版本面向于小部分 ChatGPT Plus 用戶,秋季之后將逐步推廣至所有 Plus 用戶。
OpenAI 表示,春季更新期間演示的視頻和屏幕共享功能并不包括在 Alpha 版本在內,而是在后面推出。
ChatGPT 高級語音模式不同于此前的語音模式,原有的音頻解決方案使用了三個獨立的模型:一個用于將用戶的語音轉換為文本,然后由 GPT-4 處理 Prompt,然后由第三個模型將 ChatGPT 生成的文本轉化為語音。
GPT-4o 是一個多模態模型,能夠在沒有其他模型輔助的情況下處理這些任務,因為在體驗上將顯著降低對話的延遲。
OpenAI 還透露,GPT-4o 可以感知用戶聲音中的情緒語調,包括悲傷、興奮或者唱歌;目前,Alpha 組的用戶將在 ChatGPT 中收到提醒,并將收到一封郵件介紹如何使用。
據悉,高級語音模式種的預設聲音將僅限 Juniper、Breeze、Cove 以及 Ember,這些都是與付費配音演員合作制作的,而 5 月份演示的 Sky 聲音將不再可用。
OpenAI 發言人 Lindsay McCallum 表示,ChatGPT 目前還無法模仿其他人的聲音,無論是個人還是公眾人物,并且會屏蔽與這四種預設聲音不同的輸出。
此外,OpenAI 引入了新的過濾方式來避免模型生成受版權保護的音頻,從而造成法律糾紛。
自發布 Demo 以來,OpenAI 已經與 100 多名使用 45 種不同語言的外部紅隊成員一起測試了 GPT-4o 語音功能,相關的安全措施報告將在 8 月初發布。
本文由人人都是產品經理作者【江天 Tim】,微信公眾號:【有新Newin】,原創/授權 發布于人人都是產品經理,未經許可,禁止轉載。
題圖來自Unsplash,基于 CC0 協議。
- 目前還沒評論,等你發揮!