速递｜OpenAI 推出 ChatGPT 高级语音模式，Plus 用户率先体验 GPT-4o 超逼真语音交互 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

速递｜OpenAI 推出 ChatGPT 高级语音模式，Plus 用户率先体验 GPT-4o 超逼真语音交互

有新Newin

2024-08-01

0 评论 2127 浏览 3 收藏

3 分钟

7月30日，OpenAI推出了ChatGPT的高级语音模式，为用户带来了前所未有的GPT-4o超逼真语音交互体验。

7 月 30 日，OpenAI 推出了 ChatGPT 高级语音模式，用户首次能够体验 GPT-4o 超逼真语音交互。目前，Alpha 版本面向于小部分 ChatGPT Plus 用户，秋季之后将逐步推广至所有 Plus 用户。

OpenAI 表示，春季更新期间演示的视频和屏幕共享功能并不包括在 Alpha 版本在内，而是在后面推出。

ChatGPT 高级语音模式不同于此前的语音模式，原有的音频解决方案使用了三个独立的模型：一个用于将用户的语音转换为文本，然后由 GPT-4 处理 Prompt，然后由第三个模型将 ChatGPT 生成的文本转化为语音。

GPT-4o 是一个多模态模型，能够在没有其他模型辅助的情况下处理这些任务，因为在体验上将显著降低对话的延迟。

OpenAI 还透露，GPT-4o 可以感知用户声音中的情绪语调，包括悲伤、兴奋或者唱歌；目前，Alpha 组的用户将在 ChatGPT 中收到提醒，并将收到一封邮件介绍如何使用。

据悉，高级语音模式种的预设声音将仅限 Juniper、Breeze、Cove 以及 Ember，这些都是与付费配音演员合作制作的，而 5 月份演示的 Sky 声音将不再可用。

OpenAI 发言人 Lindsay McCallum 表示，ChatGPT 目前还无法模仿其他人的声音，无论是个人还是公众人物，并且会屏蔽与这四种预设声音不同的输出。

此外，OpenAI 引入了新的过滤方式来避免模型生成受版权保护的音频，从而造成法律纠纷。

自发布 Demo 以来，OpenAI 已经与 100 多名使用 45 种不同语言的外部红队成员一起测试了 GPT-4o 语音功能，相关的安全措施报告将在 8 月初发布。

本文由人人都是产品经理作者【江天 Tim】，微信公众号：【有新Newin】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

有新Newin

提供前沿领域商业洞见与资讯

141篇作品 347105总阅读量

“近期生活状态被各个APP的算法吃透”：用户对算法的感知及规训

01-133557 浏览

“近期生活状态被各个APP的算法吃透”：用户对算法的感知及规训

抖音京东加码小时达，大厂打响即时零售争夺战

04-263277 浏览

抖音京东加码小时达，大厂打响即时零售争夺战

骂得越凶，优惠越狠！

03-025678 浏览

骂得越凶，优惠越狠！

聊聊图书行业：做书亏钱，直播亏本

04-234265 浏览

聊聊图书行业：做书亏钱，直播亏本

行业化：通用 SaaS 企业的“持久战”

11-163150 浏览

行业化：通用 SaaS 企业的“持久战”

评论

目前还没评论，等你发挥！

像搭积木一样的组件产品该如何设计

11-163110 浏览
本地生活第二梯队参战，谁能虎口夺食？

06-274477 浏览
双11前如何在小红书上利用热点话题，实现低成本爆品打造？

10-102125 浏览