OpenAI 凌晨发布 o1 系列推理模型的两个 o1-preview 以及 o1-mini，旨在真正像人类一样思考 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

OpenAI 凌晨发布 o1 系列推理模型的两个 o1-preview 以及 o1-mini，旨在真正像人类一样思考

2024-09-13

1 评论 8167 浏览 0 收藏

找到工作只是第一步。我们的核心目标是，通过系统的学习和实战训练，不仅让你成功入职，更能让你具备快速胜任工作的能力，在团队中站稳脚跟。

OpenAI在深夜发布了o1系列推理模型，标志着人工智能在模拟人类思考方面迈出了重要一步。新模型在处理科学、编程和数学问题上展现出前所未有的能力，预示着AI技术的又一次飞跃。本文介绍了o1系列模型的特点、安全性措施以及如何为不同用户提供服务。

凌晨，OpenAI 在没有任何预告下正式发布了全新 o1 系列模型：

据悉，这次发布的 o1-preview 是 o1 系列模型的首个尝鲜版，OpenAI 预计会有定期的更新和改进。

与此同时，OpenAI 还包括了正在开发中的下一次更新的评估。

包括 o1 在内的系列模型，旨在花更多时间进行思考，能够推理复杂任务，并在科学、编程和数学等领域解决比以往模型更难的问题。

如何定义B端产品及B端产品经理方法论

相较于C端产品，B端产品最大的特点是：面向特定领域用户，且数量少得多，但更注重对用户专业领域操作流程的深度挖掘——也就是专业性更强，与业务的结合更紧密。

OpenAI 将其比喻成人类。通过训练，这些模型学会优化思考过程，尝试不同的策略，并能够识别自己的错误，真正的像人类一样思考。

OpenAI 透露，o1-preview 是系列推理模型在 ChatGPT 和 API 中的早期预览，OpenAI 还计划继续开发并发布 GPT 系列的模型，同时发布新的 OpenAI o1系列模型。

除了模型更新外，OpenAI 预计还会增加浏览、文件和图片上传等功能，以使其对所有人更有用。

o1 系列及 o1-preview 模型

在 OpenAI 测试中，推理模型在物理、化学和生物等挑战性基准任务中表现得与博士生相当。

在数学和编程方面表现出色。在国际数学奥林匹克（IMO）选拔考试中，GPT-4o 只正确解决了 13% 的问题，而推理模型得分为 83%。编程能力在比赛中达到了Codeforces 竞赛的 89 百分位。

OpenAI 表示，作为早期模型，目前还不具备使 ChatGPT 实用的许多功能，比如浏览信息、上传文件和图片。对于许多常见情况，GPT-4o 在短期内会更为强大。

但对于复杂的推理任务，这代表了 AI 能力的重大进展。OpenAI 将计数器重置为1，并将这一系列命名为OpenAI o1。

安全性

在开发该系列新模型过程中，OpenAI 提出了一种新的安全训练方法，利用它们的推理能力，使其遵循安全和一致性指南。通过在上下文中推理安全规则，模型能够更有效地应用这些规则。

OpenAI 通过测试模型在用户尝试绕过其安全规则（即“越狱”）时的表现来衡量安全性。

在OpenAI 最难的越狱测试中，GPT-4o 得分为22（满分 100 分），而 OpenAI 的o1预览模型得分为 84。

为了匹配这些模型的新能力，OpenAI 加强了OpenAI 的安全工作、内部治理以及与联邦政府的合作。

包括使用OpenAI 的《准备框架》进行严格的测试和评估、世界级的红队测试、以及包括安全与安保委员会在内的董事会级别审查流程。

为了推进对AI安全的承诺，OpenAI 最近与美国和英国 AI 安全机构达成了正式协议。OpenAI 已开始将这些协议落实到位，包括为这些机构提供该模型研究版本的早期访问。

适用人群

OpenAI 表示，这些增强的推理能力可能对解决科学、编程、数学等领域的复杂问题特别有用。

例如，o1可以帮助医疗研究人员标注细胞测序数据，帮助物理学家生成量子光学所需的复杂数学公式，并帮助各领域的开发人员构建和执行多步工作流程。

OpenAI o1-mini

OpenAI 表示，o1系列在准确生成和调试复杂代码方面表现优异。

为了为开发人员提供更高效的解决方案，OpenAI 还发布了OpenAI o1-mini，这是一款更快、更便宜的推理模型，特别适用于编程。

作为较小的模型，o1-mini 的成本比 o1 预览版便宜 80%，是一款适合需要推理但不需要广泛世界知识的应用的强大且具成本效益的模型。

如何使用 OpenAI o1

9 月 12 日起，ChatGPT Plus 和 Team 用户可以在 ChatGPT 中访问 o1 模型。可以手动选择 o1-preview 和 o1-mini 模型，发布时每周的消息限制分别为30条和50条。

目前，OpenAI 正在努力增加这些限制，并使ChatGPT能够自动选择最合适的模型。下周，ChatGPT Enterprise 和 Edu 用户也将能够访问这两个模型。

据悉，开发者可以开始使用 API 原型开发，限速为每分钟20次请求。经过额外测试后，OpenAI 将努力提高这些限制。

当前这些模型 API 不包括函数调用、流式传输、系统消息支持等功能。此外，OpenAI 也计划为所有ChatGPT免费用户提供 o1-mini 访问权限。

本文由人人都是产品经理作者【江天 Tim】，微信公众号：【有新Newin】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自OpenAI社交媒体截图

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

提供前沿领域商业洞见与资讯

92篇作品 197885总阅读量

如何做产品——产品核心功能分析

12-315815 浏览

如何做产品——产品核心功能分析

Z时代情绪陪伴社区——心岛日记竞品分析

03-229918 浏览

Z时代情绪陪伴社区——心岛日记竞品分析

C端转B端：我的产品经理角色调整之路

刚刚

你使用过导购软件吗？

01-066922 浏览

你使用过导购软件吗？

4万座“围城”，圈住100万个达人梦

04-104429 浏览

4万座“围城”，圈住100万个达人梦

做电商遇到的那些破事及应对方法

05-096570 浏览

做电商遇到的那些破事及应对方法

评论

唔西迪西

AI赛道毋庸自疑是势不可挡的，未来想要提高我们的核心竞争力学会用并且用的好是一个很关键的点

最近来自广东回复

B端产品经理面试，都需要注意那些细节（业务篇）

12029人已学习12篇文章

如何做好数据管理？

数据管理系统在后期能够为企业提供基础数据服务，保证企业往更好的方向运营。本专题的文章分享了如何做好数据管理。

15888人已学习12篇文章

如何设计运费规则？

运费是电商的基础功能模块之一，承担着商品运费计算的作用。本专题的文章分享了如何设计运费规则。

127834人已学习33篇文章

小程序该如何设计和运营？

小程序时代，产品经理和运营人员该如何拥抱这种变化？

45630人已学习12篇文章

个性化推荐算法是什么，怎么做？

产品经理和运营都要懂一点的推荐算法基础和进阶知识

15659人已学习13篇文章

如何设计和应用用户画像？

用户画像是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。本专题的文章分享了如何设计和应用用户画像。

13938人已学习12篇文章

用户调研的方法论

用户调研作为产品人员最常用的工作方式，相信各位一定不会陌生。但如何提高用户调研的有效性却是一直困扰大家的问题。本专题的文章分享了用户调研的方法论。