不怕模型混乱,OpenAI又推“全能模”GPT-4.1,B端市场福音

鲸选AI
0 评论 1609 浏览 1 收藏 6 分钟
🔗 技术知识、行业知识、业务知识等,都是B端产品经理需要了解和掌握的领域相关的知识,有助于进行产品方案设计和评估

OpenAI再推新模型GPT-4.1,性能更强、成本更低,能否成为B端市场的“全能选手”?从多模态能力到编程表现,这款模型能否扛起商业化大旗?

不怕模型混乱,OpenAI又推“全能模”GPT-4.1,B端市场福音

OpenAI刚出官方博客,夸赞GPT-4.5是比 4 聪明10倍的模型,转眼就又推出了GPT-4.1,还是非推理模型,还更便宜。

有网友评价:“GPT-4.5甚至还没来及说再见!”而且这次没说明,为何数字命名又倒退了?难道Altman也分不清 9.9 和 9.11 的大小?

言归正传,OpenAI最新发布的三个新模型是:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。

  • GPT-4.1 是 OpenAI 最新旗舰大模型,具有更好的编程与写作能力,支持最长 100 万 token 上下文,适用于复杂任务。
  • GPT-4.1 Mini 是中端任务模型,性能接近GPT-4o,但成本降低 83%。
  • GPT-4.1 Nano 是OpenAI最快+最便宜模型的本地运行小模型,持 AI 智能硬件助手等边缘应用。

官方提到,4.1在编码和指令跟踪方面均有显著提升,多模态能力提升巨大,实际上差不多提升了三分之一左右。

具体来说,GPT-4.1 被视为 GPT-4o 的全面升级版,具备更强的多模态处理能力、更大的上下文窗口(全部可处理 100 万个 token),并且成本降低了 26%。

GPT-4.1 按延迟划分的家庭智能

OpenAI又端出了一盘菜,琳琅满目的模型选择,本质上也没有很大的差别,能力上也没有拉开绝对差距。

实际上,Altman也意识到这一问题,宣称GPT-5 将整合语音、画布、搜索、Deep Research 等功能。“我们的一个核心目标是通过创建能够使用所有工具、知道何时需要长时间思考、并且适用于广泛任务的系统,来统一 o 系列模型和 GPT 系列模型。”

GPT-4.1有点GPT-5的影子了,意味着OpenAI也在尝试初步解决模型杂乱这一问题。

这次推出 GPT-4.1,核心目标就是逐步淘汰一些旧模型。

此前官宣GPT-4 将于 2025 年 4 月 30 日从 ChatGPT 中退役,由更强的 GPT-4o 完全替代。 GPT-4.1未来也许会正在逐步取代 GPT-4o,目前除了文生图能力还没有,4.1已经全面超越了4o。

而GPT-4.5 的预览版将于 7月14 日从 API 中下线,4.1成为主流To B服务模型,适用于大多数用户和开发者,具有更强的性能和更低的成本。

鲸哥个人认为,GPT-5不会顺利在第三季度推出,年底能出现就算不错了。

GPT-4.1可能是今年OPenAI扛大梁的模型,因此这款模型的能力边界就值得关注。

在重要的 SWE-bench Verified 编程能力基准测试中的得分比较,GPT-4.1 的任务完成率为54.60%,位列第四名。

看似成绩不如Claude 3.7 sonnet、Gemini 2.5 Pro Exp这些老对手,但要注意第一名是不会发布的o3模型(未来直接融入GPT5一起发布)。

接下来研究4.1的多模态识别能力和代码生成能力,鲸哥用第一时间免费上线 4.1 API的 Windsurf,输入图片让其生成动态可视化网页,这样识图能力和代码生成能力都可以体现。

审美距Claude3.7还有距离

另一方面,GPT-4.1 nano API定价和 Gemini Flash 几乎相同,这是针对Google的又一次狙击。

够用且便宜,这是OpenAI在模型进展不明显的情况下,还要推出4.1的缘由,他需要4.1和竞争对手抢占市场,尤其是B端市场,接替3.5和4o mini。

像DeepSeek一样追逐技术高峰,至今官网没解决经常崩溃的用户体验问题。OpenAI在GPT-5来临前,还需要兼顾商业化。

而且,据悉OpenAI 计划在新一代推理模型(o3、o4),整合跨学科知识整合能力,并对该模型收取高达 2 万美元/月的费用,大约是普通 ChatGPT Plus 订阅价格的 1000 倍。

显然不是给普通用户准备的,这次GPT-4.1也没第一时间上ChatGPT,让C端用户第一时间体验。

期待GPT-4.1早日更新到ChatGPT,能力更强,月费也能更便宜。

本文由人人都是产品经理作者【鲸选AI】,微信公众号:【鲸选AI】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。

题图来自Unsplash,基于 CC0 协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!
专题
20631人已学习19篇文章
好的权限系统可以明确公司内不同人员、不同部门的分工,便于管理等优势。本专题的文章提供了后台权限管理设计指南。
专题
37860人已学习22篇文章
复盘是产品经理和运营人提高自身竞争力的不二法门。
专题
12893人已学习12篇文章
“私域流量”概念火爆的背后,既有企业焦虑,也有赛道风口。而巧的是,在线教育同样面临增长获客难的问题。本专题的文章分享了在线教育行业如何做私域运营。
专题
11610人已学习12篇文章
本专题的文章分享了情人节的营销思路。
专题
52589人已学习14篇文章
现在业内很多人都强调产品思维,但它到底是什么?又有何用武之地呢?
专题
13687人已学习11篇文章
本专题的文章以To G领域为例,从产品经理的角度,分享TO G产品设计指南。