调用量破万亿,AI 能力正在向所有人开放
当AI应用的成本门槛成为开发者难以逾越的鸿沟,Agnes AI的免费策略正在改写行业规则。三大模态API全面开放一周即创下1万亿次文本调用、200万张图片生成的惊人数据,4K超高清图像与1M token长文本两大升级即将上线。这不仅是一场商业模式的颠覆,更是对AI普惠本质的回归。

搭一个真正能跑起来的 AI agent 工作流,到底要花多少钱?这个问题很少被正面讨论,但对每一个独立开发者和中小团队来说,这是绕不开的现实。多轮对话、工具调用、图片理解、视频生成,叠加在一起,token 消耗是惊人的。很多本来有意义的 AI 应用,就卡在从原型走向规模化的这道成本门槛上,直接夭折了。
6 月 1 日,Agnes AI 宣布,将旗下文本、图片、视频三大模态的核心模型 API 向全球开发者和创作者无限期免费开放。消息一出,开发者社区的反应相当直接:有人当天就开始迁移项目,有人把之前搁置的想法重新捡了起来,也有人在论坛上问”这是真的吗,有什么限制吗”。答案是:真的,没有隐藏限制,无限期免费。

一周数据:市场用行动投了票
免费开放满一周,Agnes AI 公布了第一批使用数据。这组数字,我觉得比任何营销话术都更能说明问题。
文本模型 Agnes-2.0-Flash 在六月第一周的调用量已经突破 1 万亿次(1T)。图像模型 Agnes-Image-2.1-Flash 在同期生成了超过 200 万张图片。视频模型 Agnes-Video-2.0 生成了超过 200 万秒的视频内容。三个模型,三大模态,一周内全部出现了爆发式增长。
这种增长速度说明了一件事:需求一直都在,是成本在拦着它。当门槛被拆掉之后,被压制的使用需求会迅速释放出来。很多开发者不是不想用多模态 AI,而是在真实的项目里,图片加视频加文本叠加下来的 API 费用,让他们一直在做取舍。现在这道取舍消失了。

即将到来的两个升级
在宣布免费开放之后,Agnes AI 接下来还有两个能力升级即将落地,分别对应图像和文本两个方向。
图像模型 Agnes-Image-2.1-Flash 即将开放 4K 超高清输出能力,目前处于内测阶段,正式上线时间近期确认。4K 档位最高可生成 4096×4096 的超高清图像,支持 1:1、16:9、9:16、3:4 等主流宽高比。以 16:9 为例,输出分辨率可以达到 5248×2944。相比现有版本,4K 在细节表现、纹理还原和大尺寸场景的稳定性上都有明显提升,更适合用于大屏展示、高清印刷品素材初稿,或者对画面细节有更高要求的创意项目。接入方式极简,只需要在 API 请求里把 size 参数改成 “4K”,其他代码逻辑完全不变。4K 输出同样免费,不收任何额外费用。

文本模型 Agnes-2.0-Flash 本周将全面更新 1M token 的超长上下文窗口。这个升级对实际开发的影响是很具体的。在文档处理上,数百页的 PDF、完整的研究报告、一整本书,可以一次性扔进去,让模型通读、分析、归纳核心观点,不需要分段处理,也不用担心前面的内容被截断或遗忘。在 agent 场景中,1M 的上下文意味着可以同时承载更详细的任务规划、更丰富的工具调用历史和更复杂的中间推理结果,从而更可靠地完成涉及数十个步骤的复杂工作流。在编程辅助方面,一个包含多个模块、数千行代码的完整项目可以一次性提交,做整体分析、代码重构或 Bug 排查,这种项目级的编程辅助体验和以前每次只能处理几千行代码完全不同。1M 上下文窗口同样作为标配能力内置,不额外收费。

为什么这件事对开发者真正重要
我一直觉得,AI 行业有一个结构性的问题很少被直接讨论:模型能力的竞争是公开的,媒体和榜单每天都在报道哪个模型更强。但使用成本的竞争是隐形的,它悄悄决定了哪些 AI 应用能活下去,哪些只能停留在 demo 阶段。
以一个典型的企业内部知识库问答系统为例。用户每天几百次查询,每次触发多轮对话、文档检索和工具调用,单次消耗可能在几千到几万 token 之间。如果再加上定期的文档处理和索引更新,一个月的 API 开销可能远超服务器成本。这让很多本来可行的 AI 应用,在规模化的过程中直接死在了账单上。对于中小企业来说,这道门槛尤其残酷——他们没有大公司的预算去做长期的 AI 基础设施投入,但他们同样需要 AI 能力来提升竞争力。
Agnes AI 做这件事的逻辑,我理解是一种基础设施叙事的实践。他们说的”高质量 AI 不应只属于高预算公司”,不是一句口号,而是在用定价行动表达一个判断:AI 的真正价值,应该通过被更多人使用来实现,而不是通过限制访问来保护。这和过去几年很多 AI 公司靠高价 API 变现的路线,是截然不同的方向。把 AI 当作长期基础设施来建设,就意味着普及本身是目标,而不是手段。

对于独立开发者来说,现在可以用 Agnes-2.0-Flash 搭建 AI agent 工作流、处理长文档、跑代码生成;用 Agnes-Image-2.1-Flash 做图片编辑、背景替换、批量素材生产;用 Agnes-Video-2.0 生成短视频内容。三大模态,全部零成本。如果你之前因为 API 费用搁置了某个想法,现在是重新把它捡起来的时机。
怎么接入使用
接入门槛很低。文本模型和图像模型的 API 都兼容 OpenAI 的接口格式,这意味着大多数已经对接过 OpenAI 的项目,只需要修改 endpoint 和模型名称就可以直接切换,不需要改动其他代码逻辑。
文本模型的接口地址是 https://apihub.agnes-ai.com/v1/chat/completions,模型名称是 agnes-2.0-flash,使用标准 Bearer Token 认证。支持 Chat Completion、流式输出、工具调用、多轮对话、图片 URL 输入和 JSON 格式输出。对于编程任务或者复杂的 agent 工作流,建议在请求里开启 Thinking 模式,在 chat_template_kwargs 里设置 enable_thinking: true 即可,这个模式可以明显提升代码质量、任务拆解能力和多步骤任务的完成率。
图像模型的接口地址是 https://apihub.agnes-ai.com/v1/images/generations,模型名称是 agnes-image-2.1-flash,支持多种清晰度档位和宽高比,返回格式可以选择 URL 链接或 Base64,根据业务需求灵活选择。
如果不想自己写代码,平台也支持通过 Cherry Studio、Claude Desktop、WorkBuddy 等常见 AI 工具直接接入,操作步骤简单,上手门槛很低。注册和获取 API Key 可以直接访问 https://platform.agnes-ai.com/ 完成。
AI 平权,从现在开始
过去几年,顶级 AI 能力一直是有门槛的——不是技术门槛,而是预算门槛。谁能调用最好的模型,谁就有竞争优势。这种不对等,在悄悄拉大大公司和小团队之间的距离。
Agnes AI 想做的事,是把这道门槛拆掉。世界级的文本理解、图像生成、视频创作能力,不应该只属于能付得起高额 API 费用的公司。一周破万亿的调用量,证明了这个判断是对的——当真正的好东西变得人人可及,市场会用行动告诉你答案。
这不只是一家 AI 公司的商业决策,而是对整个行业提出了一个问题:AI 普及的速度,到底应该由技术决定,还是由价格决定?Agnes AI 选择了自己的答案。
本文由人人都是产品经理作者【深思圈】,微信公众号:【深思圈】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




