抢先体验GenFlow2.0:未来多Agent协作的理想形态
在 AI 浪潮席卷各行业的当下,一款名为 Genflow 2.0 的通用 Agent 产品悄然崭露头角。它能否打破中文语境下的应用瓶颈,为用户带来全新体验?让我们一同深入探索。

最近WAIC,黄叔去了一趟,正好百度在上海开了一个邀测会,可以抢先体验多智能体协作/通用Agent Genflow 2.0,作为内容创作者,那可太感兴趣了,中文语境下能不能做出来一款好的Agent产品呢?
女儿马上上小学三年级了,家长会上,班主任的表情前所未有的严肃,反复强调着几个词:“教学改革”、“真实问题驱动”、“计算变难”。我坐在为孩子准备的小小板凳上,感觉背部有些僵硬,心里和所有家长一样,咯噔一下。
这种感觉你懂的。上一秒还觉得孩子刚脱离牙牙学语,下一秒,一个名为“教改”的巨浪就毫无征兆地扑面而来。
之前我也搜了搜这都是啥,但没有好的答案,要不拿Genflow试试吧,把我的焦虑,喂给它:听说现在小学三年级开始进行教学改革,帮我详细介绍一下这一次教学改革的主要方向,特别是对语文、数学、英语等重要学科有什么样的调整。

但很快,我发现它生成的信息有些过于宽泛,似乎在整合全国的数据。在过去,这意味着这次生成基本等于失败了,你只能等它跑完,然后重来。
但这次,我看到了那个“暂停”按钮。
我几乎是下意识地按了下去,然后补充了一句指令:“要重点以北京市教育改革为介绍!”

奇妙的事情发生了。Genflow没有重头再来,而是在我叫停的地方,立刻调转方向,像一个能随时听我插话的聪明助理,开始聚焦于北京地区的具体政策:

这就非常方便了,过去的Agent就像一匹脱缰的野马,
过程中很难干预,Genflow不光可以随时暂停调整需求,还可以补充文件来扩展资料,还可以修改PPT大纲:

最后出来的结果很不错,提到了数学“改革聚焦于运算能力与概念理解的深度整合”,语文和英语也都说到了点子上:


解决了心头大患,我心里踏实了不少。我的角色,也从一个焦虑的父亲,切换回了那个爱整活的科技博主。我开始好奇,这个能写严肃报告的家伙,能不能陪我“玩”一会儿?
黄叔来整活一下:帮我生成一张labubu开跑车兜风的照片,风格是真实世界风,要求同时生成5张创意图片,每张图片的背景是不同的知名景点。

几乎没给我反应的时间,“唰”地一下,五张风格各异的图片就铺在了我的眼前。并且生成效果真的挺不错的:

这张背景还搞了虚化。。。会玩
我又想到了一个更离谱的主意:

等下,Genflow不是内容生成Agent么?怎么这种任务也可以执行:

我。。。真的能用,并且生成的速度好快:

会上,百度的人解释说,这种流畅、并发且跨模态的能力,得益于他们为Agent全新打造的“沧舟OS”。该系统以底层、中枢和Agent为核心,实现了全模态的输入、处理到输出,让不同的智能体能够高效协作。
从输入-处理-输出三个部分,沧舟OS做到了允许多种输入模态,然后在中控和不同的Agent+AI模型处理,再输出成不同模态的内容。
在它上面,文库网盘也全自研了整个Genflow 2.0架构!
说到为何自研,也显示了百度在技术上的积累,他们也深入研究了各种技术框架,特别是通用Agent,发现在灵活性、稳定性和Agent调度等综合能力方面总是会有一些短板。
并且发现了MOE架构在成本和效率上,能够对多智能体协同的赋能,这一点确实是黄叔看到他们的创新!
那最终升级到了Genflow 2.0版本,这是一个“一个入口,无所不能”的智能交互体验,背后是多个Agent。
所以我们前面就看到了通用模式、并行模式、干预模式等,以上所有模式,都是根据用户的实际场景进行智能适配。
会上黄叔也提出了自己的想法,现在输入提示词后,仍然是Genflow自己根据记忆等逻辑去生成内容,黄叔很希望Genflow能增加发散模式,比如WAIC上的AI编程,这种选题Genflow能给我生成三四个选题方向,让我手点一下就能生成自己更希望写的内容方向。整体来说,Genflow 2.0测试版本,有非常多的亮点,也期待一些提升空间,比如界面交互。相信会在正式上线的时候补齐更多功能,因为文库、网盘打通,有沧舟OS系统和MCP加持下,GenFlow2.0能够覆盖更多的场景和入口,加上逐渐升级的模型能力,以及Agent架构能力,非常值得期待8月正式上线的Genflow2.0!
本文由人人都是产品经理作者【Super黄】,微信公众号:【AI产品黄叔】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益



