对AI的实践及思考
一场为期三个月的火车环游中国之旅,如何成为AI应用的实战演练场?本文将揭秘AI在旅行规划、内容创作与智能体开发中的惊人表现,从10%预算误差的精准行程,到150万用户的智能体服务,再到国内外AI生态的深度对比,带你见证AI如何重塑个人生产力与行业格局。

我从9月中旬开始火车环游中国,到12月中旬结束,已经差不多3个月没有更新文章。
但11月中旬在西安做过一次分享,现在在本文中把内容整理一下,如有不对之处,还望指正,我也在不断学习中。
将从以下四个方面展开分享:
- 个人AI实操经验:分享我运用AI工具进行旅行规划、内容创作与智能体(Agent)搭建的具体案例。
- 国内外AI产品观察:对比分析当前AI产品的发展现状与特点。
- AI发展趋势猜想:探讨技术演进方向及其可能带来的社会影响。
- 个人的应对策略:面对AI时代的到来,我们应如何思考和行动。
一、个人AI实操经验分享
1. AI辅助长途旅行规划
我目前正在进行一场坐火车环游中国的旅行。最初,我使用腾讯元宝AI助手规划了一次自行车全国旅行,并生成了详细的装备清单。然而,在实际骑行两天后,由于体力原因及广州的台风天气,我放弃了该方案。
随后,我转向让AI规划火车旅行方案。我向“腾讯元宝”提出了新的需求:


- 旅行偏好:关注经济发达、产业特色明显的地区。
- 交通工具:明确以火车为主。
- 规划细节:要求每日行程具有足够的颗粒度,并最终提供费用预算。
AI生成的完整方案涵盖了以下细节:
行程总览:广州出发,经沿海、山东、东北、陕西山西、新疆,最终返回四川。
每日详情:包括行程区间、距离、交通时间、当日详细安排、考察重点、住宿地、以及交通、门票、食宿等分项与总计费用。


实践验证:我对比了AI生成的预算与实际支出(9月与10月数据),发现两者偏差均在10%以内,说明当前大模型在复杂规划任务上已具备很高的实用性和参考价值。

2. 从旅行规划延伸到内容创作
基于AI生成的旅行方案,我进一步探索其内容创作潜力。
书籍框架搭建:我要求AI根据旅行路线,为我规划一本旅行书的框架。AI迅速给出了包括书名、副标题、序章及各章节(如东南、华北、东北、西北、西南地区)的详细大纲,并针对每个重点城市建议了写作切入点。




自媒体账号策划:我请AI为旅行记录设计一个自媒体账号的运营方案。它基于市场营销的4P原则,输出了包括品牌定位、名称、Slogan(如“Go Go Go出发了”)、简介、内容方向、平台选择、发布节奏与频率在内的完整方案。


3. 智能体(Agent)的开发与实践
我在国内外主流AI平台上有大量的智能体搭建实践经验。

开发规模:仅在腾讯元宝上就搭建了约300个智能体。
核心逻辑:高质量的智能体需要一套结构化的设计框架,包括:头像、角色设定、基础与延伸配置、参考案例等。这能确保智能体与用户的交互更立体、感情更饱满、考虑更周全。

应用效果:我开发的一些智能体(如珠宝、两性情感、机票、旅游等领域)在各大平台累计服务用户已超150万,对话量巨大。
4. 使用AI的核心感受
- 效率的极致压缩:规划一场全国性的火车旅行,传统方式可能需要数天时间收集资料、安排行程,而借助AI,仅需2-3小时即可获得详尽方案。
- 专业门槛的抹平:AI极大地拉平了多数行业的知识门槛。越是公开、易获取的知识领域,AI的赋能效果越明显。这让我能够快速切入无人机、口腔等陌生领域,开发相应的智能体。
- 持续工作与进化:一旦创建,AI智能体可以7×24小时不间断工作,并能随着底层大模型的迭代而持续提升能力。
二、国内外AI产品观察
1. 技术能力布局

- 基础能力(语言、图片、视频、语音):已成为国内外大厂及科技巨头的标配。
- 搜索整合:搜索与大模型天生契合。AI能在几秒内调用上百个信息源进行分析。国内外搜索公司及新兴力量(如Kimi)都在强化此方向。
- 延伸能力:从基础能力衍生出的情绪识别、表情识别、图片精修、商品图生成、宣传视频制作、数字人、智能客服等技术,大厂均已布局,同时涌现出像“美图”这样的垂直领域强者。
2. 应用与解决方案
行业渗透:
- 智能客服:已广泛应用(如京东平台,需多次要求才转人工)。
- 商品推荐:京东、美团等平台的对话式推荐。
- 解决方案:营销方案、医疗辅助、办公套件等领域均有成熟产品。
- 垂类产品:音乐、游戏等领域也有大量创新。
3. 智能体(Agent)生态对比

- 国内:模式丰富,包括提示词、工作流、多智能体协作、插件等多种形式。
- 国外:以提示词为主,工作流和插件生态相对国内较为简单。
4. 产品交付与商业变现
产品交付:国内在应用层和用户体验上目前做得更好。例如,OpenAI的GPT商店直到去年7月才推出,生态仍处早期。
商业变现:
- 国内:模式多样,包括Token付费、订阅、线索售卖、商品售卖、广告联盟、知识付费、客服等。
- 国外:目前以订阅和商品销售为主,模式相对单一。
三、AI技术趋势猜想
1. 技术演进路径

回顾历史,从1950年代的构想,到2017年Transformer架构奠定基础,再到2022年底ChatGPT-3.5引发质变,AI进入大众视野。目前正处于关键发展阶段:
- 多模态:仍在发展中,未完全成熟。
- 具身智能:让AI与物理世界交互(如机器人),目前重点在解决基础运动控制(如行走、平衡),相当于在构建“小脑”,与大模型的深度融合尚浅。
- 未来方向:最终将走向具身智能与大模型的紧密融合,并由世界模型驱动,向通用人工智能(AGI)演进。
2. 当前架构与未来形态
当前:用户与AI交互,AI调用工具、数据库完成任务。

演进:从单一模型处理所有问题,转向多智能体(Multi-Agent)协作。例如,一个“个人助理”Agent作为调度中心,将问题分类后,交由更专业的健身、租赁等垂直Agent处理,以提升效率、节省算力。

终极感知:AI的感知将不仅限于文字、语音、图片、视频,还将扩展到物理世界,通过温度、触觉、味觉、压力等传感器获取全方位数据,经各类模型处理,再反馈到数字或物理世界。

3. 商业落地逻辑
每一次技术革命都基于其核心特点找到切入点:

PC互联网:核心是信息联通与存储,从媒体、资讯、搜索起步,延伸至电商、在线娱乐。
移动互联网:核心是基于位置的服务(LBS),从社交、O2O起步,发展出移动支付、线上线下融合、万物互联。
AI大模型:核心是处理知识与内容。当前已从编程、创意等领域切入,正向着工作流优化、产品形态创新发展,未来必将与各产业深度融合,并进一步与物理世界结合。


竞争判断:对于绝大多数人和公司而言,机会在于应用层的创新,而非投入巨大的基础大模型研发。
四、社会影响与个人应对
1. 对就业的潜在影响

技术革命总会重塑就业结构。智能革命的特点是从自动化走向智能化,从替代体力劳动转向替代需要经验和判断的认知劳动。一些岗位已受到影响:
明显影响:电话客服、基础程序员、风控专员、线上运营、卡车司机、演员等。
2. AGI(通用人工智能)面临的约束
尽管发展迅速,但AGI的实现仍面临多重硬约束,这为我们留下了应对时间:

- 模型规模:当前顶级大模型参数在万亿级别,而人脑神经连接规模在百万亿到千万亿级,仍有数量级差距。
- 能源供应:AI算力消耗巨大,能源基础设施建设(如核电站需十几年周期)是长期瓶颈。
- 芯片性能:需持续提升算力、产能,并大幅降低能耗(当前AI芯片能耗远高于人脑)。
- 传感器与具身智能:要实现AGI,需从环境持续学习,这依赖更微型、多样的传感器(MEMS技术),以及与物理世界安全、灵活交互的躯体,这些都需要时间发展。
3. 个人的策略与选择
赛道选择:
- 基础模型:仅极少数公司有能力涉足。
- 行业模型:对多数公司而言,微调大模型的成本和门槛也很高。
- 应用开发:这是最广阔的天地。基于现有大模型,结合行业专家知识,开发解决实际问题的应用,是主流方向。
核心建议:深化与真实世界的链接
我们对真实世界的认知本就有限,而能被数字化、用于训练AI的知识则更少。因此,人的核心优势在于身处真实世界。我们应更深入行业,更理解人性,在实际场景中发现问题、创造价值,这将是人类区别于和领先于AI的关键所在。
本文由人人都是产品经理作者【markzou】,微信公众号:【markzou的笔记】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




