卖掉上一家公司后,这位连续创业者拿下1600万美元,要用开源颠覆AI Agent开发
AI Agent 从原型到生产的落地难题曾难住无数开发者,Trigger.dev 的出现打破困局。这款开源平台完成 1600 万美元 A 轮融资,月执行数亿次任务,凭 TypeScript 原生支持与可靠的任务编排能力,成为生产级 AI Agent 的首选基础设施。

你有没有想过,开发一个真正可靠的 AI agent 有多难?大多数人以为原型阶段就是全部,但当你真正要把 AI agent 推向生产环境时,你会发现这才是噩梦的开始。
如何处理任务失败?如何管理并发?如何调试出了问题的 agent?如何确保系统在高负载下依然稳定运行?这些问题让无数开发者陷入困境,不得不从头开始构建复杂的微服务架构,处理各种边缘情况,花费数月时间在基础设施上,而不是真正的产品创新上。
Trigger.dev 正是为了解决这个痛点而生。这家开源公司刚刚宣布完成了 1600 万美元的 A 轮融资,由 Standard Capital 领投。
更令人瞩目的是,他们每月已经在为超过 30000 名开发者执行数亿次 AI agent 任务。从教育科技到视频广告制作,从音频数据集构建到各种企业应用,Trigger.dev 正在成为开发者构建生产级 AI agent 的首选平台。我深入研究了他们的技术方案和客户案例后,发现这家公司正在解决一个被严重低估但极其关键的问题:如何让 AI agent 从演示走向真正可靠的生产应用。
AI Agent 开发的真实挑战
我发现很多人对 AI agent 开发存在一个巨大的误解:他们认为只要调用几个大语言模型的 API,写几行代码,agent 就能工作了。
这种想法在做演示或原型时确实没问题,但当你要把它部署到生产环境,服务真实用户时,你会发现问题远比想象中复杂得多。让我从一个具体的场景说起,这样你就能理解开发者面临的真实困境。
想象你正在构建一个教育科技产品,需要分析数百万学生与 AI 的互动记录,为老师提供实时洞察。每次学生完成一轮对话,你的系统就需要触发一个分析任务,提取学生的参与度、兴趣点、可能存在的问题行为等信息,然后生成摘要发送给老师。
听起来很简单,对吧?但实际上,你需要处理以下这些复杂问题:这个分析任务可能需要几秒钟甚至更长时间才能完成,你不能让用户界面一直等待。如果分析过程中大语言模型返回了格式错误的数据怎么办?如果网络请求失败了怎么办?如果同时有成千上万个学生完成对话,你的系统能处理这么大的并发量吗?你如何确保优先处理付费用户的请求,同时又不让免费用户完全得不到服务?当出现问题时,你如何快速定位是哪个环节出了错?
这就是 MagicSchool AI 面临的真实挑战。MagicSchool 是有史以来增长最快的教育科技公司,仅用两年时间就服务了全球超过 450 万名教师,并被独立评为最安全的 AI 平台。
他们的平台为教师提供了一整套持续更新的 AI 工具,帮助教师节省时间、促进负责任的 AI 素养培养,并为学生开启新的学习机会。但要实现这个愿景,他们必须解决一个核心技术挑战:如何从数百万学生互动中快速提取有价值的洞察,并实时传递给教师。
教师需要快速而清晰的洞察来了解学生如何使用 AI 工具。但监控每一次互动对时间紧张的教育工作者来说太耗时了,所以 MagicSchool 希望构建实时摘要系统,直接发送给教师。这些摘要会突出显示学生的参与程度,从分心到高度投入,同时还会注意到新的兴趣点,并在存在问题行为时发出警报。举个例子,摘要可能会告诉教师学生在关于气候变化的讨论中表现出高度参与,或者可能会提醒教师某个学生一直在试图让 AI 讲屎尿屁笑话。
这些高层次的洞察可以为教师节省数小时逐条审查每条消息的时间,同时让他们保持知情。这也让教育工作者在部署 MagicSchool 这样的工具时更加放心,因为他们知道可以为学生提供一个安全的环境来接触 AI 并培养 AI 素养。
如果没有 Trigger.dev,MagicSchool 的工程师就必须自己构建整个任务编排系统。他们需要设置消息队列、实现重试逻辑、处理失败情况、监控任务执行状态、管理并发控制、实现优先级队列等等。这至少需要几个月的开发时间,而且还需要持续维护。
更糟糕的是,这些基础设施代码会占用大量工程资源,而这些资源本可以用来开发真正为用户创造价值的功能。这就是为什么越来越多的开发者转向 Trigger.dev 这样的平台:它让你可以专注于构建 AI agent 的核心逻辑,而不是被基础设施问题困扰。
Trigger.dev 如何解决这些问题
在深入了解 Trigger.dev 的技术方案后,我认为他们最聪明的地方在于找到了开发者体验和系统可靠性之间的完美平衡点。他们没有试图重新发明轮子,而是专注于解决开发者在构建 AI agent 时遇到的最核心痛点:如何让复杂的异步任务变得简单可靠。
让我继续用 MagicSchool 的案例来说明 Trigger.dev 是如何工作的。每当学生与 AI 完成一轮对话后,系统会触发一个任务,将摘要状态更新为”待处理”状态保存到数据库中。这个触发过程非常简单,开发者只需要几行代码就能完成。系统会通过实时广播通知教师端,告诉他们”我们正在为这个对话生成摘要”。然后,任务被加入到 Trigger.dev 的队列中等待执行。

这里的关键在于,开发者不需要担心如何实现这个队列系统,不需要考虑如果任务失败了该怎么办,也不需要处理大量并发请求时的资源分配问题。Trigger.dev 把这些复杂性都隐藏在了简洁的 API 背后。开发者只需要定义任务的逻辑,剩下的交给平台处理。
当任务开始执行时,Trigger.dev 会查询所有相关数据,然后运行分析提示词。MagicSchool 使用 Zod 模式配合 Vercel 的 AI SDK generateObject 函数来从大语言模型获取结构化输出。这个组合特别强大,因为它内置了数据解组、验证和重试逻辑。这意味着开发者不再需要担心大语言模型返回的数据格式不正确,或者调用失败的情况。这些边缘情况都被自动处理了。
一旦摘要生成完成,它会被保存到数据库中,然后 Trigger.dev 会广播另一条消息通知教师关于新摘要的信息。整个流程从用户的角度看起来是无缝的:学生完成对话,几秒钟后教师就能看到分析摘要。但在幕后,有大量的复杂操作在进行:任务排队、资源分配、错误处理、重试机制、状态管理等等。
我特别欣赏 Trigger.dev 在代码组织方面的设计。开发者可以像编写普通的 TypeScript 函数一样编写任务代码,但这个函数实际上运行在分布式系统中,具有微服务的所有优势。用他们自己的话说:”你有一个 TypeScript 函数,这就是你的微服务。你像调用函数一样与它交互,但它像微服务一样运行。”这种抽象层次恰到好处,既保持了代码的简洁性,又提供了生产级系统所需的可靠性和可扩展性。
MagicSchool 的工程师 Ben Duggan 分享说,使用 Trigger.dev,他们在短短几周内就总结了超过一百万次学生互动。由于这些任务是 I/O 密集型的,它们非常适合小型机器配置,这样可以保持低成本的同时确保可靠性。Trigger.dev 在机器规格和运行时间上的灵活性也为更高级的处理打开了大门,比如生成详细报告来帮助教师基于这些摘要规划后续活动或重访关键主题。
从这个案例中,我看到了 Trigger.dev 的核心价值主张:让开发者能够快速构建生产级 AI agent,而不需要成为分布式系统专家。这种能力在当前的 AI 时代变得越来越重要,因为越来越多的应用需要集成复杂的 AI 功能,但大多数团队并没有资源或时间从零开始构建基础设施。
从视频广告到教育科技:Trigger.dev 的应用场景
在研究 Trigger.dev 的客户案例时,我发现了一个有趣的模式:那些最成功地使用 Trigger.dev 的公司,往往是那些需要处理大量并行任务、对延迟敏感、且任务逻辑相对复杂的场景。Icon.com 就是一个完美的例子。
Icon.com 正在用 AI 彻底改变视频广告制作行业。他们的产品允许用户上传大量产品视频素材,比如屏幕录屏或实拍视频,然后描述想要的广告效果,系统就会自动生成大量广告供用户选择,最后可以直接发布到 Instagram 或 TikTok。听起来很酷,但实现起来涉及大量复杂的视频处理任务。

Icon 的创始工程师 Caleb Tan 分享了他们面临的挑战:他们需要能够同时处理数千个视频。为了让用户能够快速预览和浏览视频目录,他们需要为每个视频生成缩略图序列。同时,广告生成必须快速完成,他们的目标是在 5 分钟内为用户生成视频。
这些需求对技术架构提出了极高的要求。想象一下,当一个用户连接他们的 Google Drive 时,可能有数百个甚至上千个视频文件需要处理。系统需要提取每个视频、转码、生成缩略图序列、转录音频内容、将内容分块等等。如果按顺序处理,这可能需要几个小时甚至几天。但用户显然不会等那么久。
Icon 使用 Trigger.dev 来处理他们的整个视频处理管道。他们使用 FFmpeg 为每个视频生成缩略图序列,这样用户就可以在他们提供的各种产品中快速浏览这些视频。他们的主要广告生成管道同时支持 AdGPT 和 AdCut 两个产品。通过使用 Trigger.dev 并行化大量后台任务,他们成功实现了低于 5 分钟的视频生成目标。
更令人印象深刻的是,他们还使用 Trigger.dev 的实时钩子在前端提供任务的实时上下文信息。这意味着用户可以看到广告生成、产品评论抓取、受众分析和视频生成的实时进度。这种实时反馈大大提升了用户体验,让用户知道系统正在工作,而不是在一个黑盒中等待。
Caleb 解释了他们为什么选择 Trigger.dev:”Trigger 是一个可靠的后台任务平台,能够在我们的正常代码库中编写任务改变了游戏规则。由于我们的工作负载是资源密集型的,能够将任务卸载到 Trigger 的云平台并获得内置的可观测性是一个巨大的优势。”

这段话道出了 Trigger.dev 的另一个关键优势:开发者可以在同一个代码库中编写任务代码,而不需要维护单独的微服务仓库。这大大简化了开发流程,减少了上下文切换,也让团队协作变得更加容易。同时,当任务执行时,它们运行在 Trigger.dev 的云基础设施上,可以获得强大的计算资源,而不会影响主应用的性能。
Icon 通过使用 Trigger.dev 实现了以下成果:能够同时分析数千个视频;使用 useRealtime 钩子和任务元数据在前端显示实时任务进度;可靠地为处理的每个视频生成缩略图序列;通过并行处理将广告生成时间缩短到 5 分钟以内。这些成果让 Icon 能够与传统视频广告代理商竞争,甚至取而代之,因为他们可以在几分钟内完成传统方法需要几天或几周才能完成的工作。
从 MagicSchool 到 Icon,我看到了一个清晰的模式:Trigger.dev 特别适合那些需要处理大量异步任务、对可靠性有高要求、同时又希望快速迭代产品的团队。无论是教育科技、视频处理,还是其他 AI 驱动的应用场景,Trigger.dev 都在帮助开发者将更多时间投入到产品创新上,而不是基础设施建设上。
为什么是 TypeScript 和开源
在与 Trigger.dev 的创始人交谈时,我发现他们对技术选择有着非常明确的观点。CEO Matt Aitken 和他的团队坚信,TypeScript 将成为构建 AI agent 的主导语言。这不是一个随意的技术决策,而是基于对行业趋势的深刻洞察。
Matt 的论点很有说服力:AI agent 实际上就是新一代的应用程序。应用程序应该用 TypeScript 编写,因为这是一种更适合创建应用的语言。你可以用同一种语言编写前端和后端。TypeScript 的独特优势在于,大语言模型非常擅长编写 TypeScript 代码。这形成了一个正向飞轮效应:TypeScript 是一种很好的与大语言模型交互的语言,同时大语言模型也非常擅长编写 TypeScript。

这个观察非常深刻。在 AI 时代,代码不仅是人类开发者编写的,也越来越多地由 AI 生成或辅助生成。如果一种编程语言既适合人类阅读和编写,又适合 AI 理解和生成,那么它就具有巨大的优势。TypeScript 恰好满足这两个条件:它有强大的类型系统和现代的语法特性,同时大语言模型在 TypeScript 上的表现也非常出色,因为互联网上有大量高质量的 TypeScript 代码作为训练数据。
Trigger.dev 的大赌注就是 TypeScript 将赢得 AI agent 开发这个领域,而他们正在努力为 TypeScript 开发者提供最佳体验。这种专注让他们能够深度优化开发者体验,而不是试图支持所有编程语言。当然,正如他们自己开玩笑说的,让所有人同意哪种编程语言最好并不容易,但从实际采用情况来看,他们的判断正在被市场验证。

另一个让我印象深刻的是他们对开源的承诺。Trigger.dev 是 Apache 2 开源的,这在当今的创业环境中并不常见。许多公司会选择闭源或者使用更严格的开源许可证来保护自己的商业利益。但 Trigger.dev 选择了最宽松的开源许可证之一,这反映了他们对开源社区的信任和承诺。
开源带来了多重好处。它让开发者能够查看源代码,理解系统是如何工作的,甚至可以自己部署和定制。这种透明度在处理敏感数据或关键业务逻辑时特别重要。同时,开源也促进了社区贡献和生态系统的发展。Trigger.dev 目前在 GitHub 上已经有超过 12000 个星标,这个数字还在快速增长。
从商业角度看,开源也是一种聪明的市场策略。它降低了开发者的采用门槛,让他们可以先试用产品,了解它是否适合自己的需求,然后再决定是否使用付费的云服务。这种模式在开发者工具市场已经被证明非常有效。而对于 Trigger.dev 来说,他们可以通过托管服务、企业支持和高级功能来实现商业化,同时保持核心平台的开源。
这种开源 + 商业的模式也让 Trigger.dev 能够吸引到最优秀的工程人才。在采访中,他们提到正在欧洲各地招聘最hardcore的工程师。他们的招聘主张很有吸引力:解决真正困难的技术问题,既有创业公司的文化,又有大公司级别的技术挑战。他们处理的规模远超一般 A 轮公司,需要应对复杂的代码执行、沙箱安全和大规模系统的挑战。开发者会遇到各种奇怪的边缘情况,这在技术上非常具有挑战性。
Trigger.dev 的发展轨迹和未来方向
了解 Trigger.dev 的发展历程让我对他们的成功有了更深的理解。这不是一夜之间的成功,而是经过多次迭代和调整才找到正确方向的结果。
Trigger.dev 团队在 2023 年 1 月参加了 Y Combinator,但有趣的是,他们当时带去的是一个完全不同的想法,而且那个想法并不好。后来他们转向了后台任务处理,在 Hacker News 上获得了成功的发布。他们在这个方向上工作了 18 个月,但进展并不理想。直到大约一年半前,他们推出了产品的第三个版本,开始执行用户代码,事情才真正开始起飞。
这个转折点很关键。开始执行用户代码意味着他们不仅仅是一个任务调度系统,而是成为了一个真正的执行平台。开发者可以编写任意复杂的代码,Trigger.dev 会在云端安全地执行这些代码,处理所有的资源管理、隔离和安全问题。这种能力的提升正好赶上了 AI agent 的爆发,时机恰到好处。
Matt 在采访中提到:”我认为它之所以成功,部分是因为我们在做这个,部分也是时机的原因。AI agent 开始成为真实存在的东西,我们的客户正在使用我们的平台来构建它们。”这句话体现了创业中一个重要的真理:技术能力和市场时机同样重要。Trigger.dev 花了 18 个月找到正确的产品方向,但当他们找到时,市场需求恰好爆发了。
从一年半前几乎从零开始,到现在每月执行超过 2.5 亿次 agent 运行,这种增长速度是惊人的。这不仅证明了他们的技术方案的价值,也说明了市场对生产级 AI agent 基础设施的强烈需求。开发者不想重复造轮子,他们想要一个可靠的平台来构建自己的产品。
关于未来,Trigger.dev 有着清晰的规划。他们计划对现有平台进行重大改进,首先是更高级的可观测性功能。在构建复杂的 AI agent 时,能够清楚地看到每一步发生了什么、为什么发生、耗时多少,这些信息至关重要。他们还计划使用 MicroVM 技术加快任务启动速度,这将进一步提升用户体验。
他们也在扩展产品线以解决构建 AI agent 时更常见的问题。沙箱功能将允许执行不受信任的代码,这对于那些需要运行用户提供的代码或第三方代码的应用非常重要。他们还将推出一整套用于上下文工程和管理的工具,这正是我们之前讨论的 AI agent 的关键组成部分。更多与常见第三方服务的集成也在计划中,这将让开发者更快上手,或者更容易将数据导出到其他系统。

从投资者阵容来看,Trigger.dev 获得了强大的支持。这轮 1600 万美元的 A 轮融资由 Standard Capital 领投,这是一家由 Y Combinator 任职时间最长的合伙人 Dalton Caldwell、Paul Buchheit 和 Bryan Berg 创立的新 A 轮基金。Trigger.dev 是 Standard Capital 首期基金的第一批公司之一。新投资者还包括 Michael Grinich 和 CTO Fund。现有投资者包括 Y Combinator、Liquid 2、Wayfinder Ventures、Pioneer Fund 和 Rebel Fund 也再次参与了本轮融资。
在采访中,Trigger.dev 的联合创始人分享了他们选择 Standard Capital 的原因。流程简单快速,让他们能够快速拿到资金,继续专注于构建公司。对创始人友好,没有董事会席位,这意味着他们保留了更多公司控制权,稀释也比通常情况少。最重要的是,能够与其他处于类似阶段的创业公司一起学习和成长。他们提到参加了 Standard Capital 第一期的集体办公时间,从其他公司那里学到了很多关于招聘和营销的想法,这正是他们当前最关注的两个领域。

有趣的是,他们还提到了 Paul Buchheit 著名的那句话:”为什么你不能增长得更快?”这句话已经成为硅谷创业者的经典压力源,但同时也是一种激励。Trigger.dev 的创始人说他们在回家路上一直在讨论:”我们如何变得更激进?如何变得更激进?”这种对增长的渴望和紧迫感,正是推动创业公司不断突破的动力。
我对 Trigger.dev 和 AI Agent 未来的思考
在深入研究了 Trigger.dev 之后,我对 AI agent 的发展有了一些新的认识。我认为我们正处在一个关键的转折点:AI agent 正在从实验性技术转变为生产级的基础设施。这个转变的核心挑战不是 AI 模型本身,而是如何将 AI 能力可靠地整合到实际应用中。
Trigger.dev 的成功说明了一个重要趋势:开发者需要的不是更多的 AI 模型,而是更好的工具来构建基于 AI 的应用。市场上不缺少大语言模型或其他 AI 能力,缺少的是能够让这些能力可靠运行、易于调试、可以扩展的基础设施。这就是为什么像 Trigger.dev 这样的平台变得越来越重要。
我特别认同 Trigger.dev 关于 TypeScript 的观点。在 AI 时代,编程语言的选择不仅仅是技术偏好问题,更是战略选择。一种能够同时满足人类开发者和 AI 模型需求的语言,将会获得巨大的网络效应。越多的人使用 TypeScript 构建 AI agent,就会有越多的示例代码和最佳实践,这又会让大语言模型在 TypeScript 上表现得更好,进而吸引更多开发者使用 TypeScript。这是一个正向循环。
从商业模式角度看,我认为 Trigger.dev 找到了一个甜蜜点:通过开源建立社区和信任,通过托管服务实现商业化。这种模式在开发者工具领域已经被多次验证,但成功的关键在于平衡免费开源版本和付费托管服务之间的价值。Trigger.dev 做得很好的一点是,他们的托管服务提供的不仅仅是便利性,还有规模、可靠性和高级功能。这让付费变得有价值,而不仅仅是为了避免自己部署的麻烦。
我也看到了一些挑战。随着越来越多的公司开始构建 AI agent,市场上会出现更多类似的平台和工具。Trigger.dev 需要持续创新,保持技术领先,同时建立强大的社区和生态系统。他们在可观测性、沙箱执行、上下文管理等方面的规划是正确的方向,因为这些都是构建复杂 AI agent 时的真实痛点。
另一个有趣的观察是 AI agent 对软件架构的影响。传统的软件架构往往是同步的、请求响应式的。但 AI agent 本质上是异步的、事件驱动的。一个 agent 可能需要执行多个步骤,每个步骤可能需要不同的时间,可能会失败需要重试,可能需要人工干预。这种异步性要求我们重新思考软件架构。Trigger.dev 提供的任务编排能力正是为了应对这种新的架构需求。

从行业发展趋势看,我预测未来几年我们会看到更多的”AI-native”应用出现。这些应用从一开始就围绕 AI agent 设计,而不是将 AI 作为附加功能。MagicSchool 和 Icon 就是很好的例子。这类应用的成功需要强大的基础设施支持,而 Trigger.dev 正在成为这个基础设施的关键组成部分。
在传统软件开发中,当出现问题时,我们可以查看日志、监控指标、使用调试器等工具来定位问题。但在 AI agent 中,问题往往更加微妙。一个 agent 可能没有明显的错误,但生成的结果质量不佳。或者 agent 陷入了无限循环,不断重复相同的操作。或者 agent 的决策过程不透明,我们不知道它为什么做出某个选择。这些问题都需要强大的可观测性工具来解决。Trigger.dev 在这方面的投入是明智的,因为随着 AI agent 变得越来越复杂,可观测性将成为最关键的需求之一。
总的来说,Trigger.dev 的故事给我最大的启发是:在技术快速演进的时代,找到正确的抽象层次至关重要。太底层的工具让开发者负担过重,太高层的工具又缺乏灵活性。Trigger.dev 在这两者之间找到了平衡,让开发者既能快速构建 AI agent,又能在需要时进行深度定制。这种平衡不容易实现,但一旦实现,就会创造巨大的价值。从他们每月 2.5 亿次的任务执行量来看,市场已经用实际行动验证了这种价值。
本文由人人都是产品经理作者【深思圈】,微信公众号:【深思圈】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!

起点课堂会员权益




