「招投标AI落地观察」暗箱里的算力 —— AI时代招标文件的潜规则识别

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

「招投标AI落地观察」暗箱里的算力 —— AI时代招标文件的潜规则识别

岸见产品社

2026-05-21

0 评论 1729 浏览 0 收藏

25 分钟

国家发改委的数据显示，AI检测模型在3.1万份招标文件中揪出了1.9万个歧视性条款，但真正的博弈远不止这些表面问题。本文将深入剖析AI检测的视力表与盲区，揭示招标文件中那些合法却带有定向筛选意图的'柔术'条款，以及AI在信息不对称面前的无奈。这是一场算法与人性博弈的新维度战争。

去年底，国家发改委发布了一组数据：AI检测模型累计扫描了3.1万份招标文件，揪出歧视性条款1.9万个。平均每份文件0.61个雷。这个数字很漂亮。技术自信、监管自信、行业自信，都写在里面了。

但我的第一反应不是”AI好厉害”，而是——那1.9万个问题，是全部吗？剩下的文件，就真的干净吗？

300页的招标文件摊开，每一行字都经过法务的反复打磨。它看起来是一份技术文档，实际上是一张权力布阵图。有些防线一目了然——指定品牌的参数、不合规的资质门槛、封闭的地域限制。但这些，已经是AI能扫到的”表层战场”。

真正的博弈，在字缝里。

这不是一场”AI扫描→人类整改”的线性升级。这是一场新维度的博弈：当每个字都可以被算法审查，真正的潜规则去了哪里？

一、AI的”视力表”——它能看清什么

先给AI足够的credit。实事求是地说，在招标文件检测这件事上，AI的进步速度远超大多数从业者的认知。

第一层：硬规则扫描

这是AI最舒适的区域。你给它一本《招标投标法实施条例》，再加几份地方负面清单，它就能像最认真的实习生一样，逐字逐句地比对。签字盖章要求、保证金比例、资质证书有效期、工期合理性——这些都是布尔逻辑：要么合规，要么不合规。没有中间态。

在这层，AI已经做到了零误差。

内蒙古的DeepSeek智能审查系统上线后，一份200页的招标文件，7分钟出检测报告。但放在过去，同样是这份文件，三个人花两个工作日通读，还不一定能把所有程序性问题抓干净。不是人不认真——是300页的篇幅里藏着太多”不起眼的致命伤”：一个盖章位置错了、一份资质过期三天、保证金多写了两个零。人看累了会漏，AI不会。

第二层：语义级检测

比硬规则更进一层的是语义。不是”有没有盖章”，而是”这个条款是否含有倾向性”。

AI识别歧视性条款的逻辑，不是靠预设的关键词列表。它会理解：当一句话的结构是”须具备XX地区3年以上服务经验”时，这是一个隐性排斥条款——即使”3年以上”和”XX地区”单独看都合法合规，组合在一起就构成了不合理门槛。

佛山市的AI检测系统上线一个多月，148个项目检测了186次，76个项目被检出104个问题。异议投诉率从25.55%断崖式下降到13.89%。这个数字说明什么？说明很多招标文件起草人，自己都没意识到写进去的条款有倾向性——或者，他们以为不会有人看出来。但AI会。

而且AI会记住。这104个问题会成为训练数据——下一次，同类倾向条款一出现，模型只需要0.1秒就会标红。人靠经验积累的能力，AI靠数据积累，速度不在一个量级。

广州的检测平台更近一步。覆盖3100个招标项目后，单份文件的检测准确率达到95%。广东政务服务网的计划是，未来三年实现全省全覆盖。

这些都不是PPT上的数字。它们已经落地、运行、输出结果了。

到此为止，AI表现得像一台完美的”检测机器”。似乎只要给它足够的数据和算力，招标文件的公平性问题就能迎刃而解。但事情没有那么简单。

因为一个残酷的事实是：招标文件里真正决定中标的关键信息，从来不在”不合规”的那一边。

二、AI的”盲区”——它读不懂什么

如果AI只能读到”违法”和”不违法”的二元边界，那它读懂的东西，可能连招标文件真正信息含量的20%都不到。

剩下的80%，是那些合法合规、甚至看起来公平公正的字句，组合在一起却形成了定向筛选网。我把AI目前还读不懂的东西分成三类。每一类，都是招标文件检测的真正硬骨头。

第一类：合理排名的”柔术”

逐条看，每一条都合理。

“投标人须具备近3年同类项目经验。”合理。任何采购都需要过往业绩。
“项目负责人须有高级职称。”合理。大型项目对负责人有资质要求。
“投标人须通过国家医疗物联网认证。”合理。医疗类项目有特殊行业准入门槛。
“需提供至少2个三甲医院实施案例。”合理。规模证明。

单条检测：全绿。AI不会标红任何一条。

但当这四条出现在同一份招标文件里，事情就变了味——它们组合起来，恰好把市场上五家潜在竞标者筛掉了四家，只剩下一家”天选之子”。不是一个人的操作，是四个看起来完全合规的条件，像四把锁，恰好只留一把钥匙能开。

这就是”合理排名的柔术”。在现行的AI检测框架下，这是一个结构性盲区。因为大部分检测模型做的是单条款判断——逐条扫描，逐条比对负面清单。没有哪个模型会在检测完所有条款后，做一个”组合逻辑推演”：把这些条件放在一起，会不会产生定向筛选效果？

不是技术做不到，是成本太高。排列组合的数量是指数级的。一份300页的招标文件可能有80-100个资格条件，两两组合是4000组，三三组合是16万组。全量计算本身就是算力的无底洞。

更重要的是——组合逻辑是否构成”歧视”，本身就是一个需要裁判的灰色判断。人和人之间都可能吵一架的事，你要AI给出一个”红/绿”的结论？

所以目前行业的主流做法是：把组合检测的最终判断权交给人类专家，AI只负责”标记可疑组合”。但问题又来了——如果一天有几百份招标文件要做检测，每个标记都需要人来看，那效率的瓶颈又回到人身上了。

这不是AI的问题，这是检测本身的悖论：规则越精细，灰色地带越宽。

第二类：模糊表述的”保护伞”

每一份招标文件里都有一类”安全条款”——它们看起来在理，听起来正确，内容却空洞到可以朝任何方向解释。

“投标人须具有类似项目经验。”——多”类似”才算类似？五年前的项目算吗？规模只有一半的算吗？领域沾一点边的算吗？
“技术方案需具备前瞻性。”——什么算前瞻性？用了新技术算，还是技术路线的设计思想领先算？
“优先考虑具备XX能力的供应商。”——”优先考虑”不是强制条件，但在评标现场，这就是一张”倾向通行证”。评审专家看到这条，心里就有了一杆相对的秤。

AI面对这些表述时，陷入了”语义窘境”：

它能识别出这句话是模糊表述。它能给你标出来：”请注意，此为模糊性条款，可能存在操作空间。”

但然后呢？你没法让AI判断这句话”是否违法”，因为它在法律上完全不违法。你也没法让AI说这句话”是公平的”还是”是不公平的”，因为公平与否取决于它怎么被执行——而执行的环节，AI看不到。

这就引出了一个更深层的问题：招标文件的公平性，从来不是纸面上就能完成的。你再怎么把文件写得滴水不漏，如果在评标环节有操作空间，所有的”公平”都是伪装的。AI能检测的是文本本身，但它无法保证文本被正确地执行。

这就像你让一个裁判检查比赛规则——规则本身没问题，但裁判没办法保证所有选手都按规则比赛。因为比赛开始后，规则就不再是写在纸上的东西了。

第三类：信息不对称的”降维打击”

这是最硬的一块骨头。前面两种盲区，至少还能通过算法迭代、数据积累逐步解决。但第三种盲区，AI从一开始就站不到起跑线上。

核心原因很简单：决定一个项目中标结果的关键因素，很大一部分不在招标文件里。

一份招标文件从起草到发布，经历了什么？甲方向内部征集需求、与潜在供应商口头沟通、找几家熟悉的厂商探方案方向、了解市场上有哪些成熟产品——这些信息，有些会写入文件，有些永远不会。

真正影响中标走向的因素里：甲方的内部偏好、决策链条中各方的利益平衡、前期沟通中建立起来的信任感——这些”软信息”绝大多数不会出现在招标文件的字面上。但它们对中标结果的预测力，远远超过文件中任何一项技术和商务要求。

我不是在暗示这有什么”内幕”。这是一个行业运行的现实：采购不是一次性的”信息匹配”，它是一个长期的关系沉淀。

招标文件，是这种关系沉淀的最终呈现形式——而不是起点。

举个例子：一个医院的信息化项目。甲方信息科科长在项目立项前，已经跑了三家同类型医院做调研，跟某家供应商的技术团队深度交流过三次。他对供应商A的技术方案、实施能力、报价区间有了清晰的认知。这些认知，会自然地、无意识地渗透到招标文件的编写中——不是故意的定向，而是”做了调研的人写出来的需求，自然会和调研对象的能力对齐”。

这不是围标串标。这是信息不对称下的自然倾斜。

而AI检测这类场景时，面对的是一个信息真空。它能看招标文件，但看不到：甲方上个月跟谁沟通过、会前看过谁的方案、评审专家里谁跟哪家企业有历史合作。这些信息没有文字化，没有进入任何系统，不存在于任何可以被扫描的数字维度里。

所以AI的”盲区”不是节点性的——它是系统性的。不是因为AI不够智能，而是因为招标采购这件事本身，有太多环节的信息根本没有进入数字层。

你无法检测一份不存在的文件。

三、AI检测的”三个层次”——重新定义边界

如果我们把AI在招标文件检测中的能力做分层，大概是这样的：

L1：规则引擎——替代人工复核

这是”已完成”的一层。

规则引擎抓的是确定性问题：资质过期、盖章缺失、保证金比例不对、指定品牌、地域限制、不合理业绩门槛。AI在这层已经做到了百分之百的覆盖率和接近百分之百的准确率。

这层的价值是消灭低级错误。过去一份招标文件发出去，经常被供应商投诉到这里那里的程序性问题——不是故意使坏，是起草人自己也没注意到。AI把这张”安全网”铺开后，行业的基础合规水平会大幅提升。每一份发布的招标文件，至少不会在程序性问题上翻车。

它的本质，是一台无限耐心的复读机。

L2：语义推理——辅助人工判断

这是”进行中”的一层。

AI开始理解语句的倾向性、条款的隐含意图、评标标准中的操作空间。它能标出”这可能有问题”，然后由人类专家做最终裁决。

这层的价值是大幅提升检测的深度。政策制定者希望的”全覆盖智能检测”，落地的就是这一层——但它的瓶颈也在这里。

语义边界是模糊的。”倾向性”和”合理性”之间，没有一条清晰的线。一种条款在一个项目里是合理的技术要求，在另一个项目里可能就是排斥潜在供应商的定向条款。判断的依据不仅看条款本身，还要看整个项目的背景、市场格局、供应商能力分布——这些信息，AI很难完整获取。

所以L2目前能做到的，是”提示可疑，但不代替判断”。1.9万个被标记的歧视条款背后，还有多少因为语义边界模糊而未被标注的灰色地带？没人知道。灰色地带之所以是灰色地带，就是因为没有标准答案的地方，最难被算法覆盖。

L3：博弈推演——替人做决策（理想态）

这是”还在路上”的一层。

L3意味着AI不仅能做合规检测，还能预测甲方的真实需求、模拟不同评分方案下的中标概率、自动优化投标策略。它的本质是从”检测工具”变成”博弈参谋长”。

但这条路为什么还远？因为招投标的底层逻辑，从来不是信息匹配，而是人的博弈。

甲方在平衡各方利益、评审专家有自己的判断倾向、竞争对手会针对性地调整策略——这些变量无法被完全文本化，更无法被算法可靠地建模。你让AI去预测一个包含人际关系、利益权衡、组织政治的多方博弈，它面对的信息完整度，就像一个只看棋盘一角就去判断整盘棋胜负的棋手。

信息层面就输了，算法再强也没用。

所以L3的理想很丰满，现实很骨感。但它确实是一个值得瞄准的方向——因为当所有参与者都知道对方在用AI时，博弈本身会进化，进化的终点就是L3。

四、博弈视角——AI时代招标文件检测的”三方困局”

说完了”AI能做什么和不能做什么”，我们把镜头拉远一点，从行业博弈的视角看看这个局面。我先给你一个不太舒服的推论：

当招标方也开始用AI写招标文件时，投标方用AI读招标文件的优势会被对冲。

不是假设。是正在发生的事。双方都在学习使用同一种武器。这个局面构成了三个角色的困局：

招标方的困境：既要又要

甲方用AI做合规审查，这没有疑问——有政策压力、有监管要求、有舆论监督。但一个甲方不愿意公开谈的真相是：有些甲方也在研究”如何在合规的前提下做倾向”。

这不是阴谋论。人天然倾向于选择自己了解和信任的供应商。这是人性，不是犯罪。但当你用AI来辅助起草”合法但有效”的定向条款时——比如让AI帮你分析现行负面清单的边界在哪里，然后写一条刚好不触线但能卡掉竞争对手的条件——你本质上是在用自己的AI对抗监管的AI。

AI检测→AI规避→检测模型迭代→规避模型升级。这不是猫鼠游戏，这是军备竞赛，竞赛的双方用的是同一类算法。

投标方的困境：公平悖论

投标方是AI检测的最大受益者——理论上。但实际落地中有个尴尬的自相矛盾：

投标方希望所有人都用AI检测招标文件，让所有文件都公平、透明、无漏洞。但当所有人都在同一起跑线上时，AI就没有竞争优势了——大家都能识别潜规则，那就意味着谁也不比谁多看到什么。

所以头部供应商对AI检测工具的态度往往是矛盾的：公开支持、内部保留。公开场合说要推动行业公平竞争，但自己的核心团队在用更先进的AI工具寻找别人看不到的机会。

这个”公平悖论”无法通过工具本身解决。它是市场博弈的内生矛盾。

监管方的困境：规则滞后

监管方是最积极推动AI检测的——佛山的异议投诉率从25.55%降到13.89%，广州实现了95%的检测准确率。这些是看得见的政绩。

但监管方也有自己的难题：规则更新速度跟不上规避手段的迭代。

你发布一份新的负面清单，第二天就有AI模型”学习了”它并给出合理的规避方案。你检测到了一种新型歧视性条款，把它加入模型训练集，下周它就换了一个表述方式重新出现。规则的迭代是线性的，规避手段的迭代是指数级的。

监管方的应对是”增加检测维度”——从文件本身延伸到历史数据、从单份检测延伸到横向对比、从规则匹配延伸到行为分析。但这些都需要更多的数据和更复杂的模型。而数据和模型本身，又面临新的合规问题（隐私、商业机密、法律责任）。

三方的博弈形成了某种动态平衡时，行业进入了一个有意思的阶段：AI检测并没有消灭”潜规则”，而是迫使它升级了。

潜规则从”明目张胆的文字表述”，变成了”隐藏更深的组合布局”，再变成”迁移到文件之外的沟通和信任构建”。每一层升级，都需要更高阶的检测手段来匹配。

这听起来像是个坏消息。但换一个角度想：当潜规则需要AI来设计和规避时，它的成本和风险已经远远高于从前。小型的不法分子退出了市场，只有真正的头部玩家还留在牌桌上。而头部玩家的每一个动作，都会被监管方用AI仔细审视。

最终的结果可能不是”彻底消灭潜规则”——那是一个过于天真的期望。但行业公平性的基线，确实在被AI一点一点地抬升。

结语：当每个字都被扫描，真正的博弈去了哪里

回到开头的那个数字：3.1万份文件，1.9万个歧视条款。

我依然觉得这个数字很棒。它证明了AI在招标文件检测这个场景中的巨大价值——那些过去藏在字里行间、被经验和注意力过滤掉的不公，现在可以被算法一一抓获。

但我也在想：被AI标记的1.9万个问题之外，还有多少因为它读不懂组合逻辑、拿捏不住模糊边界、触及不到文件之外的信息，而安然通过了检测？

AI能读懂每一个字，但它读不懂字与字之间形成的组合陷阱；能识别每一条明确的违规，但拿捏不住模糊表述背后的操作空间；能分析招标文件里所有可见的信息，但触及不到文件之外那个更复杂的博弈世界。

所以”暗箱”并没有被AI彻底照亮。它只是被移到了更深的地方——从”招投标法的一个条文”移到了”三条看似合规的条件组合”，从”指定品牌的违规操作”移到了”模糊表述的自由裁量”，从”招标文件的文字本身”移到了”文件背后的人与关系”。

这些更深层的博弈，才是招标文件检测真正的”暗箱”——也是最需要产品经理、监管者和从业者持续思考的方向。

AI检测发现了1.9万个问题，这很好。但更大的问题是：那些AI没发现的东西，正在以什么方式，继续塑造着这个行业的走向？

这些问题没有标准答案。但它们值得每一个在招投标行业的人，认真想一想。

本文由 @岸见产品社原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自 Unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

岸见产品社

深耕招采赛道，分享行业动态、产业趋势与产品深度观察。

12篇作品 24133总阅读量

邮件群发协议内容是怎么样的？邮件营销系统发信效果

11-203198 浏览

用户运营全链路项目拆解

04-0715280 浏览

对于重启电商价格战这件事，快手也插了一脚

03-032734 浏览

“突袭”推特，Instagram创始人联手再创业

03-024191 浏览

普惠小微金融如何数字化营销？

01-166946 浏览

目前还没评论，等你发挥！

万字长文丨解构AI安全产业链条、解决方案和创业机遇

06-062450 浏览
大模型混战背后：科技“食物链”顶端是否会出现新霸主？

05-233364 浏览
九点思考，2023企业应该如何改变？

02-022952 浏览