「招投标AI落地观察」暗箱里的算力 —— AI时代招标文件的潜规则识别
国家发改委的数据显示,AI检测模型在3.1万份招标文件中揪出了1.9万个歧视性条款,但真正的博弈远不止这些表面问题。本文将深入剖析AI检测的视力表与盲区,揭示招标文件中那些合法却带有定向筛选意图的'柔术'条款,以及AI在信息不对称面前的无奈。这是一场算法与人性博弈的新维度战争。

去年底,国家发改委发布了一组数据:AI检测模型累计扫描了3.1万份招标文件,揪出歧视性条款1.9万个。平均每份文件0.61个雷。这个数字很漂亮。技术自信、监管自信、行业自信,都写在里面了。
但我的第一反应不是”AI好厉害”,而是——那1.9万个问题,是全部吗?剩下的文件,就真的干净吗?
300页的招标文件摊开,每一行字都经过法务的反复打磨。它看起来是一份技术文档,实际上是一张权力布阵图。有些防线一目了然——指定品牌的参数、不合规的资质门槛、封闭的地域限制。但这些,已经是AI能扫到的”表层战场”。
真正的博弈,在字缝里。
这不是一场”AI扫描→人类整改”的线性升级。这是一场新维度的博弈:当每个字都可以被算法审查,真正的潜规则去了哪里?
一、AI的”视力表”——它能看清什么
先给AI足够的credit。实事求是地说,在招标文件检测这件事上,AI的进步速度远超大多数从业者的认知。
第一层:硬规则扫描
这是AI最舒适的区域。你给它一本《招标投标法实施条例》,再加几份地方负面清单,它就能像最认真的实习生一样,逐字逐句地比对。签字盖章要求、保证金比例、资质证书有效期、工期合理性——这些都是布尔逻辑:要么合规,要么不合规。没有中间态。
在这层,AI已经做到了零误差。
内蒙古的DeepSeek智能审查系统上线后,一份200页的招标文件,7分钟出检测报告。但放在过去,同样是这份文件,三个人花两个工作日通读,还不一定能把所有程序性问题抓干净。不是人不认真——是300页的篇幅里藏着太多”不起眼的致命伤”:一个盖章位置错了、一份资质过期三天、保证金多写了两个零。人看累了会漏,AI不会。
第二层:语义级检测
比硬规则更进一层的是语义。不是”有没有盖章”,而是”这个条款是否含有倾向性”。
AI识别歧视性条款的逻辑,不是靠预设的关键词列表。它会理解:当一句话的结构是”须具备XX地区3年以上服务经验”时,这是一个隐性排斥条款——即使”3年以上”和”XX地区”单独看都合法合规,组合在一起就构成了不合理门槛。
佛山市的AI检测系统上线一个多月,148个项目检测了186次,76个项目被检出104个问题。异议投诉率从25.55%断崖式下降到13.89%。这个数字说明什么?说明很多招标文件起草人,自己都没意识到写进去的条款有倾向性——或者,他们以为不会有人看出来。但AI会。
而且AI会记住。这104个问题会成为训练数据——下一次,同类倾向条款一出现,模型只需要0.1秒就会标红。人靠经验积累的能力,AI靠数据积累,速度不在一个量级。
广州的检测平台更近一步。覆盖3100个招标项目后,单份文件的检测准确率达到95%。广东政务服务网的计划是,未来三年实现全省全覆盖。
这些都不是PPT上的数字。它们已经落地、运行、输出结果了。
到此为止,AI表现得像一台完美的”检测机器”。似乎只要给它足够的数据和算力,招标文件的公平性问题就能迎刃而解。但事情没有那么简单。
因为一个残酷的事实是:招标文件里真正决定中标的关键信息,从来不在”不合规”的那一边。
二、AI的”盲区”——它读不懂什么
如果AI只能读到”违法”和”不违法”的二元边界,那它读懂的东西,可能连招标文件真正信息含量的20%都不到。

剩下的80%,是那些合法合规、甚至看起来公平公正的字句,组合在一起却形成了定向筛选网。我把AI目前还读不懂的东西分成三类。每一类,都是招标文件检测的真正硬骨头。
第一类:合理排名的”柔术”
逐条看,每一条都合理。
- “投标人须具备近3年同类项目经验。”合理。任何采购都需要过往业绩。
- “项目负责人须有高级职称。”合理。大型项目对负责人有资质要求。
- “投标人须通过国家医疗物联网认证。”合理。医疗类项目有特殊行业准入门槛。
- “需提供至少2个三甲医院实施案例。”合理。规模证明。
单条检测:全绿。AI不会标红任何一条。
但当这四条出现在同一份招标文件里,事情就变了味——它们组合起来,恰好把市场上五家潜在竞标者筛掉了四家,只剩下一家”天选之子”。不是一个人的操作,是四个看起来完全合规的条件,像四把锁,恰好只留一把钥匙能开。
这就是”合理排名的柔术”。在现行的AI检测框架下,这是一个结构性盲区。因为大部分检测模型做的是单条款判断——逐条扫描,逐条比对负面清单。没有哪个模型会在检测完所有条款后,做一个”组合逻辑推演”:把这些条件放在一起,会不会产生定向筛选效果?
不是技术做不到,是成本太高。排列组合的数量是指数级的。一份300页的招标文件可能有80-100个资格条件,两两组合是4000组,三三组合是16万组。全量计算本身就是算力的无底洞。
更重要的是——组合逻辑是否构成”歧视”,本身就是一个需要裁判的灰色判断。人和人之间都可能吵一架的事,你要AI给出一个”红/绿”的结论?
所以目前行业的主流做法是:把组合检测的最终判断权交给人类专家,AI只负责”标记可疑组合”。但问题又来了——如果一天有几百份招标文件要做检测,每个标记都需要人来看,那效率的瓶颈又回到人身上了。
这不是AI的问题,这是检测本身的悖论:规则越精细,灰色地带越宽。
第二类:模糊表述的”保护伞”
每一份招标文件里都有一类”安全条款”——它们看起来在理,听起来正确,内容却空洞到可以朝任何方向解释。
- “投标人须具有类似项目经验。”——多”类似”才算类似?五年前的项目算吗?规模只有一半的算吗?领域沾一点边的算吗?
- “技术方案需具备前瞻性。”——什么算前瞻性?用了新技术算,还是技术路线的设计思想领先算?
- “优先考虑具备XX能力的供应商。”——”优先考虑”不是强制条件,但在评标现场,这就是一张”倾向通行证”。评审专家看到这条,心里就有了一杆相对的秤。
AI面对这些表述时,陷入了”语义窘境”:
它能识别出这句话是模糊表述。它能给你标出来:”请注意,此为模糊性条款,可能存在操作空间。”
但然后呢?你没法让AI判断这句话”是否违法”,因为它在法律上完全不违法。你也没法让AI说这句话”是公平的”还是”是不公平的”,因为公平与否取决于它怎么被执行——而执行的环节,AI看不到。
这就引出了一个更深层的问题:招标文件的公平性,从来不是纸面上就能完成的。你再怎么把文件写得滴水不漏,如果在评标环节有操作空间,所有的”公平”都是伪装的。AI能检测的是文本本身,但它无法保证文本被正确地执行。
这就像你让一个裁判检查比赛规则——规则本身没问题,但裁判没办法保证所有选手都按规则比赛。因为比赛开始后,规则就不再是写在纸上的东西了。
第三类:信息不对称的”降维打击”
这是最硬的一块骨头。前面两种盲区,至少还能通过算法迭代、数据积累逐步解决。但第三种盲区,AI从一开始就站不到起跑线上。
核心原因很简单:决定一个项目中标结果的关键因素,很大一部分不在招标文件里。
一份招标文件从起草到发布,经历了什么?甲方向内部征集需求、与潜在供应商口头沟通、找几家熟悉的厂商探方案方向、了解市场上有哪些成熟产品——这些信息,有些会写入文件,有些永远不会。
真正影响中标走向的因素里:甲方的内部偏好、决策链条中各方的利益平衡、前期沟通中建立起来的信任感——这些”软信息”绝大多数不会出现在招标文件的字面上。但它们对中标结果的预测力,远远超过文件中任何一项技术和商务要求。
我不是在暗示这有什么”内幕”。这是一个行业运行的现实:采购不是一次性的”信息匹配”,它是一个长期的关系沉淀。
招标文件,是这种关系沉淀的最终呈现形式——而不是起点。
举个例子:一个医院的信息化项目。甲方信息科科长在项目立项前,已经跑了三家同类型医院做调研,跟某家供应商的技术团队深度交流过三次。他对供应商A的技术方案、实施能力、报价区间有了清晰的认知。这些认知,会自然地、无意识地渗透到招标文件的编写中——不是故意的定向,而是”做了调研的人写出来的需求,自然会和调研对象的能力对齐”。
这不是围标串标。这是信息不对称下的自然倾斜。
而AI检测这类场景时,面对的是一个信息真空。它能看招标文件,但看不到:甲方上个月跟谁沟通过、会前看过谁的方案、评审专家里谁跟哪家企业有历史合作。这些信息没有文字化,没有进入任何系统,不存在于任何可以被扫描的数字维度里。
所以AI的”盲区”不是节点性的——它是系统性的。不是因为AI不够智能,而是因为招标采购这件事本身,有太多环节的信息根本没有进入数字层。
你无法检测一份不存在的文件。
三、AI检测的”三个层次”——重新定义边界
如果我们把AI在招标文件检测中的能力做分层,大概是这样的:

L1:规则引擎——替代人工复核
这是”已完成”的一层。
规则引擎抓的是确定性问题:资质过期、盖章缺失、保证金比例不对、指定品牌、地域限制、不合理业绩门槛。AI在这层已经做到了百分之百的覆盖率和接近百分之百的准确率。
这层的价值是消灭低级错误。过去一份招标文件发出去,经常被供应商投诉到这里那里的程序性问题——不是故意使坏,是起草人自己也没注意到。AI把这张”安全网”铺开后,行业的基础合规水平会大幅提升。每一份发布的招标文件,至少不会在程序性问题上翻车。
它的本质,是一台无限耐心的复读机。
L2:语义推理——辅助人工判断
这是”进行中”的一层。
AI开始理解语句的倾向性、条款的隐含意图、评标标准中的操作空间。它能标出”这可能有问题”,然后由人类专家做最终裁决。
这层的价值是大幅提升检测的深度。政策制定者希望的”全覆盖智能检测”,落地的就是这一层——但它的瓶颈也在这里。
语义边界是模糊的。”倾向性”和”合理性”之间,没有一条清晰的线。一种条款在一个项目里是合理的技术要求,在另一个项目里可能就是排斥潜在供应商的定向条款。判断的依据不仅看条款本身,还要看整个项目的背景、市场格局、供应商能力分布——这些信息,AI很难完整获取。
所以L2目前能做到的,是”提示可疑,但不代替判断”。1.9万个被标记的歧视条款背后,还有多少因为语义边界模糊而未被标注的灰色地带?没人知道。灰色地带之所以是灰色地带,就是因为没有标准答案的地方,最难被算法覆盖。
L3:博弈推演——替人做决策(理想态)
这是”还在路上”的一层。
L3意味着AI不仅能做合规检测,还能预测甲方的真实需求、模拟不同评分方案下的中标概率、自动优化投标策略。它的本质是从”检测工具”变成”博弈参谋长”。
但这条路为什么还远?因为招投标的底层逻辑,从来不是信息匹配,而是人的博弈。
甲方在平衡各方利益、评审专家有自己的判断倾向、竞争对手会针对性地调整策略——这些变量无法被完全文本化,更无法被算法可靠地建模。你让AI去预测一个包含人际关系、利益权衡、组织政治的多方博弈,它面对的信息完整度,就像一个只看棋盘一角就去判断整盘棋胜负的棋手。
信息层面就输了,算法再强也没用。
所以L3的理想很丰满,现实很骨感。但它确实是一个值得瞄准的方向——因为当所有参与者都知道对方在用AI时,博弈本身会进化,进化的终点就是L3。
四、博弈视角——AI时代招标文件检测的”三方困局”
说完了”AI能做什么和不能做什么”,我们把镜头拉远一点,从行业博弈的视角看看这个局面。我先给你一个不太舒服的推论:
当招标方也开始用AI写招标文件时,投标方用AI读招标文件的优势会被对冲。
不是假设。是正在发生的事。双方都在学习使用同一种武器。这个局面构成了三个角色的困局:

招标方的困境:既要又要
甲方用AI做合规审查,这没有疑问——有政策压力、有监管要求、有舆论监督。但一个甲方不愿意公开谈的真相是:有些甲方也在研究”如何在合规的前提下做倾向”。
这不是阴谋论。人天然倾向于选择自己了解和信任的供应商。这是人性,不是犯罪。但当你用AI来辅助起草”合法但有效”的定向条款时——比如让AI帮你分析现行负面清单的边界在哪里,然后写一条刚好不触线但能卡掉竞争对手的条件——你本质上是在用自己的AI对抗监管的AI。
AI检测→AI规避→检测模型迭代→规避模型升级。这不是猫鼠游戏,这是军备竞赛,竞赛的双方用的是同一类算法。
投标方的困境:公平悖论
投标方是AI检测的最大受益者——理论上。但实际落地中有个尴尬的自相矛盾:
投标方希望所有人都用AI检测招标文件,让所有文件都公平、透明、无漏洞。但当所有人都在同一起跑线上时,AI就没有竞争优势了——大家都能识别潜规则,那就意味着谁也不比谁多看到什么。
所以头部供应商对AI检测工具的态度往往是矛盾的:公开支持、内部保留。公开场合说要推动行业公平竞争,但自己的核心团队在用更先进的AI工具寻找别人看不到的机会。
这个”公平悖论”无法通过工具本身解决。它是市场博弈的内生矛盾。
监管方的困境:规则滞后
监管方是最积极推动AI检测的——佛山的异议投诉率从25.55%降到13.89%,广州实现了95%的检测准确率。这些是看得见的政绩。
但监管方也有自己的难题:规则更新速度跟不上规避手段的迭代。
你发布一份新的负面清单,第二天就有AI模型”学习了”它并给出合理的规避方案。你检测到了一种新型歧视性条款,把它加入模型训练集,下周它就换了一个表述方式重新出现。规则的迭代是线性的,规避手段的迭代是指数级的。
监管方的应对是”增加检测维度”——从文件本身延伸到历史数据、从单份检测延伸到横向对比、从规则匹配延伸到行为分析。但这些都需要更多的数据和更复杂的模型。而数据和模型本身,又面临新的合规问题(隐私、商业机密、法律责任)。
三方的博弈形成了某种动态平衡时,行业进入了一个有意思的阶段:AI检测并没有消灭”潜规则”,而是迫使它升级了。
潜规则从”明目张胆的文字表述”,变成了”隐藏更深的组合布局”,再变成”迁移到文件之外的沟通和信任构建”。每一层升级,都需要更高阶的检测手段来匹配。
这听起来像是个坏消息。但换一个角度想:当潜规则需要AI来设计和规避时,它的成本和风险已经远远高于从前。小型的不法分子退出了市场,只有真正的头部玩家还留在牌桌上。而头部玩家的每一个动作,都会被监管方用AI仔细审视。
最终的结果可能不是”彻底消灭潜规则”——那是一个过于天真的期望。但行业公平性的基线,确实在被AI一点一点地抬升。
结语:当每个字都被扫描,真正的博弈去了哪里
回到开头的那个数字:3.1万份文件,1.9万个歧视条款。
我依然觉得这个数字很棒。它证明了AI在招标文件检测这个场景中的巨大价值——那些过去藏在字里行间、被经验和注意力过滤掉的不公,现在可以被算法一一抓获。
但我也在想:被AI标记的1.9万个问题之外,还有多少因为它读不懂组合逻辑、拿捏不住模糊边界、触及不到文件之外的信息,而安然通过了检测?
AI能读懂每一个字,但它读不懂字与字之间形成的组合陷阱;能识别每一条明确的违规,但拿捏不住模糊表述背后的操作空间;能分析招标文件里所有可见的信息,但触及不到文件之外那个更复杂的博弈世界。
所以”暗箱”并没有被AI彻底照亮。它只是被移到了更深的地方——从”招投标法的一个条文”移到了”三条看似合规的条件组合”,从”指定品牌的违规操作”移到了”模糊表述的自由裁量”,从”招标文件的文字本身”移到了”文件背后的人与关系”。
这些更深层的博弈,才是招标文件检测真正的”暗箱”——也是最需要产品经理、监管者和从业者持续思考的方向。
AI检测发现了1.9万个问题,这很好。但更大的问题是:那些AI没发现的东西,正在以什么方式,继续塑造着这个行业的走向?
这些问题没有标准答案。但它们值得每一个在招投标行业的人,认真想一想。
本文由 @岸见产品社 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自 Unsplash,基于CC0协议
- 目前还没评论,等你发挥!

起点课堂会员权益




