电话:010-60531612
邮箱:teskey@126.com

智库论见丨从建算力到立标准:AI计量体系如何撬动万亿产业提质
2026-06-12 浏览次数:0AI辅助诊断靠不靠谱?自动驾驶安不安全?当这些技术加速进入日常生活,一个绕不开的问题摆在面前:谁来给AI的性能“打分”?近日,国家市场监督管理总局、国家发展改革委联合印发的《人工智能计量体系和能力建设指引(2026版)》(以下简称《指引》)系统布局AI计量能力建设。这意味着,我国AI治理正在从审慎观察进入建章立制的实质性阶段,AI产业从“建算力、扩规模”向“提质量、强根基”迈出关键一步。
为何要为AI立“度量衡”?
2025年我国人工智能企业数量超过6000家,核心产业规模预计突破1.2万亿元,智能算力规模达到1590 EFLOPS。在产业高歌猛进的同时,一个基础性问题日益突出——我们缺一把测量AI能力的“尺子”。
在医疗领域,AI辅助诊断系统加速部署到基层医院,但算法可靠性缺乏权威计量手段,一旦出现误诊,责任认定无据可依。在自动驾驶领域,首批L3级车型已获得上路准入许可,但系统安全的量化评估体系仍在完善中。中国信通院发布的报告也指出,当前大模型评测在数据集构建、评测方法、指标体系等方面均缺乏统一标准,不同机构的测试结果往往难以横向比较。
《指引》正是在这样的背景下出台的。日前,接受中国经济时报记者采访的三位专家从不同角度对这份文件进行了深入解读。
国家发展和改革委员会市场与价格研究所室主任、研究员曾铮从治理与产业落地角度指出,这份文件的出台基于三重考量。
一是筑牢人工智能技术创新可信根基。当前模型性能评估、算法可靠性验证、数据质量认定等环节缺乏统一、权威、可溯源的计量规则,导致不同主体的技术声称难以横向比较,市场信任成本较高。《指引》着力破解“用什么尺子量、谁来量、怎么量”的基础性问题,为技术创新提供客观、规范、可信的评价依据。
二是提升AI产业治理效能。AI正加速向医疗、交通、金融、工业等领域渗透,监管机构若缺乏科学计量工具,就难以识别模型性能虚标、算法可靠性不足等问题。《指引》推动AI性能实现“可测量、可比较、可追溯”,有助于治理从事后处置走向全过程管理。
三是促进AI应用落地。当前产业面临供需信息不对称、场景验证成本高、应用成效难评估等问题,技术供给方容易以参数规模、榜单成绩替代真实应用能力,行业用户则“不敢用、不会选”。《指引》推动计量技术嵌入研发、测试、部署全过程,有助于降低信任成本和试错成本。
清华大学新闻学院、人工智能学院双聘教授沈阳从产业基础设施的视角分析认为,这份文件标志着我国人工智能产业正从“建算力、扩规模”向“提质量、强根基”迈出关键一步。
“计量是质量的基石,当AI技术加速渗透千行百业,如何让其性能可测量、结果可比较、过程可追溯,已成为产业健康发展必须回答的基础性命题。”他进一步指出,正如工业革命催生了标准化体系,智能时代同样需要属于自己的“度量衡”基础设施。没有计量能力,就没有质量评价;没有质量评价,市场便无法有效筛选——对企业是公平竞争的前提,对用户是放心使用的基础,对监管是精准施策的依据。
北京信息科技大学商学院教授葛新权则将目光投向了“最后一公里”问题。他坦言,技术创新中始终存在着从实验室到行业应用的系统性断层——“科研导向与企业需求错位、中试与产业化能力缺乏、利益与风险分担机制缺失,尤其是‘懂科技、懂产业、懂资本、懂市场、懂管理’的知识服务人才稀缺,形成‘最后一公里的梗阻’”。
在他看来,《指引》从硬件技术基础设施到“AI+计量”全链条知识服务,为解决数据源识别、计量等难题提供了路径,有望打通这一长期存在的梗阻。
没有统一的“度量衡”,AI跑得再快也难以让人放心。三位专家虽然视角不同,但都普遍认为,为AI立“度量衡”已是产业发展的必答题,而非选择题。
六把“尺子”量出AI真实力
《指引》围绕基础支撑、通用技术、核心技术、计量技术规范、计量服务产业、智能赋能计量等六大部分进行了系统布局。受访专家表示,六大布局从数据根基到人才机制,为AI全链条立下可操作的标尺。
国家发展和改革委员会市场与价格研究所助理研究员魏巍从政策设计层面梳理了六大领域的逻辑关系。
他指出,基础支撑是“地基”。建立AI计量基准、标准物质、参考数据集和测试数据集,相当于为AI测评设立稳定可靠的“计量锚点”,让不同机构、不同产品的测量结果能够相互比较、相互验证;通用技术和核心技术则是“主体”。前者覆盖算力效率、数据质量、训练成本等共性要素,让AI基础能力从“可展示”走向“可验证”。后者聚焦感知识别、自然语言处理、智能决策等关键能力,推动评价从静态测试向动态验证拓展;计量技术规范是“规则”。形成覆盖测量方法、测试环境、结果表达等环节的规范体系,并推动国内与国际衔接;计量服务产业是“落地”。推动计量技术机构、企业和第三方机构协同参与,降低企业获取计量服务的门槛;智能赋能计量则是“反哺”。将AI技术引入计量工作本身,形成双向促进的良性机制。
沈阳教授特别关注数据根基建设。他认为,六大布局中最具基础意义的是数据体系建设。《指引》构建了最高计量特性数据集、标准参考数据集和测试数据集三级体系,这将为AI的“可测量”提供数据根基。
“没有高质量、可溯源的数据集,所有测量都是空中楼阁。”他举例说,当前大模型评测之所以“测不准”,很大程度上是因为测试数据集质量参差不齐、构建方法不统一。三级数据体系的建立,相当于为AI能力评价提供了“标准答案”和“模拟考场”,让不同系统能在同一把尺子下被衡量。
葛新权教授则从“技术与人文共生”的角度给出了独特观察。他认为,六大布局表面上看是技术方案,本质上是在构建一种“信任机制”。“AI要真正走进千行百业,光有技术参数不够,还得有人信、有人用、有人管。”他认为,“智能赋能计量”这一部署——用AI管AI,既是方法创新,也是理念突破。“这意味着计量体系不是僵化的教条,而是可以自我迭代的生态系统。”他同时指出,技术布局再完善,最终还是要靠人来执行。六大领域能否落地见效,取决于有没有一支“懂科技、懂产业、懂资本、懂市场、懂管理”的人才队伍去推动。
如何打通“最后一公里”?
如何让计量体系真正从纸面走进产业一线?三位专家分别从政策协同、技术生态、人才培养等方面提出了建议。
魏巍从政策协同角度提出,后续需要抓好三方面工作。一是加快配套政策跟进,推动计量技术规范与现有标准体系衔接,避免“新尺子”与“旧尺子”打架。二是强化关键技术攻关,特别是面向大模型评测、智能传感器校准、算法可靠性验证等短板领域,集中突破一批计量难题。三是鼓励地方和行业先行先试,在智能制造、智慧医疗、智慧交通等14个重点领域开展计量技术应用示范,形成可复制可推广的经验。他强调,《指引》属于指引性质,最终落地效果有赖于各地方、各行业的响应与协同。
沈阳教授的建议更聚焦于技术层面。他认为,打通“最后一公里”的关键在于建立开放、共享的计量服务生态。他提出三点。一是推动国家级计量技术研发应用中心建设,研制具有自主知识产权的计量标准装置,形成覆盖算法模型、算力效率、数据质量的全链条计量能力。二是建立基础资源共享机制,打破行业数据壁垒,让不同领域的数据集、测试环境、评价方法能够互通互认。三是鼓励第三方计量服务机构发展,形成公益性基础服务与市场化专业服务协同发展的格局,降低中小企业特别是创业公司获取计量服务的门槛。“计量不是少数大企业的‘奢侈品’,应该是全行业共享的‘基础设施’。”
葛新权教授则从“人”的角度给出了四条系统建议。第一,态度是生产力。从事AI研发和应用的人员要端正对创新和质量的态度,把“可测量”内化为工作习惯。第二,人文修养是底色。每个人需要在生活工作学习中不断提升认知层次,尤其要培养与AI协同的思维能力,让人文素养成为技术应用的“刹车片”和“方向盘”。第三,尊重每个人是底线。AI为每个人提供了创新机会,尊重个体的创造力和差异性,创新才能持续涌现。第四,培养复合型人才是路径。大力发展科技商学,打造顶尖科技商学院,培养真正“五懂”的智慧型科技产业人才,尤其要重视跨界领军人才的培育,打通“最后一公里的梗阻”。“人文是AI的未来,”他强调,“在人与AI创新共生共进中,人和AI都是主体,但人是主体的灵魂。”