
打开抖音搜"面膜测评",排在前面的视频里,有一条博主举着两片面膜,一脸真诚地说"我自费买了八款,帮你们排了雷"。评论区有人问"第三个链接是什么牌子",博主秒回一个购物链接。点进去,下单,收货,拆开,跟视频里那个质地、气味、效果全不是一回事。
这不是个例。中消协2023年查了12个平台350个测评账号,55.7%存在商测一体,既当裁判又当运动员。35.7%涉嫌虚假测评。2026年上海消保委又查了一遍,23%的第三方评测视频存在信息误导,近八成消费者遇到过评测描述和实际产品对不上的情况。
2026年6月8日,国家网信办和市场监管总局联合印发《网络测评活动规范》。四条核心条款,条条见血:测食品必须有资质,不许用野路子方法;挂购物链接的测评必须标"广告";纯主观感受评价必须标注"仅为个人体验,仅供参考";拉踩对比直接禁止。
行业里有人叫它测评圈的紧箍咒。但紧箍咒到底戴在了谁脑袋上,这个问题比看上去复杂得多。
一、测评行业的生意经:信任套利
测评这个行当,理想状态是博主自费购买产品,独立测试,如实发布,内容积累受众,受众吸引正规广告。但这条路线在现实中几乎跑不通,测试成本太高,流量变现太慢。
跑通的路线是另一条:品牌方出钱,指定评测方法和结论方向,博主披着"独立第三方"的外壳发布内容。上海一家广告公司的员工对媒体说过,她日常工作就是帮消费品牌"选择合适的测评账号,投放测评形式的广告"。原话:"投放一个测评广告,消费者不太会识别出来。"
品牌花钱买的不是播放量,是"第三方"这三个字在消费者脑子里挂着的信任感。一条明标"广告"的视频,用户看了先竖一道防线;一条写着"自费测评""真实横评"的视频,用户放松警惕,顺着博主铺的路走进购物链接。信任套利,把消费者对"第三方"的信任,倒手卖给了品牌方。
更极端的操作叫定制化打压。数码圈有个说法:给钱就吹,不给钱就负优化。品牌A买了商单,博主把A和竞品B、C摆一起横评,但测试标准被悄悄设计成A天然占优的维度。如果A没投钱呢?博主做一期"A产品五大硬伤",等A来交保护费撤稿。汽车圈更粗暴,央视财经2025年9月曝光的报价单显示,60万粉丝博主,60秒以上视频3.8万元。但黑商单,专门踩一个捧一个的,报价比正规商单还高一截。
MCN机构在这条链上是总装车间。新京报贝壳财经2024年底暗访过一家MCN,对方给"一款无人听说的机械键盘做推广"规划了完整路径:先上剧情类视频养认知度,再切专业数码博主做测评。"如此一来既能跟市场已有商品做对比体现优点,也能提升消费者认可度和购买热情。"另一家MCN更直接,除了定制话术和数据,还负责后期流量运营,批量制造评论区正面互动来撬算法推荐。视频底下那个"我觉得比A品牌好用多了"的热门评论,可能是一块钱一条的水军。
这不是道德滑坡,是经济结构的必然。独立测评的生产成本远高于广告植入的收入时,以商养测就不是选择,是生存逻辑。理解这一点,才能理解新规为什么必须用行政力量打断这个循环。市场自己停不下来。
二、四条红线各自切掉了什么
《规范》不是笼统的"加强监管"。四条核心条款,每条对着一个具体病灶。
食品检测必须有资质,不能用野路子方法。这是最硬的一条。过去食品测评的门槛是"有张嘴就能干",网红博主自己尝两口、翻翻成分表就给结论,最离谱的有人用打火机烧粉丝判断含不含塑料。中国社科院大学互联网法治研究中心主任刘晓春在央视采访里说得准确:网络食品测评的结果会直接改变消费者购买选择,跟食品安全直接挂钩,测评的人必须说清楚,你的测评性质是什么、依据是什么、标准是什么。这条规定把食品测评的门槛拉到了"有CMA或CNAS资质才能干"。
隐形带货必须标广告。这一刀砍在测评行业最核心的盈利模型上。《规范》写得明确:测评内容附了购物链接的,必须显著标明"广告"。这不是建议,是《广告法》框架下的强制义务。过去那种挂链接不说是广告的灰产操作,现在直接撞上违法边界。
纯主观评价必须打标签。这条把测评行为劈成两半:你真的做了测试,还是只用了一下就说感受?没做测试就是凭感觉,展示时必须显著标注"仅为个人体验,仅供参考"。刘晓春解释过,很多测评主体刻意混淆主观体验和专业检测,把个人感受包装成权威结论。强制标注让消费者一眼分清,也让博主没法再用主观冒充客观。
禁止双标对比和拉踩。不许用不同标准、不同方法对同类产品做横向或纵向比较,不许断章取义引用检测报告,不许靠贬损其他产品抬高自己那款。定制化打压的操作空间被焊死了。
还有一条容易被忽略的:测评样品必须从市场上买得到的普通商品中获取,来源可追溯,厂家特供的优化版本不能用。美妆圈和数码圈长期存在的特供机潜规则,被一刀切了。
三、谁得利,谁受伤
消费者当然是表面最大赢家。信息透明度跳了一个台阶,瞄一眼标注就知道面前这条是广告还是独立测评、是专业检测还是个人感受。但翻过来看,相当一部分测评博主会在新规下停更或减产。资质门槛一提,"一部手机一个人一台剪辑软件"的野生测评基本全出局;广告必须标,品牌投放意愿跌下去,博主没有品牌输血拿什么撑起内容制作?好的独立测评供应不上来,消费者可选的信息反而比之前更少。这算不算一种反弹?
对头部专业测评机构,新规是护城河。合规成本就是竞争壁垒,有资质的机构拿到了免于劣质低价竞争的通行证。但对大量中腰部和尾部博主,日子非常难过。过去披着测评外衣做广告的模式在新规下直接违规,接不到商单,品牌不敢投,纯靠流量变现养不起检测设备和资质。行业重新洗牌几乎板上钉钉。
大品牌本来就养着合规团队,新规的广告标注要求对他们冲击有限,甚至可能暗自庆幸,竞品那套灰色营销套路被堵上了。但中小品牌不一样,测评投放一直是性价比最高的新品曝光路线,这条路一收紧,大品牌在营销资源上的碾压优势进一步拉大。新快网6月9日的报道说得直白:不愿付费投放测评的中小品牌,线上曝光渠道可能被切断,市场生存空间持续被挤压。
平台方的审核成本则要炸了。判断一条视频是真实测评还是隐形带货,需要专业能力,不是关键词过滤能搞定的。平台被挤进两条路:大幅扩充人工审核,或者靠AI审但承担漏判被追责的风险。
四、造假测评走到刑法门口
如果说差评定制还是灰色地带,那汽车圈的操作已经把测评从灰色推到了黑色。
2024年8月,B站百万粉UP主"原来是翔翔啊"发布了一条小米SU7和极氪007的对撞测试视频。画面里两车高速相撞,SU7小电瓶在碰撞后断电,车门打不开,E-call紧急呼叫系统瘫痪。视频上线当天全网刷屏。
但小米拿出了后台数据:碰撞发生后E-call第一时间就接通了。进一步调查发现,UP主在碰撞测试前人为拆掉了SU7小电瓶的电源线,又用被叉车损坏过的小电瓶照片误导观众。这不是测试不严谨,是系统性造假。
2024年11月,警方以涉嫌损害商业信誉罪对UP主高某翔刑事拘留。2025年1月正式逮捕,9月以损害商品声誉罪提起公诉。2026年2月6日,案件在北京海淀法院开庭,庭审三个多小时,未当庭宣判。辩护律师做无罪辩护,高某翔当庭不认罪。
不管判决结果如何,这个案子钉进了一个事实:造假测评可以构成刑事犯罪。这不是行政处罚,不是封号整改,是刑法。
五、杨梅和测评的同一个病
2026年5月,漳州。部分杨梅收购商用脱氢乙酸钠和"三无"甜味剂泡杨梅,视频曝光后整个漳州杨梅产业被一刀切。收购价从每斤6元跌到1元,7万吨杨梅滞销。一个七十多岁的果农一天摘十二个小时,到了收购点,收购商说"今天收满了、不要了"。龙海区杨梅协会会长曾行贵对南方都市报说,个别不法商家的违法行为,不该让整个产业所有勤恳种植的果农来买单。这话让人不好受。
这个逻辑在测评行业完全同构。一个博主收钱做假测评,消费者被骗过一次之后,不是说"这个博主不可信",而是"网上的测评都不可信"。八成消费者对测评建立了负面预期。个体信任崩塌之后,毁掉的是整个行业层面的制度信任。
南京大学徐彪主持的国家自然科学基金项目"消费者信任受损及修复机理研究"发现,信任受损有显著的外溢效应,对某一个品牌或信息渠道的失信,会传染到同品类甚至跨品类的其他消费决策。被测评骗过的消费者,不再只躲开那条被充值的视频,而是躲开整个"先看测评再下单"的行为习惯。
中国消费市场的信任结构跟西方有一个根本性区别。西方消费者默认相信市场监管体系会保护他们,在这个前提下评估单个产品和品牌。中国消费者长期更相信亲戚朋友的口碑和网红博主的推荐,而不是官方质检报告和监管通报。人民网2013年发表的一篇学术文章把这个结构拆得很清楚:改革开放引入了市场机制,但没有同步引进能够配合的制度信任模式,传统的"关系信任"被迫充当替代品。人际信任的覆盖面极其有限,一旦从熟人社会扩展到陌生人交易的网购场景,立刻捉襟见肘。
一项基于中国家庭追踪调查(CFPS)数据的实证研究有个反直觉的结论:居民公共治理信任的增强,对消费总量和消费升级有显著促进作用;但人际关系信任与消费行为的关系不显著。真正能推动消费升级的,是消费者对制度本身的信任,而不是对某个博主个人的信任。我第一次读到这个结论时也觉得反直觉,但细想有道理,博主推荐带来的冲动消费和制度保障带来的可持续消费,根本不是同一个东西。
测评行业十年野蛮生长,踩在这个信任结构的软肋上。它用人际信任替代了制度信任,然后把人际信任一步步套利成了商业利润。人际信任是脆弱的东西,被骗一次,信任账户就清零。制度信任才抗得住个别失信事件的冲击。
新规的四条红线,不是在修复人际信任,而是在给制度信任搭基础设施。当一个食品测评必须标明CMA资质,当一个带货视频必须标注"广告",当一条横评不能有定制化标准,消费者不再需要依赖"这个博主看起来可信"的主观判断,他只需要读取标注就够了。
但标注只是第一步。如果标注了"广告"的视频内容仍然严重夸大,消费者投诉之后能不能得到处理?被标注为"个人体验"的分享如果被证实是品牌付费的隐性广告,有没有处罚机制?消费者对新规标注的信任,取决于标注背后有没有真实的执行链条。如果标注变成一张免责牌,"我已经标注了广告,内容失实也跟我没关系",那制度信任的根基还没搭起来就先塌了。
六、落地才是真正的考场
拼多多的35.97亿罚单不只是食品安全新闻,它是一份监管体制改革的操作说明书。2026年4月,市场监管总局对7家电商平台"幽灵外卖"系列案作出行政处罚,拼多多被罚15.22亿元居首。过去全国性平台的跨区域违法行为,监管路径是"总局到省级局到地市级局到属地局到平台",链路长,扯皮多。这次总局直接立案、直接处罚,把整条链路压缩成一步。释放的信号很明确:涉及全国性消费权益的重大问题上,总局不再等地方了。
网络测评的跨区域属性比电商平台更散更碎。一个测评视频上传到B站,作者在云南、产品来自浙江、广告主在广东,按属地管理的传统路数,三个地方的监管局要协同执法,基本是天方夜谭。如果新规真要执行出牙齿,总局必须走同一条路径。
但总局不可能管得了全国十几万测评账号每天产出的海量内容。日常监管的主战场还是地方。2025年3月杨铭宇黄焖鸡后厨卫生问题被曝光,近三年投诉量增长300%,行政处罚记录却只有个位数。"重审批轻监管"五个字后面站着的不是个人懒政,是机构激励的底层逻辑:审批有明确流程和时间表,做好了有据可查;日常抽检发现问题要不要处罚、处罚到什么程度,空间太灵活。
同样的逻辑套到测评内容监管上,问题只会放大。判断一条视频是真实测评还是隐形带货,需要专业能力,基层监管人员没有这个能力储备,也缺乏主动去做的动机。2026年两会期间,全国政协委员唐俊杰提了一套方案:搭建全国一体化在线监管平台,建立"一竿子插到底"的执法督察机制,用数字技术破除地方保护主义和隐性渎职。这套思路套到测评监管上同样成立。平台主动巡查算法、总局直接接入的监测系统、消费者一键举报的可追溯处理链条,三样东西加起来,比往各地发一万份红头文件管用。
技术上可行的东西长期没做,从来不是技术问题,是权力分配问题。总局能不能绕过地方直接管到内容层面,不是技术讨论,是政治选择。
七、三条暗流
强力监管从来不只是解决旧问题,它也在制造新问题。
第一条暗流:测评内容的寡头化。资质门槛抬上去之后,个人博主和中小机构的测评内容会大面积消失。能合规存活下来的基本只剩头部机构和有资质的检测机构。测评内容从百花齐放收缩成几家坐庄。而这些头部机构本身商单依赖度就不低,合规不等于独立。消费者面对的可能是合规但未必客观的新困境。
第二条暗流:标注依赖症。新规让你标注广告、标注主观体验、标注利益关联。标完之后呢?法规保障的是消费者的知情权,不是判断力。一条标了"广告"的测评照样可能夸大其词;一条标了"仅为个人体验"的分享偏见照样存在。如果消费者脑子里形成"有标注等于安全"的回路,警惕性反而会掉下去。这算不算一种新的信息不对称?
第三条暗流:品牌自建内容的崛起。第三方测评渠道收窄之后,品牌方最自然的反应可能不是更规范地投放测评,而是干脆绕过测评自己上手做内容。品牌自建实验室、自聘KOL做官方测评、挂着科普的名义做软性推荐,这些内容的合规边界比传统测评模糊得多,监管难度直接升了一个档次。
八、中美英的三套剧本
中美英三大消费市场几乎在同一个时间区间里对网红营销和测评内容动了刀子,但动刀方式是三套完全不同的剧本。
中国走先发制人。资质前置,不给违规留窗口。要测评食品?先把资质亮出来。要发布检测结论?先按国标来。纯主观感受?必须公开标注。这套逻辑的核心是从源头把漏洞堵住。
美国联邦贸易委员会走事后追责。FTC对网红营销的核心要求是:任何实质性的品牌关联必须清晰披露,付费合作、免费赠品、联属链接都要明确标出来,通常用#ad或Paid partnership。但FTC不要求创作者提前出示任何资质证明。你可以在没有医学学位的情况下发健康建议,可以在没有金融牌照的情况下聊投资。只有当虚假信息被证实造成了实际伤害,FTC才介入追责。有人评价这种模式:放养,给你自由,但出事了一定追到你死。
英国广告标准局ASA走全程介入。网红发的商业内容,ASA可以直接要求修改或下架,品牌方和网红双方承担连带责任。
三套制度背后是三套监管哲学。中国信事前管控的效率,美国信事后追责的威慑力,英国信全程把控的严密性。谁高谁低没法简单判断。资质前置可能压住创新,事后追责可能让消费者先受伤再维权,全程推进的行政成本高到吓人。但在测评行业信誉已经被透支到底的当下,先发制人大概率是代价最小的选择。
尾声
回到最初的问题:新规将产生什么影响?
短期,标注体系会在一到两个季度内落地,头部机构和平台抢着合规,中小博主大面积退出,"以商养测"的核心灰色地带被切掉。这是写进条文里的东西,应该能在最短时间内实现。
中期需要一两年。资质壁垒重塑行业格局,MCN业务模式被迫转型,品牌方的测评投放策略重新设计。摩擦成本不会低,测评内容可能出现短期的供给紧缺,但信用环境会逐步修复。信任重建从来不是线性的,中间一定有反复。
真正难的东西在长期。这份新规如果只是管住了一时的乱象,没能催生出一个独立、可信、能自我运转的测评生态,那它的效果就是一次性的。要做到这一点,需要三件新规自己没有的东西:一套中央层面的直管执行机制,不走属地路径,不被地方利益稀释;一个独立公测平台,给消费者提供不被任何利益方绑定的信息锚点,香港消费者委员会的《选择》月刊从1976年起一直在干这个事,公信力养了几十年,证明这条路走得通;一套让制度信任逐渐替代人际信任的消费文化基础设施,标注只是第一步,标注背后真实的问责才管用。
新规真正在做的事,是在一个被透支到极限的行业里先按下暂停键。暂停键之后怎么走,不在这份文件的条文里面,在接下来每一份执法决定、每一次平台巡查、每一个标注是否被认真对待的细节里面。
参考来源:
国家互联网信息办公室、国家市场监督管理总局,《网络测评活动规范》,2026年6月8日
中国消费者协会,《第三方测评账号调查》,2023年
上海市消费者权益保护委员会,《直播短视频第三方评测专项调查》,2026年3月
刘晓春(中国社会科学院大学互联网法治研究中心主任),央视采访,2026年6月
李勇坚(中国社会科学院财经战略研究院互联网经济研究室主任),南方都市报,2026年6月
央视财经,《央视起底新能源黑公关》,2025年9月
新京报贝壳财经,《"变味"的测评:包装一条龙》,2024年12月
大河报/红星新闻,小米SU7碰撞测试博主刑事案件报道,2026年2月
人民网,漳州"泡药杨梅"事件报道,2026年5月
国家市场监督管理总局,7家电商平台"幽灵外卖"系列案行政处罚决定,2026年4月
人民网,《信任模式的社会建构》,2013年
国家自然科学基金项目(徐彪/南京大学),《消费者信任受损及修复机理研究》
CFPS,《社会信任心理与消费行为:基于总量和层次的机制研究》
新快网,网络测评强监管报道,2026年6月
FTC, "Disclosures 101 for Social Media Influencers", 2023
