中新网1月19日电日前,继阿里巴巴宣布将启动大数据打假后,国内另一大互联网平台百度也公布了2016年“打假”成果。百度搜索业务风险控制部门对外公布,2016年全年,百度共计查处各类违法违规广告16.9亿条,相当于每天都有超过460万违规广告被处理。此外,百度全年共计完成超过80万家企业的搜索信息认证,围绕针对搜索广告客户的优胜劣汰和针对搜索广告内容的去伪存真两个维度,百度搜索平台均取得实质性突破。
百度表示,为了保障数亿网民的搜索体验和数十万家优质企业正常营销需求,百度平台将设立更为严格的准入门槛及审核流程,并持续对各类试图钻平台空子的不法分子展开清理打击,这在未来会成为百度一项极为重要且长期展开的工作。
百度明确搜索推广“禁区和底线”
百度于2016年8月对外公布了《百度推广准入准则》,其中详细列举了包括“非法医疗服务、非法及违禁药品、赌博及彩票类违法内容”在内等十类内容严格禁止推广。同时,为了保障用户体验和平台的价值及管理需要,依据相关法律规定并结合百度风控部门自身实践经验,百度宣布互联网金融、网络棋牌、期刊、人才中介等五类“限制推广的内容”。由于基本明确了搜索推广平台禁区及底线,该《准则》被业界称为国内搜索引擎行业的首部“准宪法”。
根据百度方面介绍,这些“禁区”既包括国家法律已经做出的限制性规定,也有部分是百度认为应当给予一定的限制的行业,作为付费搜索的一种形式,未来百度搜索推广对客户资质的审核将会非常严格。“这等于给百度搜索平台架起了高压线,任何人和企业胆敢碰触这些禁区,均将直接被清理出平台,并永久拒绝开户。”
受此影响,2016年全年,共计2518家医疗机构和高达1.26亿条医疗广告被下线处理。与此同时,有超过三十六万个搜索关键词,被百度列为禁止广告主购买的推广关键词。这其中,既有包括公检法机构、办身份证、三级片、彩票网、盗版游戏等法律法规明确禁止的部分;也包括诸如支付宝/微信/国航客服电话、性病/脑出血/帕金森等涉及生命健康和财产安全的部分;还包括诸如特朗普、天气预报、G20、中国好声音等直接和网民搜索主要需求体验相关的部分。对于类似搜索关键词,即便其拥有巨大商业流量价值,但所有的广告主在其百度搜索推广账户后台,均无法提交类似词汇,系统会直接提示触碰违禁词,而拒绝通过。
互联网专家指出,《百度推广准入准则》是百度搜索推广自上线以来发出的最严禁令,一方面表明百度希望通过设定监管门槛,来达到对客户的甄选作用;另一方面,也体现了百度董事长兼CEO李彦宏用“壮士断腕”表达的百度整改决心,特别强调用户至上,牺牲收入在所不惜。
人工智能成广告审核“秘密武器”
据了解,试图利用百度搜索平台的虚假、违法广告,一部分来源于资质合规的企业提交的非法广告内容,另一部分则是由不法分子通过灰色产业链生成,主要表现为假冒官网、形声字、变声词等广告内容。针对此现状,百度搜索广告平台有一套严格的审核和风险控制系统,出现在搜索结果中的每一条广告,均需经过“广告主身份资质审核系统、广告内容审核系统、广告展示实时巡查系统和风险广告应急排查系统”四大风控系统层层过滤。而值得一提的是,因为百度人工智能技术的全面引入,上述风控系统的效率和速度,在2016年均发生了质的飞跃。
目前,依靠“百度大脑”的深度学习技术,包括OCR(文字识别)及图像识别、百度大脑AI算法等领先技术均成功应用在百度搜索广告审核现场,这保证百度得以平均每天完成审核38亿条广告内容,并从中最多每天可成功清理出超过2000万条违规广告内容。而以对广告主身份审核为例,百度利用领先的OCR技术及图像识别技术,可实现目前日均审核3000+广告主(包括企业各类营业资质及身份证信息等),拒绝率超过50%。
此外,针对百度搜索平台上的广告内容,百度实行24小时乘7天的严格巡查,建立“系统+人工前置审查+人工上线后巡查”三关审核机制,对所有商业广告从事前、事中、事后三个层面进行规范管理和保障,形成了一整套行之有效的管理机制。
百度业务监察部门负责人表示,虚假信息和广告,正在成为各个互联网平台共同的顽疾和破坏者,仅仅依靠百度等平台方在线上打假的方式,难以根除虚假违法广告的源头,这就导致不法分子“花样百出打而不绝且越打越多”。因此,借助百度内部多个部门联动并积极引入外部第三方权威机构一同合作,同时将百度领先的人工智能技术全面应用在广告审核的每一个环节,通过提升准入门槛和提高审核技术构筑防坚固火墙,才能借助“完善规则和提升技术”,最终实现百度搜索平台的规范。