中新网杭州12月22日电(赵小燕胡亦心)拄着双拐的笑舒(阿里花名)来自湖北孝感,他是架设打假大数据拦截网的阿里巴巴工程师之一。“我在阿里打假不是做‘判官’,而是利用机器学习、做数据模型过滤负向商品和商家,排除潜在风险。”每当有人问他在阿里做什么,笑舒总要把上面的话大致重复一遍。
在笑舒和同事们的努力下,他们研发的打假大数据模型每天对整个阿里平台近20亿件商品进行扫描,找出疑似售假商家做出处理,协助执法部门进行查处。2017年的前11个月里,他们协助执法机关破获制售假案件674个。
大数据锻造世上“仅有”的打假模型
与一般人不同的是,笑舒一岁时被确诊患有小儿麻痹症,左腿相比常人瘦弱一圈。在屏幕上,笑舒能让代码飞奔,而在现实生活中,他只能靠双拐缓慢向前。
笑舒该如何生存下去?一度让在湖北孝感务农的父母感到忧虑。最终,父母决定送笑舒上学。“‘只要你肯学,我就供你读。’这是母亲跟我说过最重的一句话。”笑舒回忆,从初中到高中,父亲每天骑着三轮车接送他上下学。
父母的艰辛和支持让笑舒不敢有丝毫懈怠,因为技术过硬,他最终经过校招面试,成为一名阿里巴巴数据工程师。
大家不懂什么是打假模型,笑舒并不觉得奇怪。因为他和同事们所做的,就是探索一套世界上绝无仅有的假货风控体系――面对近20亿量级的商品,上千万卖家,数以亿计的订单。
“这种模型,世界上之前没有过。从业界来看,一般利用机器学习做的都是正向模型居多,像营销、推广。但我们做的是负向模型,且是信息量庞大,维度众多的场景。”笑舒说,从他开始研发打假模型便面临众多压力与挑战:打假模型判断不准,出问题他和伙伴们要负责。
一次有商家被投诉售假,但从信息层面看不出其是否售卖过假货,这时受理投诉的同事调用笑舒研发的假货模型进行甄别,结果模型判断售假嫌疑极大。
而多次抽检后显示,该商家售卖的是正品,这曾使笑舒的打假模型备受质疑。
这事之后,笑舒和团队深入分析了原因,发现是作为机器学习的原料――种子数据特征的覆盖面不够。在调整了数据样本、特征和模型后,同类商品的售假判断准确性得到极大提高,得到调用部门的认可。
好刀都是磨砺出来的。经历了众多挑战后,如今,笑舒和同事们研发的大数据打假模型已应用在神秘抽检、疑似售假商家入驻拦截、售假线索挖掘分析等阿里巴巴平台治理部众多的假货风控场景中。
用打假模型营造“无假”的贸易环境
据《2016年阿里巴巴平台治理年报》显示,从2016年1月至2016年12月,阿里巴巴协助警方抓获犯罪嫌疑人880名;捣毁涉假窝点1419个;破获案件涉案总金额超30亿元。在品牌合方面,这一年阿里巴巴主动拦截删除的商品量是同期权利人投诉删除商品量的26倍。
笑舒表示,以前他和同事会根据不同的场景、商品数据设计打假模型。这些模型经过一段时间的调试和发育,上线初期命中率很高。然而,众多售假团伙会试探打假模型的能力,进而让假货信息、售假者身份“变异”来绕过监管。
虽然能从信息层面消灭假货,但笑舒和同事清楚,线下的假货并不会凭空蒸发。更加严峻的问题,不少线下制假团伙并没有得到应有的惩罚,这就导致平台面对的假货威 胁一直严峻。
“当前打假就像个筛子,刑事判决处罚过低,不足以震慑利润丰厚的制假售假产业链。”据阿里巴巴首席平台治理官郑俊芳介绍,2016年阿里巴巴平台治理部共排查出4495个销售额远大于起刑点(5万元)的制售假线索,而通过公开信息能够确认已经有刑事判决结果的仅33例,缓刑比率近80%。
因此,在今年两会期间,马云致信两会代表委员,呼吁“像抓酒驾一样治理假货”,引起全社会强烈反响。
“‘像抓酒驾一样治理假货’最终目的是让售假者得到应有处罚,减少社会上的假货。”笑舒表示,我们团队最大的KPI(绩效指标)应该就是利用打假模型,为全社会营造出‘无假’的贸易环境。
说起即将到来的2018年,笑舒最大的心愿是父母平安健康,天下没有假货。(完)