没人报案，那就让数据自己报案吧

支付宝

作者：木子

2020/05/14 13:56

从SIGIR2020到IJCAI2020，随着国际一系列顶级学术会议（顶会）的陆续开启，全球科学家们已经迎来了2020年属于自己的一道道“盛筵”。这些不同科技领域内的顶级会议是前沿，更是未来。
逛顶会，聊技术，本周实验室小编就来说说顶会中的那些科学家的故事。

营销活动是电商平台最常见的业务模式，而针对平台营销活动主要的攻击方式，就是通过虚假交易套利。简单地说，就是卖家和买家合谋，通过作弊，骗取平台的“红包”。

这和风控领域中的其他风险有很大的不同。类似盗用账号、欺诈等风险，都因为第三方受害者的投诉或报案，可以产生明确的风险标签。它意味着，平台很快可以知道，一项交易违规与否，并做出反应。而合谋欺诈不会有人报案，也就不可能产生标签。

平台当然绝不允许这种合谋欺诈的存在，但这绝非易事。在相当程度上，科学家们需要让案件在海量交易中“无中生有”——既然没人报案，那就让数据自己“报案”好了。

过去，人们是要从一群穿蓝色外衣的人中，找到一个穿黄色衣服的人——那意味着一个有标签的风险；而现在，人们是要从一群都穿蓝色服装的人群中，找到一个外衣下藏有匕首的人。

从机器人足球，到概率图模型

要在每天上亿笔交易里准确找出这种风险，并大幅提升风险攻防效率以满足实际业务需要，是一件非常有挑战性的事情。

这里的关键之处在于，支付宝特有的数据量为研究提供了基础；而庞大的业务量，又让这种研究有了“性价比”。

解决这个问题的工作交到了支付宝天筭安全实验室手里。

支付宝天筭安全实验室隶属于支付宝安全实验室。该实验室主要围绕智能风控和反欺诈技术，探索安全领域的机器学习等前沿问题，重点关注打造全球领先的智能风控体系，是守护支付宝“你敢付我敢赔”承诺的中坚力量。

因为没有标签，“我们不能用常规的分类，去解决这样的问题”。刘腾飞希望把它变成一个机器学习的问题，并找到一种方法，来实现低成本、高效率的检测。

没人报案，那就让数据自己报案吧

刘腾飞是蚂蚁金服数据技术专家，香港科技大学计算机科学与工程学系博士，主要研究无监督异常检测技术、弱监督学习技术在风控领域的应用。

高考后，因为第一年不分专业的原因，刘腾飞选择了中国科技大学。按他的思路，这样就避免了在对自己的兴趣点仍然懵懂的情况下，“过早”规划未来的职业方向。

在那一年里，刘腾飞发现了物理、化学的“恐怖”之处，而自己对芯片设计和通讯那些学科又提不起兴趣，直到听到一位老师对算法概念的描述，他才动了选择计算机系的念头。那位老师告诉他，算法就是解决问题的方法。

在AI科研领域，机器人世界杯（Robot World Cup）是一项重要的赛事，它有一个宏大的目标，是在人类足球规则下，用机器人在2050年战胜人类的足球世界杯冠军。

选中计算机专业后，刘腾飞一头扎了进去。

仿真比赛是机器人足球比赛中“最古老”的比赛项目，它专注于人工智能和团队策略的应用。这个赛事分2个组别：2D和3D。

刘腾飞所在的中国科大蓝鹰队在2007年拿下了2D仿真组的全国冠军，之后在2008年时，点球负于德国队，拿到了世界亚军。

因为长期沉湎于“足球”，刘腾飞连留学申请都没有准备，这在中国科大的学生里，并不多见。于是老师把他推荐去了香港科技大学念博士。在那段时间里，他学习的领域是概率图模型。

概率图模型是一类用图形模式表达基于概率相关关系的模型的总称。近10年，它已成为不确定性推理的研究热点，在人工智能、机器学习和计算机视觉等领域有广阔的应用前景。

但这和刘腾飞在支付宝天筭安全实验室遇到的风险课题并不直接相关，他和他的同事们要解决的问题都是新的，因此方法也必须是新的——唯一没变的，就是对技术的创新——刘腾飞兴趣满满。

让数据自己找到“匕首”

好消息是，那些同样身穿蓝衣，但是怀揣匕首的人，仍可能表现得异乎常人。例如衣服局部的外形变化，走路的姿态变化……从数据中找出这些风险交易，最直接的做法是通过异常检测，利用这些异乎寻常的蛛丝马迹，来找到比较确定的标签。

不过这种标签在海量交易数据里仍只能覆盖有限的部分，这就引出了另外一个问题——标签不完全。

在实际业务中，这类标签问题对应的风控场景是广泛的，远不止于一个“买卖双方合谋”的问题。正是因为这个原因，不止刘腾飞想找到解决方法，支付宝安全实验室和学界都对此兴趣盎然，这也是此后安全科研基金乐于介入的原因。

弱监督学习是一个对应的解决手段。它和有监督学习、无监督学习都是机器学习方法的主要分类，依据是看算法有无利用以及如何利用训练数据中的标签信息。弱监督学习类算法可以解决标签不准确、标签不完全和标签不确切的问题。

正样本和无标签样本学习（PU learning）正是属于弱监督学习中的一类算法。它从只有正样本和无标签样本的训练数据中学习得到一个二分类模型，这里的无标签样本可能是正样本，也可能是负样本——这个正、负样本，在支付宝等平台的真实业务场景里，就对应了风险的存在与否。

也是因为这个原因，正类和无标记类别学习（PU learning）适用于众多的风控场景——刘腾飞能找到了那只带来风险的“匕首”，依靠的就是它。

不过，它和真实的场景仍有差距。

“自古以来”，传统的正类和无标记类别学习（PU learning）在解决问题时，数据都已经放在了科学家的手里，是囊中之物。

但在线交易不是这样，所有的数据像流水一样持续涌入。到诸如双十一时，这种涌入更将有如一道数据洪峰。

道高一丈

刘腾飞联合署名的那篇论文——由支付宝天筭安全实验室联合南京理工大学完成的《Online Positive and Unlabeled Learning》，能够成功被 IJCAI-2020接收，很重要的一个原因，就是它有效地处理了这种流式数据，实现了在线更新模型，提升模型迭代速度的目的。

这篇论文的合作背景源于蚂蚁金服的安全科研基金，它是一个蚂蚁金服为促进产业界和学界交流的平台项目。

国际人工智能联合会议（IJCAI）是人工智能领域最顶尖的综合性学术会议之一，被中国计算机学会（CCF）推荐国际学术会议列表认定为 A 类会议。会议议题涵盖了自然语言处理、机器学习、人工智能理论、计算机视觉、语音技术、机器人科学等领域。

在这篇论文中，包括刘腾飞在内的专家们提出了一种基于正类和无标记类别学习（PU Learning）以及在线学习（Online Learning）的新算法。

对于流式数据中的每个正例或者无标记样本，新算法分别设计无偏损失项，以构建基于流式数据的经验风险最小化模型，通过计算其无偏梯度，算法给出了基于在线梯度下降的分类模型更新迭代的方法。新算法在标准数据集和真实数据集上均取得了较好的效果。

这个“较好”的效果意味着，“更快的模型更新速度，将可以大幅缩短风险的暴露期。”刘腾飞说，支付宝希望风控能够更快、更智能，而新算法在细分业务领域实现了这一点。“魔高一尺，道高一丈”。

在过去一年中，支付宝的商家风控系统ARiskGo为“大润发优鲜”“饿了么”等累计1万APP节省300亿营销费用，并获得中国支付清算协会年度“安全应用”大奖。它的能力中，就有支付宝天筭安全实验室里刘腾飞和他同事们的那些研究成果。

这个系统赋能了产业界，解决了职业羊毛党薅光羊毛、消费者薅不到真羊毛的问题。

刘腾飞说，他当年衷爱的机器人足球世界杯，有一个目标，那就是2050年时，机器人足球队要战胜人类世界杯冠军，这个目标就像登月，宏大、长远，前路漫漫，却总让人心怀喜悦为之努力，一如他与支付宝天筭安全实验室的同事，在安全科技的路上涉海登山、步上月亮。

雷锋网雷锋网