数据,已经成为土地、劳动力、资本、技术之后的第五种生产要素。它是21世纪的“钻石矿”,也是新时代的石油。
Statista报告显示,2020年全球大数据市场收入规模接近600亿美元,预期增速将达到14%。IDC数据显示,2020年,全球创造了59.0ZB的数据,其中50.4%的数据需要保护。
隐私计算因其保护数据隐私、消除数据孤岛、弥合信任鸿沟、释放数据市场巨大潜力等诸多层面的特性,成为一道通往数字时代的传送门。
2019年之前,隐私计算只是少数派的自娱自乐,2021年,入场的企业飙升至几百家。
互联网巨头、金融机构、区块链企业、初创型科技企业、数据安全企业,不同属性的玩家纷纷入局。
原本小众的市场一下子成为了香饽饽。一时间,隐私计算赛道热闹非凡、高手如云。
2020年,“隐私计算元年”来临。
WeLab汇立集团,就是那个“少数派”。旗下的天冕科技早在2017年就认识到隐私计算价值,在风口来临之前,已经开始产品研发、手持多项专利,成为众多科创企业中最早布局隐私计算赛道的公司之一。截至2021年3月,WeLab融资规模已超42亿元。
这家企业为何能跑得早、跑得快?
第三次互联网大浪潮中,PC互联网到移动互联网,互联网出现井喷式发展。
社交、团购、打车、金融......似乎一切皆可互联网化,新概念、新平台层出不穷。
长久以来,互联网平台和用户之间似乎达成某种共识:
享受免费服务,就应该提供数据。
但这种共识,隐藏着隐私安全、信息泄露的风险。
WeLab隐隐感觉到,隐私安全和数据安全会成为隐患。
“尤其是金融行业,如何在取得有效信息的前提下保护这些数据,是我们担心的。”WeLab汇立集团首席研发官吴焕明说道。
但彼时,互联网行业沉浸在狂欢中,隐私安全被推搡到墙角;国家层面也缺乏相应的政策和制度。
也就是自那时,WeLab开始关注数据安全和隐私安全,并进行早期思考和技术探索,其旗下的天冕科技是这条道路上主力军。
在线支付让“互联网金融”成为充满想象力,在运用互联网大数据解决金融风控问题的同时,如何充分保护用户隐私,当时业内并没有技术层面的解决方案。
“现在大部分采用的是密码学,之前密码学通常的直接用法是保护数据,而很少有把保护数据和利用数据两件事放在一起考虑。”
直到2017年9月,吴焕明参加清华大学举办的金融科技大会,中国科学院院士、清华大学交叉信息研究院院长姚期智提出,当下中国金融科技发展面临的挑战,最主要的是信任问题,而信任问题的核心又在于,金融风控、隐私保护、政府监管三方面如何平衡。关于如何解决信任问题,姚期智提到了用密码学解决金融科技问题,通过多方安全计算保护隐私。
“我当时就非常受启发,回来就去着手研究。”
找到方向后,吴焕明团队迅速开始了对多方安全计算以及相关的隐私计算的研究。
在这之后,他们经历了漫长的行业拓荒期,其中就包括技术和产业之间存在的巨大沟壑。
“技术层面,有论文,有算法,有代码,但这些属于科学家,而不是产业界。”吴焕明表示,产业和科学家相互理解并不容易,双方需要强的技术或行业背景知识,代码真正跑起来,门槛很高。
没有前人可以指引,没有路径可以依赖,在那段道路泥泞的日子里,WeLab始终没有放弃对隐私计算的探索。
好在,苦心人天不负,他们还真捣鼓出了东西。
2018年1月,天冕发明了“欺诈检测和风险评估方法、系统、设备及存储介质”的评估方法。
这项边缘计算技术,凿开了隐私计算的一道口子,也是天冕在隐私计算上的第一个专利。
从这个专利开始,天冕展开了对隐私计算技术的深入探索,其衍生的产品亦一直坚持自主研发。2019年,隐私计算的技术落地在天冕科技内部正式立项。
研发是科技企业的生命线,摸索出路径的WeLab开始毫不犹豫地投入大量资源。2019年,WeLab全面上线了高维向量检索——ANN算法,运用这一算法可更高效地检测欺诈行为,并且摆脱了常规欺诈检测算法需要直接访问大量用户数据的问题,保护了用户隐私。
2019年底,WeLab汇立集团创始人及CEO龙沛智发布了2020年三大战略,隐私计算不仅是WeLab集团的三大战略目标之一,也是集团创新研究中心的研发重点,天冕科技更是投入了50%研发人员在隐私计算上。
据悉,天冕在隐私计算方面已经积累了十余项专利。目前合作伙伴已突破700家
谈到护城河,吴焕明回答:
其实我不是特别想用护城河这个词,现阶段的目标不是攻打、围猎,我希望开放和共同进步。
我们的态度是,包括金融在内的其他行业都开始使用这项技术,当行业起来了,我们再来谈竞争。
市场如此火热,行业为何“没起来”?
隐私计算技术发明的初衷,是参与者的隐私安全和数据安全。随着技术发展,隐私计算的功能发生了扩容。
技术层面,隐私计算流派众多,其中联邦学习是隐私计算的后起之秀。
通俗来说,深度学习时代,每个AI企业的技术能力是单打独斗式的;而联邦学习的出现,更为紧密、安全地将各个AI企业联系在了一起,让参与各方在不披露底层数据的前提下共建模型,之后利用整个数据联邦内的数据资源,共同成长、获利。
这意味着隐私计算未来将不仅是一个IT系统,还是一个应用平台。
两者的区别在于:前者最终价值是帮助使用方节省成本,后者则是提升业务,增加收入。
以电商平台为例,淘宝出现之前,小作坊交易,信息不对称,交易成本高,淘宝之后,搭建销售渠道、物流网络、支付体系,让交易效率大幅提升。
同理,如果有个数据交易平台,就可以让数据拥有方以低成本变现数据,使用方以低成本获得更全面的数据。
吴焕明提到,即使是用户数很少的小微企业,其数据在整个社会闭环里中也具备价值。
“以前需要付出大量的时间和经济成本才能积累一定用户和用户数据,现在一个只有几个人的创业公司就有机会获得全社会的数据,这在以前不可能实现。”
隐私计算的目的,就是在保护数据安全性、隐私性的前提下,让市场可以更放心地分享数据,各方获利,最大限度地支持基于数据驱动的科学研究及商业活动。这也是WeLab大力发展隐私计算的目的。
如果上述商业模式能实现,无论是带来的效益提升,还是在此基础上的创新,都将难以估量。
但这个令人振奋的场景到来之前,有一段漫长的道路。
吴焕明认为,目前隐私计算最大的矛盾是信任。
“有个区块链专家跟我说过,区块链最难的不是技术,而是人心,其技术本身不复杂,结果也非常可信,但最终要解决的问题是人的信任。”吴焕明坦言,这也是隐私计算的问题。
说白了,市场了解和认可程度不足,没有看到隐私计算可以扩大数据可达范围,降低数据利用成本,提高数据变现能力。
战略保证方向,开放共赢做大蛋糕,这是隐私计算发展的外在要求,也是WeLab的内在修养。
为此2021年9月23日,WeLab汇立集团以共生·共享·共创为主题举办首届技术开放日活动,宣布了天冕联邦学习平台将会开源。
“我们计划把隐私计算的相关技术全部开放,但可能要分阶段,首先从联邦学习平台开始。”
WeLab通过开源,让各方可以针对不同的应用场景、技术手段往各自需要的方向进行改进,这将极大提高隐私计算各环节的技术发展效率,使整个生态链更加完善。
吴焕明笑着说,“你可以选择把某个东西包装得高大上,让少数人拥有,获取高利润,但我们更想跟行业一起努力,垄断者、独裁者,对于隐私计算的发展是不靠谱的。”
WeLab中国区总裁潘叡表示,“集团成立八年多的时间,能从单一的品牌发展至为全球三大市场提供金融科技服务的多元化集团,并在中国内地、中国香港及印尼处于领先的地位,是集团一直坚持技术创新战略的成果。”
事实上,作为一个涵盖了智能金融全链路的集团,WeLab具备强大的技术研发实力和技术基础,在围绕To B输出技术时,他们既是时代的参与者,也是引导者。
在这个过程中,除了技术基石打造、技术能力输出,WeLab更是在不遗余力地进行市场教育。
WeLab通过各种方式推广,比如将技术上传到阿里云、华为云、腾讯云等公有云,让行业了解、试用。
WeLab认为,技术再好,没人用就没价值。只有尝试了,才能知道对自身是不是有实际价值。
吴焕明坚信那一天会到来,“从前银行开户一定要去柜台,没有远程这回事,当时的人会相信远程是真的吗?但现在不一样了,登陆银行人脸识别就可以了。”
吴焕明坦然道,这个市场足够大,能够容纳下不同类型的竞争对手。
天冕科技的优势在于起步早,积累大量技术专利;有成熟的产品,不局限于联邦学习;依托于汇立集团,产品均在在内部实际场景中得到验证。
在开源必然趋势下,最后比拼的是产品和服务。WeLab有这个自信,也有这个耐心。
WeLab创新研究中心用短短几个月的时间完成了联邦学习平台从0到1的突破,搭建了从任务管理、在线推理、操控中心、算法库与联邦基础于一身的学习平台。
吴焕明指出,除了WeLab在联邦学习平台上投入坚决外,单纯从联邦学习技术可能各家大同小异,但天冕的产品都经过集团内部和上下游合作伙伴的验证,无需花费太多精力就可启动。
“但是我想强调,几个月做出来的东西并不意味非常完善和完整,我可能花了4个月让平台跑起来,但是我花了1年让平台做得更好。”吴焕明表示。
在这份严谨与务实中,易用性,是WeLab汇立集团的隐私计算的重中之重。
“不同企业侧重点不同,有的在技术上投入多,追求算法更快、效率更高、安全强度更大、应用场景更多等等,我们最注重好用。”吴焕明坦白道,WeLab的目标是打造最好用的隐私计算产品。
在WeLab看来,好用体现在门槛低、成本低。
如何降低门槛?
WeLab将具化成,“我们前面走过的路,不要让其他人去走一遍、理解一遍才能用。”
要实现这一点并不容易。除了技术能力,还有工程化能力、产品化能力等等。
从技术层面,以计算框架中的计算引擎为例,市面上现有的联邦学习产品,大部分集成的是计算引擎Apache Spark,这是一款专为大规模数据处理而设计的快速通用的计算引擎,可为建模过程中提供高效的运算。但是部署一套Spark集群,相对耗时、耗力,且大多使用云服务器,联邦成本较高。
天冕联邦学习平台开发计算框架——函数计算,重点是轻量级、一键部署。
用户可以在Spark集群的基础上,选择函数计算,从而实现弹性计算,动态扩展资源,节省成本,提高效率的目的。这也成为WeLab的业界首创技术。
在服务层面,他们深入产品的每个环节。如了解建模人员使用建模工具的习惯,挖掘用户对接触产品后的使用思维。
“我们内部建模人员觉得不好的地方我们都会改,虽然联邦学习的核心技术,但流程打磨、应用性,好与不好的差别非常大。”
WeLab内化了这些实际应用中细碎的问题,创造了诸如“开包即用”的功能,让用户可以可视化操作,无需过多学习成本。
如何降低成本?
与大多数隐私计算厂商宣传的算法数据不同,天冕科技并不强调算法突出性,而是算法实用性,采用在实践中被验证过的,最合适的算法。
“有些算法看起来酷炫,不仅让产品价格不便宜,而且在实战中要么用不得上要么不好用。”
在优化隐私计算性能上,途径极其多样。有人用加速卡和专用芯片,性能可以提升,但成本也更高。优先采用GPU加速,在保证效果前提下,成本更低。
这些都让天冕的隐私计算产品,性价比极高。
多年来,WeLab踏实地深入业务边边角角,这份务实得到的回报是,天冕联邦学习平台在某头部金融企业落地案例中,在建模训练3周后,模型KS提升17%,营销转化率提升20%,ROI提升18%。
目前,WeLab汇立集团已经进入了中国内地、中国香港、印尼三大市场,业务涵盖数字银行、纯线上贷款、分期电商、电子支付、融资租赁及金融科技输出等多个业务,为超过700家企业提供服务,并拥有近5000万用户。
现阶段集团业务以C端为主,而B端业务连续几年实现100%的增长,实现B端、C端双驱动。
当雷锋网问到他们从传统金融业身上学习到什么时,潘叡回答:
“技术的核心永远是创新,金融的核心永远是风险,你永远要对风险保持一定的敬畏,因为你守护的是资金的安全。”
秉持这一初心,在浮躁的市场,它以行业发展为先,坚持不盲目竞争。
摔过跤,淌过泥巴,依然保持一份务实与沉静,一根筋地去实现客户体验这一核心价值。
或许在万马齐发的隐私计算市场,这些企业的光芒被对手的推广营销声浪掩盖,但在体验至上的时代,唯精准的智能服务制胜,方能行稳致远。雷锋网雷锋网雷锋网