据近日美国斯坦福大学一份报告显示,2020年,中国在学术期刊上有关AI的论文引用率占比为20.7%,美国为19.8%,这是中国首次超过美国。一时间“AI”再次进入公众视野,引起热议。
对于普罗大众而言,AI似乎还只是科幻电影的创作素材,AI工程师作为一份职业更是远不为大众所知。但实际上AI早已与现实生活融为一体。
尤其是疫情爆发以来,AI在金融科技、智能客服、城市治理、医疗问诊等多个领域所展现出的高效服务能力令人惊叹不已 。
乐信自2016年起全面发力人工智能,打造了“灵犀”AI智能运营平台、“鹰眼”智能风控引擎、“虫洞”小微金融资产处理技术平台等技术平台,将AI全面用于获客、风控、运营业务全链条,极大提升运营效率,降低平台风险。
乐信3位年轻AI工程师专家将通过讲述他们的工作日常,为我们掀开AI世界的真实一角。
Tim是乐信AI团队骨干,痴迷于研究基于AI技术构建的风控模型工具。
2008年,他从国防科技大学毕业,只身赴美纽约大学继续攻读通信和电子专业,随后进入当地一家金融公司。
2013年回国,辗转金蝶、OPPO金融多家公司后,于2017年加入乐信。从开发领域到数据领域,最终将重心落在如今的AI领域,Tim认为这是他的心中所爱。
Tim的工作是利用AI建模技术解决风控领域中用户资质识别难题。通常情况下,AI工程师能够拿到两种数据,一种是用户的特征,如年龄、学历、收入等,另一种是用户的标签,如历史上是否有过逾期行为等。
根据这些特征参数,可以进行模型训练生成风控工具,从而辅助预测一个新用户的资质优劣。这种建模的过程,被称之为机器学习,也可以称为“监督型机器学习”。
Tim习惯于将AI建模的过程比喻成烹制一道美食。一道美食的诞生,往往是从购买食材到择洗食材,从烹饪美食到品尝美食,直至最终端上餐桌。
而一个辅助风控子模型的诞生,也是如此——数据积累-数据清洗-特征工程-模型训练-模型评估-模型应用。
由此可见,数据是模型热切期盼的“食材”,数据越丰富,AI越喜欢,数据的采集、挑选、清洗、加工是构建模型的基础。
但如今,数据大爆炸的同时,监管部门对数据挖掘和使用的管理也更为严格规范,用户数据隐私保护力度大大加强,数据使用成本越来越高、风险越来越大。用惯了“大数据”的AI工程师,要适应在“小数据”环境下生存,这对Tim们的日常工作构成了不小的挑战。
“我们公司对数据的获取和使用一直都有严格限制,遵循最小化原则,这就要求在数据挖掘和使用方面下更多的工夫,让有限的数据产生最大化价值。”Tim说,就好比做饭,烹饪界公认的最考验厨艺的一道饭是蛋炒饭。
目前,乐信公司层面也在大力推进隐私计算,希望通过联邦学习、联合建模的方式,打破数据孤岛,既充分利用行业积累的用户数据,又避免用户隐私信息泄露,一石二鸟。
Tim介绍,目前,乐信已与主流数据厂商开展联邦学习联合建模工作,用于在获客、授信、回捞等场景,模型效果在原有基础上提升15%-20%。
AI领域坊间流传有这样一句话:“数据和特征决定机器学习的上限。”换言之,和数据一样,特征工程也是建模流程中的核心环节。特征工程应用了数学、统计学、信息论、计算机科学、行为经济学等理论指标,但更重要的是AI建模团队对核心业务的理解。
“不同业务的模型对特征的需求很不一样,“拿‘用户下单时间’来说,有秒数、小时数、日期、年份四个特征,哪个特征对风控模型作用更大?这就取决于我们对风控业务的理解。”Tim说。
Tim现在每周至少游泳4次,他解释说,团队很多小伙伴都有健身的习惯。
“风险控制是对乐信这样的公司,以及我们AI团队所有小伙伴的核心要求,甚至内化为潜意识或者说本能,这种本能确实会影响到我的生活习惯,就是要学会控制健康风险。”
在Tim等模型人员和风控团队不懈努力下,乐信平台风险表现稳定向好。财报显示,截至今年1季度末,乐信平台90天以上的逾期率为1.84%,新增借款的FPD30已经连续8个月保持在1%以下。
目前乐信1天以上的逾期率为4.92%,比去年同期8.08%降低40%;最新坏账回收实现回收率和回款金额创历史新高,历史不良资产回收率比去年同期提高30%。
一端是亿万情况各异的消费者,希望通过分期付款购买形形色色的商品,另一端是上百家偏好不一的金融机构,希望把为合适的消费者提供金融服务。
居中的平台如何“穿针引线”,实现用户体验和银行偏好的高效满足?对于这一存在无数变量的系统性复杂难题,乐信AI工程师Juana一直孜孜不倦地试图用AI寻求最优解。
2006年,Juana进入中国科学技术大学计算机专业就读,本科毕业后她选择了保送本校硕博连读,于2016年拿到博士学位。
近10个春秋,Juana在实验和数据的“森林”里徒步,这场苦旅似乎让她变得不苟言笑、谨言慎行,但却塑造起她对于数据的敏感、细心,对于技术的严谨、理性。
2018年进入乐信后,实验室文化熏陶下的务实逻辑,成为她带领团队利用AI技术破解数据风控、反欺诈、资金资产匹配等难题的主要思维。
2017年,棋风灵活多变的围棋天才柯洁因0比3落败给机器人AlphaGo而泪洒赛场,让人感受到人工智能的实力。
“AlphaGo每一次落子,都依赖于大量的决策机制,或者说背后有一个‘奖励函数’,它可以计算出在当下状态采取何种措施可获得何种结果,通过对比结果的优劣,AlphaGo就能明白下一步该如何决策。”Juana说。
乐信的资金资产匹配系统“虫洞”和AlphaGo类似。“资金资产的环境在不断地发生变化,比如现金流、资方额度、资产质量、风险状态等等,我们需要就这些复杂的资金资产环境,通过权衡制定‘奖励函数’,‘虫洞’按照函数结果的优劣,依次进行匹配,从而提高资金资产匹配的效率和质量,提升经营利润率。”Juana说。
不同于风控、推荐等有监督学习,资金资产匹配更偏向于强化学习,没有特征和标签可用,可以说难度更高、挑战更大。
而且,资金资产匹配,失之毫厘则差之千里,与公司利润率直接挂钩,这份无形的重担让Juana面临着更高的挑战。
最让Juana忐忑不安的时刻,往往是优化模型上线的当天。资金资产匹配系统需要在线优化应用,无法离线模拟空跑,也就是说,在优化模型上线前,Juana只有一个预估的概率值,数据有没有更好?优化有没有实际效果?上线当天等待优化模型实际应用结果产生的过程,往往让Juana压力陡增。
“AI工程师没有光环,只不过还不为大家所熟知。我也会因为沉浸在工作里太久,而感到身体吃不消、思路钻牛角尖,每当这个时候,我都会选择周末去爬山、去徒步,今年的目标是打卡‘深圳十峰’,经验告诉我,在身心放松的时候,思路往往可以打开,这种业余爱好帮助我渡过不少难关。”Juana说。
值得一提的是,就在今年2季度,Juana带领项目组通过自动风险阈值控制、动态参数调整、精细化利润分层等多目标模型组建,在高效满足用户体验和金融机构偏好的基础上,实现匹配利润率相对原有算法提升19个BP。
“Hey,好久不见,甚是想念,小乐有什么能帮到您呢?”
“您客气了,这是小乐应该做的,有啥问题可尽管问哦。”
“亲,非常理解您的心情,您先消消气,小乐会尽力帮您的~”
在乐信旗下分期消费品牌分期乐APP,点击咨询AI智能客服小乐,它会主动友好地跟用户打招呼,不仅会耐心解答用户的各种疑问,如果小乐发现用户情绪有变化,还会积极表达感谢或者进行安抚,从而让用户享受到最佳的使用体验。如此聪明可爱的AI智能客服机器人,自然离不开AI工程师的“调教”。
Young是小乐背后的“导师”。在电子科技大学读本科和硕士研究生期间,Young攻读电子信息工程和金融学专业,并从大三开始跟随导师在实验室里埋头研究机器学习和自然语言处理。
毕业后,无论是在微众银行、OPPO金融,还是在如今的乐信,Young一直在吸收各项前沿技术,让机器读懂人的语言和喜怒哀乐。
“一个AI智能客服机器人的诞生,肯定不是一蹴而就的,必须深植于具体某个场景,从0到1逐渐生长。
”Young说,最初肯定需要业务侧制定一系列高频的基本的标准问答,小乐所做的核心工作,就是进行语义匹配,即初步能够读懂用户在说什么,然后从标准问答库里为用户找到答案。
“语义匹配”看似简单,但实际上非常复杂。因为人类自然语言被公认为是最灵活的符号,不仅有各种同义词、近义词,同样一句话,不同的场合、不同的语气、不同的表情表达的意思往往大不相同,比如“你可真棒”配上瘪嘴的表情和配上点赞的表情,其意思可能完全相反。
完成语义匹配的过程并不轻松。“首先需要在前端收集大量的用户行为数据,并进行‘数据清洗过滤’,得到高质量的数据素材,然后去标注、聚合一些相似的词句,比如“有多重”和“质量是多少”,‘我的订单何时发货?’和‘几天可以收到货?’等等。
”Young透露,基于高质量数据,AI工程师会去制定各种执行方案,搭建多个算法模型去试错、去融合,根据最终的指标好坏,选出最合适的算法模型,最后落地形成“小乐”的雏形。
AI智能客服机器人产品的开发不是一劳永逸的。“刚开发出的‘小乐’智商相当于三四岁的幼儿,如果你想让它变得越来越聪明,要把高质量数据不断‘喂’给它吃,不断动态调整参数、优化算法。
”Young说,比如小乐遇到一个以前没遇到过的句式,AI工程师便会帮助它做判断,并动态调整参数,以后再遇到这类的句式,小乐便能自主进行应对决策。
在Young看来,完成语义匹配功能只是小乐智能升级的“万里长征第一步”,现阶段乐信正在持续为小乐注入新的能力,比如自然语言理解、知识图谱组建、多轮对话能力等,接下来的小乐,将储备更多的知识,以及具备简单的逻辑推理功能,能够和用户完成多轮有逻辑和深度服务的对话能力,大幅度提高用户消费体验。
作为一名青年AI工程师,Young像一块海绵在不停地吸收行业前沿知识。
“我在大学读书的时候,自然语言处理的‘word2vec’算法还十分先进,但过上一两年,这个算法就非常普遍了,再过两年,又有BERT等学习能力更强的算法出来。
”Young说,AI技术发展更迭、量变质变周期均要快于其他行业,需要持续不断地去跟踪前沿论文,及时吸收新理论新方法,如此才能在行业保有竞争力。
雷锋网雷锋网