“智能保顾产品的本质实际上是智能化的客户运营工具。” 在众安保险数据智能中心负责人孙谷飞看来,这也是众安的明星产品——众安精灵不断丰富与用户的交互形式的动力所在。
在他看来,客户运营是一个高度依赖创意和个性化的工作,因此,一款好的客户运营产品需要满足以下两个基本条件:首先,要能充分支持运营人员的创意表现,能够快速地实现他们的想法;其次,要能够连接用户与企业能够提供的服务,为客户带来价值。
与客户进行一问一答的拟人化互动聊天中,运营工具不仅要扮演“有问必答”和“你说的它都懂”的知心朋友,还要承担“保险经纪人”和“风险管理专家”的角色。
而在智能科技时代背景下,这些需求的实现都离不开产品工具背后的机器人平台的支持,以及对科技赋能保险业务逻辑的深度思考。
“目前市面上智能保顾产品相关的机器人平台主要聚焦在对话式服务定制功能,背后又可以分为自然语言理解引擎和流程引擎两大核心部分。”孙谷飞表示。
在自然语言理解引擎方面,需要基于在线客服历史记录语料定制训练的语义理解、实体提取模型可以精准识别保险和健康场景下的客户意图,提取出客户对话中提到的年龄、地点、产品、疾病等关键信息,确保了用户需求的理解。
“而在流程引擎层面,机器人平台的流程引擎需要充分保障客户运营人员能够发挥他们的创意。”在孙谷飞看来,在这样的流程引擎下,运营人员可以将自己的客户引导思路与自然语言理解引擎提取到的信息相结合,配合不同的条件跳转设置,能够轻松实现个性化的客户服务,配置要简单到业务人员能够直接参与。而全流程埋点的数据回流之后能够有效地辅助客户运营人员改善流程的设计。
除此之外,流程引擎还可以连接公司内部的各类服务API,将保险流程中的服务通过会话式交互提供给客户。
“以上两方面是一个不断积累的过程。一方面要不断实现行业领先的自然语言理解水平,同时也要基于当前的技术水平更好的为客户进行服务。”
孙谷飞以众安精灵为例解释道,在自然语言理解算法模型层面,众安一直紧跟行业发展,利用了Bert这类最新的模型结合众安自身积累的保险场景语料数据,实现了验证集上94%的意图理解准确率,92%的语义相似度模型准确率。可以说在语义理解能力方面众安在保险行业是有自身的独特优势的。
而如何更好地为客户服务这点,他认为:“最重要的是对于会话式交互这种需求的理解和梳理。我们将精灵和用户的对话理解为和图形界面交互相似的一种交互方式。那么从用户体验的角度讲,我们希望降低用户操作的不确定性,因此我们将自然语言理解模型与流程引擎结合起来。”
流程引擎简化了整个应用对于算法模型精准度的要求,它良好的连接能力使得图形交互、外部服务能够参与到交互过程中来和自然语言交互形成补充。同时大流程节点的跳转是由人工设计的,确保了用户体验能够在一个相对稳定的水平。
“可以说众安机器人平台就是众安对会话式交互的理解的实践。”据孙谷飞介绍,自2018年5月发布以来,众安精灵已积累了超过4万个保险基础问答条目、7大类19个意图的保险知识图谱,保险相关普通话语境中语义识别率达93%以上。
事实上,不论是对话式讲解服务、对话式导购服务,还是智能核保核赔等场景服务,都离不开大数据、机器学习、图像识别等技术的不断积累,使人工智能不断去学习和提高,通过反复的验证,从而满足实际保险服务环节中的客户体验需求。
在孙谷飞看来,在科技赋能保险上,大数据和AI是两个经常出现的技术名词,联系也很紧密,比如AI的发展离不开数据的积累和大数据技术的发展,但是两个技术属于不同的技术领域,各自发展的成熟度也不一样,所以在不同的应用场景下,表现也是不相同的,不能简单的放到一起讲。单从技术的应用程度来说,在很多领域,大数据相对AI来说较为深入一点。
而在保险领域,无论是大数据技术还是AI技术都有着很好的应用前景。
首先,从保险行业本身的特性来看,保险行业是当前最有潜力通过数据驱动变革的,这个行业以大数据原理为驱动,利用精算来控制风险,既是数据的收集者也是数据的使用者。
随着移动物联网、5G、物联网等技术的发展,保险行业所要处理的数据无论从量级、复杂度还是处理速度,都对大数据技术的应用了提出了很高的要求。
其次,保险行业的完整业务链路,包括获客、营销、核保、理赔等,整个服务链路长、人力投入大,AI技术的发展在这其中的各个业务环节都会有很好的降本增效的应用点。
“但从行业整体层面看,大数据和AI在保险业的赋能,目前还是处于起步阶段。” 孙谷飞总结道。在他看来,造成这种现状主要有以下原因:
在大数据层面,当前保险业的数据处理能力相对较弱。业界一般从数据处理的volume(数据量)、velocity(处理速度)、variety(多样性)、value(价值)来判断企业大数据的发展程度。目前保险行业所拥有的数据和处理能力,相对于典型互联网公司来说,在前三个v方面差距还很大。
“很多保险公司在这20年来积累了很多数据,但还集中在保单维度相关的数据,不管是数据量级,还是数据纬度的丰富性,还是处理速度的要求都相对较弱。”在他看来,单独看数据量级,当一家公司的场景数据足够多,用户数量足够大,若具备合理的大数据架构,大数据处理和运用能力也会随之提升。
在人工智能层面,孙谷飞指出,虽然人工智能在不断优化保险业务全链路,但它仍然有一些局限性。
首先,它存在技术边界,没有100%准确率的模型,“即使你有再多的数据,再强的算力,你的模型也很难做到极致,更不会达到百分之百的准确。”
其次,不同任务的模型不能自动迁移:AlphaGo没办法直接拿来做人脸识别和OCR,需要进行重新训练,同样任务的模型可能因为样本类型不一样,也需要重新训练,比如说身份证OCR模型转做发票OCR的话也需要重新定义问题和训练。
面对上述种种挑战,保险公司该如何实现AI、大数据等科技赋能业务的真正落地?孙谷飞给出了五点实战经验建议。
首先就是数据,要尽可能的收集可以反映用户行为的动态数据。数据的量级和丰富程度,是AI模型能落地的关键要素。数据的量级和丰富程度达到了,自然而然大数据技术的应用也变成了基本要求。
其次是需要建立数字化的业务反馈闭环,AI模型想要不断升级,需要在业务闭环里进行不断的数据反馈才可以迭代提升。
第三个要有工业化计算的平台,算法是从实验室走向工业化应用,需要从开发测试到发布和更新迭代,有一整套完整的生产平台,帮助去持续的追踪模型的进展。另外,也需要有一套大数据离线和实时计算平台,帮助面对日益增长的业务流量。
第四是人才储备:需要复合型的人才储备,需要打造懂业务懂技术的复合型人才团队,实现从商业业务目标到算法模型目标的转换。同时也需要掌握处理海量数据技能的大数据平台工程师和数据挖掘工程师,最终把算法模型在实际场景下落地。
最后,边界清晰的问题定义,目前机器还不具备主动、自发定义任务的能力,清晰、明确的任务目标就是人工智能得以有效应用最为关键的先决条件。需要将物理世界的业务问题转换为算法问题,将业务指标对应到模型性能指标。雷锋网雷锋网雷锋网