作者 | 肖漫
编辑 | 李帅飞
2007 年 1 月 9 日,当初代 iPhone 横空出世的时候,踌躇满志的乔布斯在演讲台上非常明确地指出:无论是Mac、iPod 还是 iPhone,它们的革命性创新都体现在人机交互方式的进化。
此后,以智能手机为载体,人机交互随着技术的发展突破不断进化。
比如说,在移动互联网和人工智能的融合发展浪潮中,以苹果 Siri、Google Assistant 为代表的智能语音助手成为一时之风尚,它们在触控之外,开启了一种新的交互方式——也就是更加符合人类交流方式的语音对话。这种交互方式在诞生后数年,就快速覆盖了整个行业。
然而,语音助手并不是终点,人们依旧在人机交互层面寻求面向未来的进一步突破。尤其是当下,iPhone 已诞生将近 15 年,AI/AR/VR/数字媒体等技术得到飞速发展,元宇宙概念也勃然兴起。值此技术飞速变革之际,一个值得深思的问题已经摆在整个行业面前:
语音助手逐渐走向普及之后,人机交互方式又该朝向什么样的方式进化?
当然,这是一个需要整个行业通过实践来给出答案的问题——而在诸多答题者中,让雷锋网眼前一亮的,是凭借自身 AI 实力来践行自身对未来人机交互大方向思考的 OPPO。
截至今年 8 月,ColorOS 全球月活跃用户达到了 4.6 亿,庞大的用户服务需要强大的技术能力,尤其是 AI 能力的支持。那么,OPPO 支撑全球超过 4.6 亿用户的 AI 服务是如何构建的呢?
对于人机交互的未来,真正能够代表 OPPO 自身思考和选择的,是它旗下小布助手在近日 OPPO 开发者大会上的一次重要进化。
简单来说,就是将 OPPO 小布助手从以往基于语音交互的智能辅助工具形态,进化为基于虚拟人多模态交互的智能助手形态,从而将人与智能助手之间的交互演化为人与虚拟人之间的交互。
这不难让人理解——毕竟,基于多模态交互的 “虚拟人”,已经成为当前人机交互探索发展的新方向,也成为整个行业参与者的共同选择。
比如说,在今年 6 月,中国首个原创虚拟学生 “华智冰” 的身份以本科生的身份进入到清华大学;而设计虚拟学生 “华智冰” 的初衷,是希望她最终能像人一样思考,像人一样不断学习,理解人的想法,主动产生符合用户需求的互动,直观、全面地捕捉人类的需求——当然,“华智冰” 诞生的背后,体现的正是多模态交互的成果。
除了入学,“虚拟人” 也已经在互联网上 C 位站台。
比如说在 9 月份,小红书同时入驻了 20+ 虚拟偶像,她们化身潮流情报官,首发试穿诸多潮流品牌的新品,演绎不一样的潮流魅力……前不久,虚拟人 AYAYI 也成为了天猫超级品牌数字主理人,并且开了个天猫双 11 元宇宙艺术展,有趣的是,华为在今年 HDC 开发者大会上首次采用数字人全程实时手语直播。
当然,放眼整个社会生活空间,“虚拟人” 的角色更是无缝融入其中。
比如说,新华社和腾讯联合打造了专门面向航天主题和场景研发的数字航天员、数字记者“小诤”;日本原宿风少女数字人 imma,在 9 月初还登上了东京残奥会的闭幕式;浦发银行和百度共同发布了数字员工“小浦”;湖南卫视宣布推出了首个数字主持人小漾,而江苏卫视则直接开播了一档宣传虚拟偶像的节目《2060》……
可以看到,伴随着当前人工智能、虚拟现实等数字媒体技术的不断发展,基于多模态交互的虚拟人已经从互联网和数字世界走向人类的实际社会场景,并且这已经成为大趋势——甚至有观点认为,虚拟人将会成为未来人机交互的基础模态。
正是在这样一个大背景下,OPPO 也在洞察到人机交互发展大势的基础上,不失时机地实现了小布助手从语音助手到“虚拟人”的新一轮进化。
小布助手是国内首个月活用户数破亿的手机语音助手,当前月活已经达到 1.3 亿,是 OPPO AI应用的集中体现。作为最早以智能手机为载体的人工智能助手,小布以语音交互为主体,覆盖了 OPPO 系多个手机品牌,在后来发展过程中,它又被逐渐应用于智能手机、电视等多个品类智能终端设备。
自 2018 年诞生以来,小布助手经历了多次升级,不断在功能和体验上推陈出新。 本次 OPPO 开发者大会上,OPPO 方面宣布,小布助手已经正式从纯粹的语音助手升级为多模态的智能助手,包含语音、建议、指令、识屏和扫一扫五大能力模块。
多模态的需求,是智能时代智能助手的关键特征,智能助手需要兼容不同的软硬件智能场景,引入更多的AI能力,并且将它们紧密地与原有的 AI 能力结合在一起,形成综合的AI能力。
今年 9 月上线的“小布虚拟人”, 也是智能助手多模态交互形态的重要呈现。
作为业界首个基于虚拟人多模态交互的手机智能助手,小布虚拟人打破了交互次元方式,将人与智能助手之间的交互,演化为人与虚拟人之间的交互。
据悉,在破次元人机交互的探索中,“小布虚拟人”可以实现与用户在多个场景生态下的内容服务、实时交互以及情感化交互,其首期上线的拟人化播报新闻和天气等功能便是直接体现;目前这一功能已覆盖 OPPO Reno5/6、Find X3 系列机型。
同时,小布虚拟人融合了语音、语义和视觉多模态交互技术,能够提供自然流畅的虚拟数字技术交互体验。在多模态情感识别算法的加持下,小布虚拟人可以敏锐捕捉用户情绪特征,打造与用户之间的多维情感畅联。
令人关注的是,OPPO 以小布助手为入口,开放了小布生态。
每一位开发者都能够定制专属的小布虚拟人。它们可以拥有不同的声音、形象、性格、技能以及服务,化身为不同的角色,例如智能客服、虚拟助手、带货主播等,并搭载在多个智能终端设备上。
OPPO 此番动作,不仅是赋能开发者在人机交互层面实现 "虚拟人" 的进化,从而进一步融入到整个行业的 "虚拟人" 发展大势中。究其本质,是为了面向用户提供更加智能化、个性化和自然真实的交互体验。
如果说小布的进化是一次变身,那么 AI 技术可以说是这一变身背后的核心 "魔法弹药"。
实际上,“万丈高楼平地起”,无论是小布助手的蜕变升级,还是 OPPO 为开发者构建的开放平台生态,都是以 OPPO 全栈式 AI 技术生态能力为底座——毕竟,而唯有底座稳健,高楼才能拔地而起。
从 OPPO 在 AI 上的投注来看,其在 AI 上的布局是具备规划、结合点面的长线思维。其中,AI 框架是 OPPO 整体 AI 能力的重点,也是其 AI 实力的一大体现。
为了构建这一 AI 框架,OPPO 花了相当大的精力成本打造出 OPPO 全栈式 AI 技术生态,据了解,这一 AI 技术生态由 6 个部分组成,主要包括:
计算、网络、中间件和数据库的混合云基础设施层;
面向海量跨系统数据进行存储与处理的云原生数据湖层;
端侧推理、模型压缩、大规模训练、AutoML 的端云一体机器学习系统;
语音、NLP、知识图谱、CV、推荐搜索等基础能力的 AI 能力层;
跨终端、多场景落地的业务应用层;
为企业提供安全可信的 AI 安全能力层;
众所周知,机器学习需要大量的数据计算和验证。OPPO当前已经进入全球50多个国家, ColorOS 月活跃用户达到了4.6亿,庞大的用户基数也为其全栈式 AI 技术生态累积了海量数据和计算资源。
以季度为单位,视频云调用超过 4.2 亿次,新增照片超过 300 亿;大数据每日新增超过 10PB,合云基础设施覆盖全球八大区域。
从机器学习系统来看,OPPO 全栈式 AI 技术生态提供了端侧和云侧两大部分——其中,位于端侧的端侧算法引擎、加速框架和模型雅座提供低延时的高效相应;云侧则是将上传到云端的端侧数据进行大规模训练和推理,从而反过来优化端侧算法。
在海量数据和出色的算法、算力加持下,OPPO AI 不断在业内获得认可,其基于知识的大规模预训练,包括上下文理解、短文本相似度等语音语义的多项指标多次登顶行业权威评测。
不仅如此,在世界顶级的计算机视觉会议 CVPR 上,OPPO 在 2020 年和 2021 年分别取得了极端超分辨率感知第一、手持设备视觉定位第一和多目标行为分析少样本分类第一的成绩。
另外,从 AI 能力来看,OPPO AI 具备了语音、NLP、知识图谱、CV、推荐搜索等基础能力,其端到端生成式对话模型的人工评测满意度已超过了 85%,属于行业较高水平;而这一成果已应用在小布生成式闲聊的业务场景中。
在具备强大的 AI 能力之外,安全性也是不可忽视的重要一环。雷锋网了解到,OPPO AI 安全技术从应用检测、恶意防护到攻击对抗等各个方面提供了全方位的安全保障。
官方数据显示,在应用检测上,累计检测 APP 超过 53 万,发现恶意 APP 超过 1 万款,浏览器每天拦截恶意下载逾300 万条,并拥有超过 15 万条隐私政策;在恶意防护上,为用户过滤恶意行为超过 1140 亿次,封禁恶意账号 280 万个。
不难看出,OPPO 全栈式 AI 技术生态是 OPPO AI 关键能力和技术优势的落地实践,为 OPPO 海量的 AI 服务提供了夯实的架构基础、更高的资源利用效率以及安全可信的隐私保障。
当然,仅仅有 AI 技术能力并不够。OPPO 希望打造的 AI 生态在具备智慧之外,更重要的是有人性、有温度。
因此,针对都市人群心理问题,OPPO 发布了 “AI 升温计划”,每天为超过200万人提供暖心陪伴;同时,针对手机适老化,OPPO 打造了小布助手关怀版,已经改善了 700 万老年用户的手机使用体验;针对传统文化传承,OPPO 还联合音乐人阿朵共同推出了“我是民乐守艺人”活动,全网曝光量超过 28 亿,以科技创新的形式带动民乐的传承推广。
当然,在雷锋网看来,OPPO 小布助手的进化,在根本层面反映的是 OPPO 对于 AI 等基础技术的大力投入和持续积累,对于行业新概念、新趋势的积极拥抱和不断探索——但更重要的是,基于对未来人机交互形态的不断探寻,反映了 OPPO 对于每一个普通用户的实际产品体验的极端重视。
从某种程度上来看,无论是语音助手,还是 “虚拟人”,真正优秀的设备使用体验,必然是建立在对用户本身的深入理解和感知之上,并且要同时用技术的力量和人文的视角将这种理解和感知体现在具体好用的软硬件产品之上,才能够直抵用户的真正需求。
这也是每一个真正面向消费者的科技公司,都应该如同乔布斯一样站在科技和人文的交叉口的原因。
毕竟,科技以人为本。