腾讯全球新总部于 11 月 28 日正式启用。这栋位于深圳滨海大厦的新大楼,在门禁上采用了腾讯优图的人脸识别技术。到目前为止,试运行的反馈算得上「非常良好」。
也就是说,腾讯上万名员工出入这栋大楼,都要通过腾讯优图在极短时间内的「检视」;而反过来,腾讯优图的产品每天也在接受着全体员工的把关:在五万人规模的人脸识别检测系统中,腾讯优图将错误率降到了千分之一以下。这一系统一方面要保证安全,即不在名单簿的人都无法顺利通过;另一方面则要保证应用,所有在名单库里的人都能够非常方便、不作任何停留地进出大楼。
腾讯优图实验室总监黄飞跃博士在与雷锋网 AI 科技评论交流的过程中两次提及了这一成果,不难感觉到,他对这一「作品」还是颇为满意的。在黄飞跃的理解中,这是「业界真正首家大规模的人脸识别应用」。
而腾讯新总部的人脸识别技术只是腾讯优图 2017 年的成就之一。回看腾讯优图的 2017,在黄飞跃的理解里,腾讯优图年初所定下的三个目标都已经顺利开展并且得到实现。他告诉雷锋网 AI 科技评论,如果满分是 100 分的话,2017 年「也许可以给优图打到 80 分」。
而他说出这一段话的背景,则是腾讯优图已经凭借人脸识别技术及相关应用,拿下了 2017 腾讯重大业务突破奖。这种谦逊而务实的风格或许也影响着这个实验室研究规划的节奏。「大多数时候,团队所定的年初目标都是比较『接地气』的,因此在我看来,不管是 2017 年还是其它时候,我们给自己定的绝大多数目标,最终都能够比较好地按照预期来实现。」黄飞跃如是告诉 AI 科技评论。
不论大环境如何变化,算法研究始终是腾讯优图的根基。黄飞跃也深知「时势造英雄」的作用,得益于 AI 在业界受到越来越高的关注,腾讯优图从 2012 年创立至今,逐步地通过自身的积累获得了公司内外的技术需求及认可。
而这也是优图在 2017 年伊始为自己定的第一个小目标:专注计算机视觉,希望研究领域处于业界领先水平。「乘风破浪」,这是黄飞跃对腾讯优图 2017 的第一个概括。
在人脸识别领域,2017 年 3 月,腾讯优图凭借 99.80% 的识别准确率,刷新了团队在 LFW 人脸数据集的准确率纪录,并在一个月后,又以 83.290% 的成绩登上 MegaFace 在 100 万级别人脸识别测试的冠军宝座。
而以 87.76% 的成绩刷新 CV 算法评测平台 KITTI 数据集里车辆追踪准确率的纪录,则是腾讯优图从 2016 年开始着手关注智能交通领域而取得的重要成果。据优图团队的介绍,一方面他们以多尺度深度学习模型直接完成端到端训练检测目标和追踪轨迹的关联矩阵,强化多检测目标和多追踪轨迹之间的相关性。另一方面,优图提出基于视觉关联矩阵和运动关联矩阵融合决策的多目标追踪方案,能够在复杂场景下完成车辆追踪任务。
只要是从事计算机视觉相关的企业,多多少少都会尝试在不同的数据集上「刷新纪录」,这也普遍被视为企业宣传自身技术实力的一种方式。虽然算法在数据集上的表现并不能够直接与应用能力的强弱划上等号,但不可否认的是,在数据集上取得优秀成绩的算法在实际应用上的效果往往也呈正相关。
对于腾讯优图而言,黄飞跃更愿意把在数据集上的取得的成绩当作是一种结果而非目的。「我们在 2016 年开始着手做智能交通相关的准备和研发,在这个过程中,我们也会根据自己的技术水平去参加相关的数据集比赛,但这并不意味着我们需要一个专门的团队进行『刷榜』。」
而回归人脸识别,腾讯优图也在 1:1 人脸验证与活体检测技术上取得了突破。腾讯优图通过「唇语+人脸场景分析」的解决方案,从阅读随机词语排除照片与录制视频的可能性,并从合成视频与边框、像素纹理等蛛丝马迹甄别不必要的安全攻击。比如在微众银行上正式应用的极光守卫,正是活体检测技术的进一步升级。系统通过屏幕发射不同颜色和强度的光线,借助摄像头接收反射到人脸的信号,通过卷积神经网络的算法处理,分析活体判断所需的人脸 3D 与质感信息。利用这一技术,用户可以在远程开户、修改密码等多种业务下瞬间完成刷脸验证。
凭借着在计算机视觉的积累,腾讯优图在全球顶级会议 ICCV 2017 上有 12 篇录用论文,其中有 3 篇被录用为口头报告,占总投稿数的 2.1%,黄飞跃博士也用了「水到渠成」这样的词来形容今年学术会议的的丰收。
值得一提的是,据雷锋网 AI 科技评论的了解,目前企业对待学术论文的态度呈现两级分化的倾向:部分企业以产品落地和变现为主要目的,对学术会议及相关论文投递并不关注;而也有企业非常欢迎论文的发表,认为这能从侧面为企业的学术水平增添含金量。
黄飞跃表示,在他看来,大部分企业还是欢迎论文的,而这也和公司当下所处的阶段不无关系,「如果能发表一些论文提升团队的影响力,在自我价值的体现与实现上诚然会起到一定的作用,但它并不是唯一和必须的途径。」以 ICCV 2017 为例,腾讯优图会鼓励研究员在学术会议上发表论文,但并不会做强制性的约束。
而在 ICCV 2017 其中一篇口头报告论文《Makeup-Go: Blind Reversion of Portrait Edit》中,团队提出了一个名为「成分回归网络(component regression network)」的深度网络结构,对全局美化操作进行盲复原。这篇「一键卸妆」的论文也在当时引发了众多关注及期待。
那么这又带来了一个新的问题:众所周知,企业研究院的算法研究与落地应用往往紧密相连,甚至达到了一种微妙的共生关系:技术积淀多半会尝试向落地应用转化,而产品在 AI 浪潮下的「智能」需求也可能推动着算法研发的步伐。
如果腾讯优图的研究成果并不一定会直接转化为产品应用,那么作为一个企业实验室,它在研究内容的选择上能拥有多大的自由度,又是如何协调算法研究与产品落地之间的关系的?
优图的图片压缩与人脸识别是 2012 年起家时最核心的两项技术。前者最早可追溯到 2011 年下半年,鉴于当时腾讯内部的众多业务都有图像存储与传输的需求,优图团队开始研究如何对图片做二次压缩实现有效存储,间接减少存储需求,以实现节约带宽与成本的目的。这一项目在作为黄飞跃看来属于「相对比较短期的研究」,用于解决企业当下的实际需求。
而人脸识别这一技术在 2012 年的大环境下则并未成为热门,相关的研究与落地还存在很长的一段距离。但尽管如此,腾讯优图一方面在持续研发压缩技术的同时,在 2012 年下半年还是将研究重心转移到了人脸识别检测方向,并开始进行相关的技术研发与储备。「囿于环境的限制,优图当时把人脸识别当作一个中长期的项目在布局,毕竟当时大家未必也看得清(未来的走向)。」
而随着团队调整到 SNG 麾下,优图也慢慢地从原本的纯技术研发出发,开始更多地关注和从事与产品业务相关的内容。技术人员会结合自己的能力寻找产品应用的落脚点,或是关注一些新技术的创新探索,并在其中找寻价值实现的空间。而反过来,产品人员在业务落地之时会遇到一些实际问题,提出技术人员可能原本没有考虑过的需求,
「这可能可以归因于两个方面,一是团队的每一个人都相信,自己所做的研究终究会产生价值,因此愿意潜心去做一些中长期的研究;另一个方面是企业给予了比较大的宽容度,给予团队一定的选择权。这两者是相互推动和促进的,不会做直接的管控。」
在 2017 年,优图定下的第二个小目标便在于此:提供大量行业解决方案并推动研究成果落地。有了完备的算法做为基础,腾讯优图在政务、公益、医疗、广告及旅游等多个场景打造了成功的行业方案。
不论是公司内部的业务,或是外部政企的合作,腾讯优图在 2017 年也收获了非常多的成功案例。据 AI 科技评论不完全统计,仅在今年,优图在微信服务号上的公开合作案例就超过 30 个。
2017 年 7 月被李克强总理点赞的「微信办证」服务就借助了腾讯优图的 FaceIn 人脸核身技术,进行远程核验就可完成原本繁琐的政务流程。此外,用户在企业微信上传营业执照时,优图所提供支持的 OCR 识别技术便能对公司名称等相关字段进行自动识别,进一步省却了用户输入及系统审核的时间。除了在陕西省工商进行合作外,依托优图的实名核身,深圳人社也与腾讯互联网+合作事业部合作推出了「刷脸」完成养老金领取资格认证的功能,旨在「让群众不跑腿就能办事」。
而腾讯优图的触角也正在更多地向零售、旅游及广告等更多领域进军。
通过与腾讯社交广告、微信支付及绫致时装达成合作,腾讯优图首次在全国推出人脸智慧时尚店,用户只需要在智慧试衣间屏幕前「刷脸」,就能成为商家会员,并开启微信免密支付。在结账之时,只需要在人脸识别收银台直接「刷脸」识别身份即可完成付款流程。
与此同时,借助人脸识别的技术优势,腾讯优图在今年协助龙门石窟、武汉等多个地方落地了「刷脸入园」的系统,让便民利民的应用进一步造福群众。
去年 9 月,国家工商总局也接入了腾讯优图的广告图像识别技术,能对互联网广告中的违法广告及相关人物、事件进行监管,这也成为人工智能技术在广告监管中的首次应用。
可以说,2017 年是团队在算法沉淀后在应用领域百花齐放的一个重要阶段,黄飞跃也在采访中用「厚积薄发」形容了优图刚刚过去的这一年。
黄飞跃曾经在雷锋网的采访中提及优图实验室在发展过程中拥有较高的「自主性和自由度」,这一点 AI 科技评论也再次得到了他的确认。腾讯优图的工作方向、研究内容的选择并不直接与产业化落地相连,也没有卡得非常严苛的 deadline. 在黄飞跃看来,这些选择有两个重要的标准和考量。
第一个是算法,这也与优图 2017 所立下的第一个目标相呼应:技术的好坏是一个比较科学与客观的评判体系,相对也容易判断。
而另一个标准就是业务。首先从质和量两个维度,优图对于产品和业务做了多少有价值、有影响力的案例?其次,又有多少项目能够顺利落地?有了学术基础与落地应用,腾讯优图的第三个目标便变得更加自然而顺畅:让优图的 AI 技术更具社会价值。
作为一个专注计算机视觉的研究部门,腾讯优图希望能够通过 AI 领域的技术优势,为社会带来积极且有益的贡献。不论是通过医学影像技术帮助医生诊疗筛查,及时挽救病人生命;或是采用人脸寻亲协助公安部门找回走失人员,让失散的亲人重聚团圆;又或是通过开放平台和开源项目惠及开发者,实现更多的技术输出,都是腾讯优图社会价值的体现。
腾讯优图在医疗领域取得的突破和进步是 2017 年浓墨重彩的一笔,贾佳亚博士在 TSAIC 上也多次提及了腾讯优图未来对医疗应用的投入。腾讯所推出的首个 AI 医学影像产品「腾讯觅影」,其中一大核心技术支持方正是腾讯优图。这一产品在肺癌和糖网早筛领域取得了显著的效果,并已经分别与广东省人民医院肺癌研究所、西安市第四医院和南山医院等多家大型医院落地应用。
在 11 月 15 日,科技部召开「新一代人工智能发展规划暨重大科技项目」启动会,明确依靠腾讯公司建设医疗影像国家人工智能开放创新平台。腾讯优图入选 AI「国家队」,既是国家对其医疗影像技术的一种肯定,也反映了国家对人工智能与医学跨界融合的信心。而随着医疗 AI 科学家郑冶枫博士于近期加入腾讯优图,相信我们将会看到腾讯优图在医疗领域的更多尝试与突破。
而通过与苏州、福建、上海等地的公安部门进行合作,腾讯优图在社会价值所做的贡献也有目共睹。不论是在福建省公安厅上线「牵挂你」防走失平台寻亲,或是 QQ 全城助力增加跨年龄识别等人脸寻亲应用,腾讯优图的技术都在发挥着实际作用,让走失的亲人在阔别多年后仍能重新团聚。据福建省公安厅提供的数据,从去年 3 月至 11 月,「牵挂你」防走失平台已经帮助寻回 545 名走失人员。
而作为一个更加开放的平台,除了面向开发者提供更多的接入渠道外,腾讯优图也在开源项目上迈出了坚实的一步。针对移动端深度学习,腾讯优图在 2017 年 7 月发布了首个深度学习开源项目 ncnn,这个神经网络前向计算框架能方便开发者将深度学习算法移植到手机端,开发人工智能的相关 App。据介绍,目前 ncnn 已在腾讯多款应用中使用,如 QQ、Qzone、微信及天天 P 图等。
腾讯优图给自己的定位是「专注于人工智能、计算机视觉的技术研发与探索落地」,并且致力于「帮助」与「赋能」两个层面。一方面,腾讯优图给内部业务团队提供 AI 的技术与能力;另一方面,它也帮助其它企业的更多业务对外输出优图的 AI 技术能力。
2018 年,黄飞跃对腾讯优图在商业化的发展也有了新的期待。「从算法研发和技术布局的角度上看,我们的发展基本上都是可以符合预期的,也基本上能够做到对社会有一定的推动力。当然,也有一些事情难以做到尽善尽美,如商业化拓展的能力、整个业界影响力的提升以及市场布局上,仍然需要大量的投入。」
黄飞跃用「任重道远」这个成语作为优图 2017 年的第三个关键词,在过去一年,腾讯优图在学术会议崭露头角、在世界级比赛中刷新成绩,让更多的学者关注优图所取得的算法进展;而在落地合作上,腾讯优图也尝试涉足更多的应用领域,为更多的企业提供赋能的能力与可能性。在未来,腾讯优图希望深化技术研究,并进一步推动业务的落地,让优图的 2018,走得更加稳健与扎实。