“以技术见长的公司,产品化一般都做的不太理想。在我们图像识别这个领域,天天P图算是比较成功的案例。”一个做图像识别的从业者毫不吝啬地夸奖同行的产品。
这个不难理解,因为图像识别不管是技术还是市场都还在早期培育过程中,同行之间更多的是同舟共济而不是短兵相接的关系。并且,这些团队的负责人之间或多或少都有一些渊源(或者师出同门,或者在同一研究所里工作过)。“做来做去都是我们这一帮人。”这个从业者说道。
目前看来,国内几个主要做图像识别的公司都有各自侧重的应用方向,百度识图主打图片搜索,亮风台主打AR人机交互,格灵深瞳主打安防,阿里巴巴主打“同款商品”,腾讯优图主打人脸识别,这些方向的选择都和本身的技术优势和团队基因有关。
天天P图是腾讯优图团队(以下简称“优图”)的作品。它是一个自动美妆应用,曾连续登顶中国和整个亚洲市场App Store总榜第一名十五天以上;范冰冰版武则天热播的时候,天天P图推出的“一秒钟变武媚娘”功能曾经火遍社交网络。
这个产品很考验人脸识别的精确度,系统能越精准地识别五官的位置,妆容的感觉就会越贴合、越自然。
记者也从侧面了解到,优图可能并不是业内公认的图像识别底层技术最好的团队,但落地最成功的产品却出自它手,这可能不是偶然。
优图脱胎于腾讯研究院,被拆分到腾讯SNG(社交网络事业群)后,一开始作为技术支持团队存在,主要给QQ空间等等腾讯SNG本身的一些相册产品做技术支持,包括图片压缩、基于人脸识别的相册管理等等。这种基因让优图团队既具备学院派的技术研究风格,也和产品走得很近。
人数最少的时候,优图只有六七个人,发展到现在有了40余人(多为来自国内外重点院校的博士硕士,男女比例大约为40:1),除了被动地做技术响应,也开始主动孵化一些产品,天天P图就是在这种背景下诞生的。现在天天P图也有了几十人的规模,和优图在同一层大厦里办公。
优图团队不受一般意义上的KPI的约束,整个团队处于一个相对轻松的氛围。负责人黄飞跃对自己团队的要求是:一方面继续优化人脸识别的底层技术,另外是尝试不同的产品落地方向。
雷锋网:“人脸识别的原理是什么,精确度有无数字可以衡量?如果有,精确度每提高一个百分点,技术人员需要做出哪些努力?”
腾讯优图:“输入一张人脸照片,经过人脸检测、五官定位、特征提取,将人脸照片变成一个数字表达。人脸识别有两种模式,一种是1:1人脸验证,即给定两张照片,根据两张照片对应的数字表达计算相似度,当相似度超过一定数值就认为是同一个人;还有一种是1:N人脸对比,将一张人脸照片与数据库中N张人脸照片进行相似度计算,然后排序。
衡量人脸识别准确率的数字是错误接受率和通过率,错误接受率是指将不同的人错误的认为是同一个人的比例,通过率是指本人被系统正确识别出来的比例,前者决定了系统安全性,后者决定了系统的可用性。
在研发过程中,通过率每上升一个点,需要成倍的训练数据,以及数月的研发。”
在交流的过程中,黄飞跃和优图团队的工程师反反复复提及“训练”和“数据集”这样的词汇,其实人脸识别(以及图像和模式识别)远不是科幻电影中那么酷炫,真实的图像识别是枯燥和机械的数学问题,对数据的反复校正,直到判断准确的概率无限接近100%。
说到“数据集”,优图做人脸识别有一个得天独厚的优势:你再也找不到一个别的公司或者机构能拥有腾讯这么多而全的人脸数据了。
目前优图已有的应用方向包括空间相册、失踪儿童找回、 智能家居监控和安防管理,但目前重点还是在互联网金融方面的应用。优图为财付通、微众银行定制了一套人脸识别系统,可以让用户远程完成身份验证,不需要到银行柜台也能办理银行业务。
这个应用场景有一个特殊的便利:公安部门提供的身份证照片这个“数据集”里的每一个数据都是唯一、有效且相对标准的。
谈及人脸和身份证照片1:1的验证,记者提到:因为人的外貌会发生变化,有时候机场安检肉眼都无法判定乘客和身份证照片上的是否是同一人,这方面机器是否会做得更好?得到的答案是肯定的,而且这个结论已经被来自优图内部和外部的实验数据验证过。
人脸识别在互联网金融领域的火热超乎优图预料,当然这不是偶然事件,也是他们在尝试了很多种方向后收获的结果之一。
如前文所述,腾讯优图目前只针对腾讯内部的产品开放,在记者看来,这在以“开放”、“连接”著称的腾讯公司只是个阶段性的策略。而目前优图也向雷锋网透露,不久的未来,优图的人脸识别技术也会通过开放平台和腾讯云向外界开放。