凯文·凯利曾说,未来20年最伟大的事情可能还没有出现,但可以预测的是,人工智能将是未来20年内最重要的技术趋势,创业企业的方向应该很明确,就是将人工智能应用于某个领域。
近两年,人工智能创业公司如雨后春笋一般不断涌现,但是大部分的企业是关注于如何让自家的产品更加智能,但有这么一家公司却立下 flag,要做商品识别领域的人工智能赋能者,让别人的产品更加智能。
Matt Scott
在2017年北京GMIC大会期间,码隆科技联合创始人兼 CTO 码特(Matt Scott)告诉雷锋网,和其他人工智能公司不同,码隆科技是将商品识别方面的技术开放给其他企业,使得他们能够运用这些技术去搭建属于自己的商品识别引擎。
而码特提及的人工智能技术,码隆科技已将其搭建成一个人工智能平台—ProductAI。
商品识别
在弄清楚 ProductAI 平台之前,需要先介绍一下商品识别的概念。码特告诉雷锋网,大家都熟悉人脸识别,通过人工智能分类技术可以提取出如性别、年龄、种族等信息,那么商品识别也类似,拿时尚领域来说,通过人工智能技术可以提取出服饰的材质、色彩、风格等特征。
但是区别之处在于,商品里既包含酒瓶、车辆、家具这样的刚性物体,也包含服饰面料等易折叠的柔性物体。除了易褶皱这样的属性,柔性物体上的面料纹路和图案也不尽相同,所以相对介于刚性和柔性之间的人脸,柔性物体的识别难度更大,而这个也正是码隆科技投入大量精力去钻研并且擅长的领域,码特说。
ProductAI 的登录界面
ProductAI
码特告诉雷锋网,商品识别技术的背后需要有海量商品数据的支持,通过收集针对某些垂直行业的商品图像数据,运用适用于这个行业的算法去搭建这些垂直领域的模型,由此产生针对垂直领域的商品识别结果,如:分类(Classification)、检测(Detection)、分割(Segmentation)、检索(Retrieval)等等。
企业能够运用这些功能去搭建他们自己的商品识别服务,而码隆则将上述提供的服务进行整合,搭建成一个人工智能平台—ProductAI。也就是说,ProductAI是企业运用人工智能商品识别服务的入口。
ProductAI的核心技术服务
据码特介绍,针对垂直领域,ProductAI有两大核心技术服务:
垂直领域图像检索(Vertical AI Image Retrieval)
垂直领域自动标注(Vertical Auto-Tagging)
垂直领域商品检索服务
在图像检索方面,除了上文中提到的码隆擅长的时尚、纺织面料等领域,码特告诉雷锋网,现在又新增了在车辆、酒类、家具等垂直领域的模型,未来还将持续扩充人工智能在商品识别的垂直场景。
在扩充了使用场景后,问题也随之而来:这个横跨多领域的智能识别系统,如何能保证其既能实时处理上亿数据, 又能处理不同类别的调用请求? 还能保证高性价比?对此,码特分享了码隆的做法:
第一点:我们首次提出“场景选择” (Scenario Selection)的概念,用户可在图像检索服务中,选择所属行业的场景服务,然后运用到自己的产品中,以获得最好的性能。提到图像检索服务,人们会想到谷歌和百度的以图搜图功能,但是他们大多使用的是通用模型,相较于我们使用垂直领域专用语言(Domain Specific Language)进行搜索引擎搭建,通用模型的商品检索精确度往往差强人意。
第二点:算法。除了拥有亿级以上的垂直行业图像数据以外,在每个垂直行业的基础上,我们使用了多任务的深度度量学习(Deep Metric Learning)来训练端到端的图像检索模型,这使得我们相较于其他人工智能公司,在商品识别方面,特别是难度最大的柔性商品识别领域,能够获得更加精确的检索结果。
关于精确度的考量,可以说码隆现已在业内遥遥领先,而且我们有信心与 CVPR, ICCV, ECCV 等国际顶尖论文的公开基准点(Public Benchmarks)进行比较。
第三点:速度。我们花费了非常多的精力将二值神经网络和分布计算的技术运用在深度学习网络当中,以实现大规模且高效率的查询检索。
第四点:费用。我们一直在努力降低服务成本,以便让更多企业能够受益于这项服务。
垂直领域的商品图像自动标注服务
如上图所示,除了商品检索之外,ProductAI 的图像识别技术还能对图片进行实体检测,定位图中实体,同时提供可定制的标注信息,码特告诉雷锋网。
说起图像标注,码特说,让我们来聊一个当下比较热的话题:如何提升训练数据的效率?
对于人工智能公司而言,想要获取到海量的有标注数据难度是比较大的,我们内部有专门的团队负责这部分的信息收集,从而提供数以百万计的标注数据,目前做得很不错。
这个就是业界普遍在做的监督学习,但我们同时也正在往半监督学习(Semi-supervise Learning) 的阶段前进,生成对抗网络GAN(Generative Adversarial Networks)就是一种很好的方法。
有了生成对抗网络,我们就可以不需要像过去那么多高质量的标签数据,而是通过一些技术去获取这些数据。在以一定数量的标注数据作为训练基础的情况下,将这些技术应用于训练分割、检测、分类、图像检索这些任务,从而减轻训练海量标注数据的负担。
以图搜图
1、布料搜索
顾名思义,通过在 ProductAI 平台上建立的 “以图搜布” 面料商品图像搜索引擎,人们只需要对着想要购买的面料拍摄一张照片,系统会先识别出面料的图形与花色,然后生成相应的购买链接。码特说道,这个案例是 ProductAI 的第一个应用,目前中国前 10 大纺织面料企业,有 7 家已经接入了这个服务。
图像搜索引擎有非常广阔的行业应用空间,尤其针对一些难以用语言描述的场景,比如布料的花纹和质地,用视觉方式检索就会很直接。码特补充道。
2、时尚商品搜索
只要将服装网站上的喜欢的款式截图,复制粘贴到基于 ProductAI 的图像搜索引擎上,便可以迅速得到服装的批发购买链接。即使服装商品图片经过PS、翻转、变形,即使有些相同衣服的模特不同,也能够搜索出来。同时,同样款式的衣服可以一起被搜索出来,供消费者进行比价挑选。
时尚分析与趋势预测
作为面料纺织行业权威机构,中国纺织信息中心需要预测流行色等未来的趋势,再把预测信息和整个产业进行分享,起到引领风潮的作用。通过自动抽取海量T台图像信息中的主体色彩,ProductAI 能够在短时间内完成颜色分析,总结出整体趋势,减少了人力观测成本,码特说。
出版物识别
ProductAI 还可以提供出版物识别技术,一个典型的例子是《光明日报》在嵌入人工智能识别技术后,只要对着报纸拍一张照片,便可实时识别出与之相关联的全媒体信息,如视频等,搭建起了虚拟与现实的桥梁。
2014年7月,黄鼎隆与曾经微软的同事 Matt Scott(码特) 联合创立了码隆科技,可以看出公司的名称就是两位创业者名字的结合。
2015年1月,码隆科技入选微软创投加速器。同时推出了面向C端的以图搜图的移动应用StyleAI,希望用图像识别结合深度学习来破解时尚密码。
2015年3月,达晨创投和远镜创投共同为码隆科技注入1200万元天使投资。
2016年7月,码隆科技完成了6200万人民币的A轮融资。
2016年10月,码隆科技正式发布人工智能视觉应用平台—ProductAI 。
作为一个在中国创业的美国人,码特拥有 40 多项中美专利、发表了 13 篇国际顶级论文,有着十多年的开发经验和微软亚洲研究院高级研发主管的工作经历,所以谈及中美在人工智能方面学术与商业化的话题,他感触颇深:
就学术研究而言,根据2016年美国白宫发表的人工智能战略报告,自2014年起,中国在人工智能领域所发表的论文与期刊数量,及被引用文章数皆已位居世界之首。中国近几年在人工智能领域的研究发展已超越美国,成为世界领先的代表。
商业化方面,因为中国更大、人更多、企业也更多,同时中国专注于某些美国不会重点关注的领域,如:制造业、硬件等。在中国,人工智能更有机会在垂直行业中发挥更大的影响力。当人工智能遇上摄像头这类的硬件产品,会发挥巨大的价值。而当人工智能助力制造业时,对全世界都能够带来更大的影响力。举例来说在中国深圳,这个制造业之乡,机器人产业最为繁荣的中国城市,现阶段达到如此巨大规模的发展,放眼世界,只有在中国才可能发生。
当雷锋网问及码隆下一步的计划时,码特的回答简洁而有力,我们希望能够在垂直领域做得更加深入,并进军国际市场。