雷锋网会于7月中旬在深圳举办全球人工智能与机器人峰会,届时我们会发布一个年度Top 25人工智能项目榜单,目前,我们正在四处拜访人工智能领域相关的业者。最近关于图像识别这一块,我们拜访了若干公司,图普科技是其中一家。如果你也想挑战榜单中的公司,邮件联系zhangxian#leiphone.com。
在让计算机理解世界上,或许理解了什么并不重要,重要的是理解的能力。于是图普科技想到让它理解“小黄图”。
图普是一家图像识别云服务公司,接入它的API,上传图片,服务器就能以一定的准确性解读图片。图普告诉雷锋网,其产品包括图像审核、増值及搜索,有鉴黄、人脸识别、场景识别等数十个模块,目前日均处理3亿张图片,是国内最大的图像识别云服务公司。
不过图普最知名的还是鉴别“小黄图”,图像视频审核也是现在最主要的服务,客户包括受不良信息困扰的迅雷,和我老公思聪投过的直播平台17等。
图片来自图普官网截图
鉴别小黄图听起来像是个苦力活,但与其它类型的图像一样,用的也是深度学习技术。自诞生以来,深度学习已经在计算机视觉和语音识别等领域展现了显著的效果,其中在图像识别的精确度上甚至超过了人类。雷锋网与数位业内人士交流中得知,深度学习可以说降低了机器学习的门槛。传统的机器学习算法,如Boosting和SVM,在模式识别中要设计很多特征,这需要大量经验和技术积累。而深度学习在自动提取特征上有极大优越性,输入原始数据,它能自行提取特征,不用人为设计,这让图像识别更多变成了工程问题。
创始人李明强告诉雷锋网,图普的优势体现在工程及数据两方面。虽然深度学习降低了技术门槛,但产品化过程中还会出现硬件与服务器不兼容,硬件配置与架构搭建上的困难,以及响应速度等问题。直播强调的是即时性,所以视频审核也要做到毫秒级,如果一不小心没审出来,主播们就要大白于天下了。图普日均处理3亿张图片,用的是基于大规模GPU集群的超算平台。李明强2012年前曾在腾讯工作七年,任QQ邮箱技术负责人,也是微信立项创始人之一,两者都有海量数据需要处理。
对人工智能企业来说,数据是一个很大的门槛。数据越多,分析的准确度就越高;而准确度高又能吸引更多用户,得到更多数据。图普表示,与国内主流的直播和短视频平台,如17、风云直播、小咖秀等都有合作,接入的数据多,覆盖全面。
李明强 / 图片来自图普科技
做到这一点的前提是找到方向和需求。图普在做内容审核前尝试的方向是拍照搜衣,即给身上的衣服拍张照,到淘宝搜同款。但搜衣服务需求及盈利空间不大,而且搜同款用关键词或许效果更好。后来由于快播事件,他们发现内容审核对很多社交及云平台都是刚需,才做起了鉴别小黄图。
不过鉴黄并不是图普的目标。也许是继承了腾讯的基因,李明强给图普的定位是给视频时代建立连接。在文字时代,只有对文字理解后才有搜索,才有内容间的连接。同样,图像和视频被计算机理解后,才能形成内容间的连接。
现在视频和图像逐渐成为主要内容和新的描述方式,推荐却还是以“看了的人还喜欢”这种方式为主,而非基于视频的内容。如果计算机看懂了视频,那推荐的理由就会变成类型,风格,甚至是故事结构了。
目前以鉴黄为代表,计算机可以识别人、物与场景,但对它们之前关系的理解还不够深入。李明强认为,根据内容进行推荐、搜索,提供差异化服务,视频行业才算到了第二阶段,目前的审核服务是为了满足基础需求,技术成熟后会提供广告投放和导购等增值服务。
看来,鉴别小黄图还只是开始。