肖洪波毕业于清华大学,目前担任触景无限科技CEO,曾任惠普项目负责人、CA中国技术顾问、IBM 资深信息架构师、UIUC高等媒体研究中心图像组项目负责人
雷锋网按:近日,触景无限科技(北京)有限公司入选雷锋网发布的「AI 最佳掘金案例年度榜单」,并获得最佳前端人脸识别方案奖。
「AI 最佳掘金案例年度榜单」从商业维度出发,评选出8大行业中的30个最佳解决方案/产品。雷锋网根据企业提交的“解决方案/产品资料、商务合作(单个行业的业务统计)、企业自身情况”三个维度的信息,以20个明确评分项为标准,对参选企业进行首轮全面评估。同时邀请多位传统企业CIO、系统集成商项目高管、AI企业解决方案负责人、投资机构合伙人、学界教授等数十位评委,对参选企业和脱敏后的信息,进行了第二轮分析评审。
历时两个月,融合两轮评选结果后,最终公布30强名单。
“触景无限踏入安防行业差不多两年时间,这个行业目前还有很多“历史遗留”问题尚未解决。比如前端的识别问题、后端的基于大数据的分析问题;再比如模糊图像的处理、跨摄像头的立体防控问题等等。” 在去美国前一天的下午,触景无限CEO肖洪波接受了雷锋网的专访。
“计算机视觉技术作为AI产品的理论基础,在实验室做Demo较为容易,但真正落地到安防实战项目中,实际效果至少对打半折” 。
采访伊始,肖洪波就直接指出了安防行业当前存在的一些问题。他同时还提到,与其他行业不同,安防行业竞争尤为激烈,而且‘界限不明’,对于“跨界”求存,他认为,“未来一定不是端到端的天下,任何一条产业链唯有分工明确才能精益求精”。
以这两年被资本加持的算法层为例来说,庞大蜜罐的诱使下,各路玩家玩命跟进,但同时也出现了一个不得不承认的尴尬局势:多而不精——专业算法公司与传统安防企业在算法层面能够做到的事情其实从某种意义上来说是对等的,能够根据安防某一细分场景做细、做精的算法公司少之又少。
所幸的是,中国安防市场足够大,相较全球其他国家有着先天的政策及地理优势。因此在整个风云混斗的安防圈,触景无限“另辟蹊径”,不做纯算法的研究,而是通过软硬件相结合的方式,为用户提供一个中间平台,帮助设备商比较容易地将集成各种传感器功能的模块嵌入到产品中去,使得前端产品跑得更快、跑得更稳,使得安防行业能够真正实现全面AI化。
他预测道,随着行业数据量的指数增长,未来的安防市场不可能将所有的数据都集中在后端服务器上做处理,会有越来越多的数据直接放置于前端识别、处理。而在此大趋势下,AI在安防行业中的应用除了人脸识别之外,下一个落脚点极有可能会是前端的视频结构化。
通俗来说,部署在各地的安防监控摄像机抓拍到的人脸图像不一定能够满足甲方的实际需求。(角度、像素),而此时就可通过目标人穿的衣服、背的包、穿的鞋去进行跟踪识别,而这就涉及到了前端跨摄像头的再识别。
提起触景无限,若非行业人士,对这家公司的印象会有些“模糊”。
打开百度百科,从VR到无人机,从可穿戴设备到安防,这家“有毒”的创业公司好像同时间横跨众多领域,一时间很难谈清它到底属于哪个行业,到底在做什么。
“触景无限是一家通用化 AI 感知模块的方案提供商,目前专注于摄像头和无人机方向。我们的工作是通过“感知”能力让前端产品变得更加智能。”对于上述疑问,肖洪波回应道,“我们希望使用先进的视觉感知技术,在复杂场景中完成对目标图像的提取、识别和分类,实时感知摄像头、目标物体、周边环境的空间关系,赋予机器更好的感知能力”。
与绝大部分CV公司的切入点不同,触景无限要做的事是让机器直接对实际场景进行识别,然后根据结果调节前端的传感器以达到最优值。值得注意的是,这里所提传感器并非单一的传感器,它将前端的多种传感器融合在一起,从而获得更多的数据,之后在这个基础上,对后期的‘综合’数据作分析,当数据维度足够多的时候,优化效果则会更佳。
以智能家居行业为例,目前行业大多数厂商都以‘总控’为中心去做智能化,但在肖洪波眼中,这并非严格意义上的智能家电:“唯有让家电具备‘感知能力’,该技术的创新才有真正价值。”
譬如智能音箱,用户通过语音控制音箱播放或者暂停歌曲并非智能。真正的智能音箱应该能够以“更好地发声”为前提,通过对环境的感知,为用户展示最好的聆听效果。比如苹果的HomePod音箱,它可根据声音折射,‘知道’自己被放置在一个多大的空间中,以及在空间的哪个位置,从而自动调节它自身的五个发声单元,为用户呈现最佳的音响效果。
譬如空调,它并非自动根据室外温度而自动调节送风模式。而是像日本最新的日立空调那样,能够通过前端的两个摄像头,知晓房间的大小、人数、这些人是运动的还是静止的、体温状况、房间有无阳光直射等环境。然后通过对这些外部环境的感知,改变其送风模式及温度;
再譬如烤箱,它可以根据食物的种类、状态,自动选择时间、火候,从而烤出最美味的食物;
如此等等。
在安防行业中的应用亦是同理。
以往的安防摄像头都在“傻瓜式”地“工作”,不知‘自己’需要抓拍行人、车辆还是其他事物,也不知‘自己’已经处于何种环境之中。“如果将感知能力赋予到安防前端摄像头中去,能够大大提升摄像头的工作效率及使用效果”。
但与此同时,又出现了一些问题,而这也正是白热化竞争之下,触景无限需要解决且有机会脱颖而出的关键点所在。在此前接受雷锋网专访时,肖洪波就曾表示:
相同配置下,安防前端处理能力较低,如何在前端嵌入式系统里对神经网络模型进行有效压缩,是嵌入式智能感知面临的最大课题之一。
现如今业界倾向于把网络做得越深越好,但在嵌入式中也面临一个挑战:资源有限,无法运行特别大的模型。
基于以上两点,在去年十一月的深圳安博会期间,触景无限发布瞬视人脸抓拍系统,它将VPU(智能分析处理服务器)模块嵌入到摄像机里,无需再配置后端服务器。
也就是说不同于传统人脸抓拍机在前端抓拍图片、后端服务器分析比对,运用瞬视系统可在前端实时做智能分析,从而使得摄像机整体更加简洁高效。
肖洪波表示,瞬视系统可以通过前端进行底层ISP调节,进行智能处理后,区分光线变化,进而实现清晰的成像质量。
此外,传统人脸抓拍机还存在检测准确率不高、漏抓误报较多、人脸抓拍不清晰、图像质量不理想等局限。而瞬视系统人脸检测视频分辨率达到了1080P,检测帧率为30帧/秒,每帧最大人脸检测数超过100人(人脸像素:40),正脸检出率>99%,误检率<1%。
采访最后,肖洪波重申道,随着AI的进一步发展及落地应用,各行各业都会出现较大的产业分工,每家厂商都应该专注自身的优势领域,为行业提供不同的优秀解决方案,只有各家将自己擅长的技术融合在一起,才能更好地促进行业进步。
对于企业自身的发展,肖洪波坦承说,创业初期,‘方向’问题比较头疼,但通过多年摸索之后,触景无限目前的方向、定位非常清晰,思考得最多的问题也就是:如何通过前端软件算法及硬件传感器,去更好解决现实场景中遇到的一系列此前行业中尚未解决的难题。
而对于未来,严谨的理科生并没有夸夸其谈,“目前触景无限要做的就是进一步深耕安防领域,稳扎稳打地走好接下来的每一步:从产品角度出发,基于瞬视、盾悟两大产品系统,去接触更多的合作伙伴,落地更多区域;从算法层面出发,自修的同时也会与市面上的一些企业合作,为用户提供更好地软硬件一体的解决方案。”