明略数据创始人、董事长吴明辉
近日,明略数据在京发布“行业AI大脑明智系统2.0”。这是时隔一年后,明略数据基于“明智系统1.0”做的一次全面技术升级。
相比明智系统1.0,打通“感知智能”是明智系统2.0的业界首创。
其通过“符号的力量”完成对于行业数据中所蕴含知识的抽取、融合、推理、沉淀等一系列过程,实现数据的充分融合和碰撞挖掘,面向行业业务而构建的AI大脑。
成立于2014年的明略数据,是一家大数据&人工智能解决方案公司,他们深耕公共安全、金融、工业与数字城市等领域,从最初的大数据平台转型为“AI驱动的数据治理“,发展到今天打通感知与认知智能,拥有完整的行业AI产品与解决方案体系。
其A轮融资发生在2015年,获得硅谷天堂近亿元投资;2016年8月获得2亿人民币B轮融资,红杉中国领投,分享投资、任子行以及硅谷天堂跟投;并已于去年完成10亿人民币C轮融资,华兴新经济基金、腾讯产业共赢基金是本轮投资方。
从过往来看,大部分AI创业公司都在做一件事:take X;add AI。明略数据也不例外,但是明略在数据治理方面的优势使其走出一条不同的路。
他们是将企业数据构建成一个知识图谱,然后通过行业AI应用去实现人机同行,找到其中的数据价值。总结来说,就是利用数据为企业、组织打造知识图谱,然后利用AI提升业务效率。
以最新发布的AI产品&解决方案体系“明智系统2.0”来说。它的治理工具和NLP处理架构都是基于分布式框架运行,以更好处理数据量大、结构复杂的问题。
明略数据创始人、董事长吴明辉告诉雷锋网,它主要由两大部分组成:感知和认知。
与明智系统1.0相比,各类数据在升级的明智系统2.0中汇聚,进入“符号化”的过程,实现数据的充分融合和碰撞挖掘,从而有效的面向行业业务构建行业AI大脑,由此,明智系统2.0通过“符号的力量”完成对于行业数据中所蕴含知识的抽取、融合、推理、和沉淀等一系列过程,打通感知智能。
强化认知智能是明智系统2.0的升级亮点。多元异构数据通过强大的动态索引及知识分析技术被充分融合,在此基础上逻辑推理及复杂运算得以开展。基于语义的分析检索等各类场景应用可以通过强大的引擎“明察”被加速完成。
同时,企业级Siri“小明”作为人机交互入口,极简易用,也是明智系统一大亮点。
在这其中,最值得一提的是由明略数据自主研发的混合型知识存储数据库—NEST存储。
通常,传统数据库需要有DBA背景才可用,数据存储以结构化为主且有数据量限制,不易拓展。另外,存储数据对象为陈述性知识,搜索代码繁琐,仍需人工推理,知识调取效率低。
相比之下,明略数据知识图谱数据库“NEST”,通过分布式知识图谱,存储陈述性和程序性知识,不仅存储多元异构的大规模数据,还能存储基于数据的规则与模型,除了解决“做什么”的问题,还能提示人类该“如何做”。
用吴明辉的话说,明略系统2.0的高能之处在于能够加之辅助分析,从而进行自动推理,以有效节约客户知识调用的时间。即便是非计算机专业的普通用户也能应用自如。
从“做什么”到“如何做”。简单的三字转承涵盖了多数AI研究者毕生的努力方向,但就目前来说,想要完美跨越还较为复杂。
以AI较为中意的安防领域举例来说,在模拟、数字时代,安防摄像头都在“傻瓜式”地“工作”,不知‘自己’需要抓拍行人、车辆还是其他事物,也不知‘自己’已经处于何种环境之中。
赋予AI智能之后,普通IPC便有了一些智能,能够有效提升摄像头的工作效率及使用效果。但与此同时又会出现一个问题:每一个摄像头每天都会存储海量多元数据,如何针对单一数据做数据关联并给出快速反应,考验着所有的AI安防从业者。
类比人类,每一个智能节点(IPC)都相当于一个大脑,每天大脑都会接受海量的包括视频、音频、文字、图片等多元数据。如果这些繁杂的数据处理不得当,很容易让人产生负荷,甚至奔溃。
在吴明辉看来,如果将这些海量的重要信息转化为“符号”,再配以“感知系统”,人们小小的大脑空间就可以储存众多复杂信息。
他解释说,符号是人类认知的基础。AI最底层的包括知识工程、知识图谱都是其中的符号化的核心个体组成。
在具体应用中,这些被符号化的数据信息是可以极大提高后台运算效率的基础元素。而最终所有的符号汇聚,也就形成了上文所提的NEST蜂巢知识图谱数据库。
在这个数据库中,存储着各种各样的文本、视频、音频等多媒体数据。当这个数据足够多时,它不再是简单的处理系统,而是有了像人的左右脑一样的完整系统。之后,系统也可以像人类一样有逻辑地去推理和思考。
比如说“他是谁”这个问题,明略数据该系统就可以把“他是谁”“翻译”成真正的与身份特征相关的包括身份证号、护照号、手机号等在内的ID,这些信息都可以在后台通过符号化处理的数据结构进行索引,并马上搜索出来。
换句话说,“认知” 就是知道谁是谁,感知就能知道他的关系构成(自我思考)。AI及知识图谱的连接可以将感知和认知联结在一起,组成新一代完整的人工智能系统。
谈到这里,也许很多人对于“感知”还是比较陌生,其实感知智能在我们的日常生活中已经无时无刻地存在着:
譬如智能音箱,用户通过语音控制音箱播放或者暂停歌曲并非智能。真正的智能音箱应该能够以“更好地发声”为前提,通过对环境的感知,为用户展示最好的聆听效果。
比如苹果的HomePod音箱,它可根据声音折射,‘知道’自己被放置在一个多大的空间中,以及在空间的哪个位置,从而自动调节它自身的五个发声单元,为用户呈现最佳的音响效果。
譬如空调,它并非自动根据室外温度而自动调节送风模式。而是能够通过前端的两个摄像头,知晓房间的大小、人数、这些人是运动的还是静止的、体温状况、房间有无阳光直射等环境。然后通过对这些外部环境的感知,改变其送风模式及温度;
如此等等。
只是这一次,明略数据将感知能力赋予城市AI大脑中以更好打通数据闭环。
吴明辉表示, 以往,大多数AI公司会聚焦在某一个技术环节,而没有人真正的把完整的人工智能串联起来,而明略数据要做的便是整合服务,要做的就是将数据‘深度’结构化。
这个过程实际上就是在构建行业的知识体系,很多行业知识是之前行业专家沉淀出来的,他们要利用AI将这些数据变为知识经济。
他笃信,所有的感知计算本质上来说都是在给认知计算提供数据基础。明略数据推出的这个系统从某种意义上来说已经打通了感知计算、认知计算、感知智能、认知智能,形成真正的人工智能的闭环。
作为大数据与人工智能独角兽,明略数据在业界首创“符号主义和深度学习有效结合”人工智能顶层设计,在其行业AI大脑“明智系统2.0”中打通感知与认知智能,以推动人机同行,让AI真正创造商业与社会价值。
过去四年时间,明略数据凭借此已在全国服务了几十个省市的公安局,为公安客户实现5-20%的破案率的提升。
在金融行业的实践中,他们完成了全国首个银行业全行级知识图谱数据库。在某全国大型股份制银行项目中,依托全行近十年全量数据,构建了“企业、个人、机构、账户、交易和行为数据”总规模达十亿点、百亿边的知识图谱平台。该平台突破性地展现了全行完整的客户关系网及资金流转全貌,完善了银行整体风险管理能力,提升了银行风控效率。
在城市轨道交通领域,明略数据服务上海地铁车辆分公司实现国内首个车辆全生命周期数据管理的智能化平台。他们通过帮助轨交运营单位有效提高工作效率,降低安全风险和运营成本,助力轨道交通行业向信息化、智能化迈进。
可以说,明略数据在推动安防、金融、工业、数字城市等领域的智能化升级方面积累了丰富的技术解决方案与成功案例。
未来,他们还要基于这些数据去做完整的AI大脑,包括公安大脑、工业安全大脑、金融风控大脑,数字城市大脑等等。
“当然,在这个行进过程中肯定会遇到技术同质化的问题,AI算法在上个世纪就已成熟,只是缺乏足够的数据和计算资源来支持。”吴明辉总结说。
“但所有的程序都离不开数据模型,AI算法更需要基于对数据的理解。基于此,明略数据将持续理解行业业务,构建领域知识图谱,将知识图谱与AI算法相结合,构建企业AI大脑,从而完成人工智能的可复制应用。”雷锋网雷锋网