科技界当红IP兼KOL凯文·凯利曾经说过,未来二三十年,人工智能将会广泛存在于人类生活中的方方面面,“人工智能+X”将会成为企业的创业趋势。2017年被称为AI人工智能的元年,两年间各行各业涌现出大量的“人工智能+X”型创业企业。
AI人工智能以超越想象以外的速度,穿透生活,触摸行业的脉搏,消融山与山之间的壁垒和边界。信息、数据的存在形态由固态、限定变得流动、不定。“科技本身是一种生命体”,抛开人工智能创造的思维、思考,能否真正优于生命体的感知、认知。“万里蹀躞,以此为归”。推动AI内容的落地生根,回归技术本位,才是AI浪潮下的“必然”结果。
近日,雷锋网揭晓的AI最佳掘金案例年度榜单中,搜狗同传、图普科技、网易云易盾、影谱科技、品友互动成为AI+内容领域中的翘楚。企业发展的成长速度拥有两条曲线,“第一曲线”处于发展初期,是均速、缓慢的,增长到一定阶段会停止、下降。达到“第二曲线”后,企业发展呈指数级增长。
这五家AI+内容公司,无一例外,没有停滞于已有现状。面对“变革”,不仅知晓趋势,更找了到迈入“第二曲线”、实现“二次增长”的钥匙。
2016年诞生,2016年首次亮相乌镇互联网大会。精准、及时的实时翻译给行业留下了极为深刻的印象。2016年至2018年,两年多的时间,搜狗同传已经成为国内、国际各种会议的“标配”,支持过GMIC大会、TechCrunch国际创新峰会、2018 CNCC中国计算机大会、2018中国网球公开赛、2018世界物联网博览会、GATIC、数博会、世界电信和信息大会等等百余场会议。
搜狗同传具备听、译、改三种功能,根据用户发音、语音短剧、语音识别、文本断句完成机器翻译功能。传统机器翻译,将流程分为对齐模型、分层模型等,再将不同模型串联起来,不同环节的模型上下游影响甚密,连带关系较强。与传统的机器翻译不同,搜狗叠加了语音识别和机器翻译的技术。将神经网络精简为五层,低于谷歌的GNMT八层结构。采用端到端神经网络翻译技术,通过循环神经网络生成最终结果。即将多个模型融合统一为一个模型,直接将影射文本输出为文字。
搜狗同传在语音识别方面,采用CLDNN+CTC结合的声学模型和RNNLM语言模型,将通过语音断句后的片段,经过声学模型、语言模型转化成文本。文本断句处理在语音识别和翻译之间,以规则、模型两种方法进行语句划分和标点,平滑去掉无意义的词语。
语音断句方面,基于能量检测和DNN模型的方法,叠加后处理平滑算法,对语音信号进行语音、静音判断。从而,跳过静音片段处理提高解码效率,语音片段分割为多句并行识别,提高语音识别效率。保证识别输出结果更加通顺、流畅,符合正常的发言习惯。
机器翻译方面,采用双向 GRU 技术构建编码端的结构,attention 机制。添加命名实体标注模型(NER)和神经网络实体翻译器、多模型集成(ensemble)、重打分/重排序(rescore or rerank)、网络层正则化(layer normalization)等机器学习模块提高翻译质量。
搜狗同传在算法和数据领域的双重积累,可以流畅纪录、较好时别词语和句子的停顿,输出翻译内容。
互联网每分钟、每小时之内就会产生大量的用户视频、图片数据,这些数据的处理、审核已经成为不同平台管理者最为头痛的事情之一。而图普科技就是一家以“鉴黄”、“鉴暴”在业界小有名气的AI公司。图普科技成立于2014年,是一家专注于AI识别的云服务公司,是国内最早为互联网企业提供内容审核的AI公司。其客户来自于各行各业,包括大家熟知的美拍、秒拍、酷狗音乐、唱吧、唯品会、bilibili、花椒直播、迅雷等等互联网公司。
图普科技采用螺旋式渐进的商业模式,即客户提出需求,图普根据需求进行开发,平台增加新的功能,客户再提出新的需求。循环模式下,进行业务能力的积累和改进。今年5月,顺应市场监管需求,图普科技上线内容审核产品2.0。增加对低俗内容的审核、视频理解等等,完善内容审核服务。但图普科技的AI技术又不局限于内容安全的审核工作。从内容推荐、视频内容识别的增值服务再到对零售门店视觉感知智能化改造,图普科技的触角在与时俱进地不断延伸。
图普科技每日处理图像识别量超过10亿次,云端拥有几百个图像识别接口。巨大的处理需求,需要AI公司具备数十亿级海量AI服务框架、海量数据管理构架、商业级AI服务架构三个层次的互联网架构。图普科技的图像识别云服务提供包括人脸识别、物体识别、人行为分析、文字OCR、图像搜索等在内的几百个图像识别定制与开放接口。
目前,图普科技的色情召回率较行业排名第二的公司高10%,在百万规模识别的面目识别算法测试中,图普科技获得全球第二名。在行人再识别测试中,图普科技数据在已公开论文中排名第一。内容审核产品1.0,囊括了危险行为,如酗酒、飙车等;成瘾性行为,如吸烟、性暗示等;亚文化,如荒诞、未成年人直播等;以及网络暴力言论四类低俗化问题。内容审核产品2.0在此基础上有了更为细致的划分、升级。
在新零售行业,图普科技利用AI技术深入到零售的每个环节,如店外客流、进店客流、购买客流、复买客流;坪效、货效、场效、钱效等环节数据分析,助力企业吸引客流、分析客流、提升客流购买转化率等。85%的商业行为发生在线下,零售行业是安防领域以外使用摄像头最多的应用场景。图普科技利用云+端服务的模式,螺旋渐进广度扩展建立商业闭环。在除图片、视频识别外,对新零售等新领域进行技术服务的探索。
网易云易盾为网易云旗下一站式云安全服务,2016年正式上线。产品包括四大类:内容安全、业务安全、移动安全、网络安全。内容安全具体细分为,文本检测、图片检测、视频检测、音频检测。业务安全有行为式验证码、短信验证码、注册保护、登陆保护、营销反作弊、实人信息认证。移动安全包括手游智能反外挂、Android应用加固、IOS应用加固、SDK加固、安全组件。网络安全产品包括,DDoS高防、渗透测试、Web应用防火墙。总计数十条产品线。
解决方案囊括社交、短视频、直播、游戏、媒体等等。在内容安全领域拥有21年专业防护经验和大数据积累,随着图片、视频在内的内容形态爆发增长,网易云易盾每日过滤有害信息超10亿条。依靠海量的特征库和成熟的安全机制,结合云计算和人工智能技术,具备多场景解决方案。服务客户包括携程、和讯、魅族、OPPO、秒拍、一直播、滴滴、恒大、adidas、NIKE等企业。
信息理解方面使用深度网络方式提取图片语义信息,以NLP技术来对OCR抓取的文字信息进行情感、意义的理解,综合对图像、文字的理解进行有效的信息判定。声纹识别技术方面尝试端到端声纹技术辅助身份验证。技术层面拥有机器算法模型、海量样本库,具备秒级违规镜头处理能力。支持视频过检,以及视频中涉嫌违规音频的过滤。配合智能电视墙,可节省人力成本90%以上。
网易云易盾第三代人工智能内容安全服务提供鉴黄、鉴暴恐、涉政、ASMR、广告等八个大类数十种小类有害内容智能识别过滤服务,智能识别精准率超过99.8%。2018年,网易云易盾助力国内互联网企业出海,陆续推出海外版本产品。支持多语言、多民族内容安全服务,对英语、马来西亚语、泰语、印尼语等海外语种提供策略支持。并在该国家设立政策研究员、AI算法工程师、策略优化、运营服务等在内的专项服务小组。提升语种识别、处理效率、安全标准提升、审核内容团队运营的能力。
据雷锋网了解,网易云易盾内容安全技术实力强悍。不久前,易盾实验室AI算法研究员方正的论文《MULTI-VIEW AUTOENCODER FOR IMAGE FEATURE LEARNING WITH STRUCTURED NONNEGATIVE LOW RANK》提出了一种对多视角多模态特征信息进行有效融合的自编码器神经网络,在准确率、NMI、Purity、ARI等各项性能指标上创新高,较当下多项国际先进的多视角多模态信息融合技术有显著性领先。有效地提高了有害内容的识别率,网易云易盾内容安全的准确率和召回率更上一个台阶。
2017年底,工信部公示网络安全示范项目中,网易云易盾“自适应DDoS攻击深度检测和防御系统”入选为示范项目。2018年,成功入选2018安全全景图。2018年11月,网易云易盾成为中国短视频及直播联盟常务理事。共享违禁MD5视频公库,实时拦截违规视频,支持企业自定义添加私库。特别针对短视频行业,提供鉴黄、登录保护、视频评论检测、视频弹幕检测、活动防刷等一站式安全解决方案。
影谱科技成立于2009年,致力于智能影像生产技术落地应用的视觉技术企业。聚焦于AI+大文娱产业,专注计算机视觉、视频结构化、深度学习、大数据、视频广告投放、网络视频互动技术等领域,面向互联网、影视、视频等大文娱产业细分领域提供AI影像场景商业化服务。产品包括植入易、Video易,提供广告投放平台、媒资管理平台、数据管理平台三个方面服务。
合作伙伴包括腾讯视频、暴风影音、搜狐视频、迅雷、芒果TV、华数TV等。具备像素及子像素计算、三维重建、3D视觉、视频细粒度分析、结构化等准入技术,利用大数据和AI+video技术提供代替人工拍摄及制作工作的完整数字化媒体解决方案。是互联网视频垂直领域访问流量最大、活跃用户数最多、覆盖资源最广的平台。2017年影谱科技完成4.46亿秒工程处理积累,累计为15万部内容提供技术服务,行业用户渗透率超70%。
国内热播的《声临其境》、《我是歌手》、《爸爸去哪儿》、《快乐大本营》、《天天向上》等综艺热播栏目,2017年的《楚乔传》《择天记》《三生三世十里桃花》等影视作品,都大量采用了影谱科技的人工智能视觉技术。
2018年8月,影谱科技完成D轮13.6亿元融资,投资方来自商汤科技Sensetime、PAC、软银中国等。紧接着,9月,影谱科技再获曜为资本追加的2亿元D轮融资。此轮融资后,影谱科技不但获得商汤增强现实、视频分析、底层AI算法的支持,还将继续深耕影像技术的优化、AI+大文娱行业的应用拓展、完善人才梯队建设等。
品友互动创立于2008年,采用全球数据挖掘和机器学习算法,在广告营销领域引入大数据研究方法。实时竞价架构和算法、人群分析专利技术结合运营商在内的第三方数据商建立资本、战略合作关系拥有数据资产,进行一站式智能营销决策管理和优化。
2011年,品友互动发布实时竞价广告决策系统。2012年,发布了数字广告人群类目体系(DAAT),用标签方式实现人群画像分析。2016年,推出全透明的智能数字营销决策平台(Trading Platform) —擎天柱(Optimus Prime),以系统性的方式保障透明和安全的广告投放。
2017年,品友推出人工智能决策平台——Marketing Intelligence Platform(MIP)。每天处理数据高达 PB 级别, 每秒智能决策 40 万次。占有国内品牌程序化广告市场59.8%的市场份额,为超过1800家企业提供数字广告技术服务。与国航、通用、联想、华为、苏宁易购、亚马逊、中国电信、联合利华等300家世界500强企业展开合作,为数十家客户搭建DMP平台。
2017年上线的MIP(Marketing Intelligence Platform)平台,有效整合了DMP数据管理平台、CMP内容管理平台和PDB智能投放管理系统三大模块。智能策略引擎DMP整合媒体价值洞察、人群深刻洞察、科学归因模型,智能内容引擎CMP包括创意内容云端管理、产品改建创意测试、自动创意物料调优。导出智能化营销策略,对接到智能投放管理系统(程序化广告投放、常规广告投放管理、社交广告管理、电商投放管理)。最后,智能投放管理系统再反哺于DMP、CMP。其中,擎天柱系统Optimus Prime具备自动化、实时化、智能化、透明化四个特点。
2018年9月,世界人工智能大会上,品友互动声称将40%-50%的费用用于研发投入。成立了AI Lab企业级AI 实验室,与海内外多家顶级院校进行合作。与此同时,宣布设立10亿人民币AI 投资基金,聚焦于中早期、有技术优势、有潜力的企业级产品和项目,进一步专注AI+实际场景的结合应用。
2018年是人工智能企业加速分化的一年,一方面,人工智能技术在持续、不断地迭代。另一方面,人工智能技术技术在与实际落地场景的结合上,仍然存在很多痛点。从整体行业环境来看,2018年下半年,BAT均进行了组织架构调整。无论是腾讯的云与智慧产业事业群CSIG、阿里巴巴云事业群升级为阿里云智能事业群,还是百度将ABC智能云事业部升级为智能云事业群组ACG。智能、云计算、To B都成了三家企业架构调整的关键词汇。
2018年末,资本渐渐开始理智,动作变得缓慢、有节制,行业“凛冬”到来的论调被广泛传播。然而,搜狗同传、图普科技、网易云易盾、影谱科技、品友互动这五家雷锋网评选出的AI内容领域独角兽丝毫未受到任何不良环境的影响,企业业务仍在高速增长,融资金额在持续加大。仔细观察这几家独角兽的特质将会发现,激战市场的筹码,从来不是随便虚晃一枪,而是过硬的技术储备、技术积累,在AI深耕的决心与魄力。