2020年「新基建」的到来,为AI产业化发展掀起一股巨浪。
AI领军者们在新基建战场上献策献力、崭露头角,不断推动着AI技术升级和产业化落地。以GPT-3为首的自然语言处理技术取得革命性突破,计算机视觉、语音识别等技术快速升级迭代,2020年涌现出大批智能化产品和解决方案。
与此同时,AI产业化落地成果也在不断凸显,智能虚拟助手、3D场景化设备、视频特效、网络安全正在加速渗透到人类工作、娱乐、生活的方方面面。
总之,如我们所见,AI正以超越想象的速度,穿透生活,触摸各行各业的脉搏。
在此背景下,针对各家企业在AI细分领域的创新,雷锋网「2020最佳AI新基建年度榜」特设了五个“AI内容新基建”奖项。
经过多轮筛选和专业评审,评选结果终于在日前正式揭晓。快手科技、影谱科技、众趣科技、网易易盾、腾讯云小微五家公司,凭借独特的技术优势和产品优势在众多优秀竞争者中脱颖而出,分别获得了“最佳AI特效奖”、“最佳AI虚拟主播奖”、“最佳VR新基建奖”、“最佳AI虚拟助手奖”。
Y-tech是快手科技旗下人工智能实验室,成立于2015年,专注于计算机视觉、计算机图形学、机器学习、AR/VR等领域的技术创新和业务落地,不断探索新技术与新用户体验的最佳结合点。
通过算法框架设计创新和模型落地性能优化,在充分利用当前设备算力的前提下,快手Y-tech为广大用户呈现了超现实的视频特效新体验。
“童话魔法”是快手Y-tech基于生成式算法的视频特效技术,可以让用户在手机端上实时预览自己变身公主、王子的神奇效果,生成的图像不仅有着浓浓的童话风格,而且还保留了用户自身的容貌特点。快手Y-tech采用自研KStyleGAN结构,在3D空间中表征人脸结构和进行风格映射,并采用神经网络渲染来精细控制结果图的质感,有效克服了常规基于2D表征的StyleGAN方法的缺陷,并在移动端上落地了实时特效。
针对当前的技术现状和难点,快手Y-tech“童话魔法”进行了多项技术创新。在模型结构方面,提出风格迁移注意力模块STA module,用以改进浅层和深层特征融合方式;用多分支、多深度的特征增强模块FS block替代传统的ResBlock结构,在更少计算量下,增强特征细节和整体形变的适应能力。
在模型训练方面,运用半监督学习混合训练方式,实现了效果和时序的双重稳定性;设计多任务多尺度监督,加快模型收敛,提升生成质量与鲁棒性;引入预训练特征,强化模型对于细节纹理的生成能力。
在落地性能方面,进行了横向和纵向的算力分级;针对不同计算场景设计不同的模型结构;引入了模型服务器分级下发机制,下发和加载该机型对应的模型充分利用设备算力。
影谱科技是国内领先的智能影像生产技术提供商及应用方案提供商。
以人工智能视觉技术产业化为主要目标,影谱科技专注于视觉内容的生产效率与呈现交互方式的技术研究,通过影像增值ACM(Automatic Content Marketing)+智能生产AGC(Automatic Generated Content)+数字孪生ADT(Automatic Digital Twin)三重商业增长引擎,为传统行业实现数字化升级,降本增效、提升体验、塑造全新业态。
凭借智能影像技术优势,影谱科技已面向智能媒体、文娱、科教、数字新零售等多行业领域提供一站式的智能解决方案。在媒体领域,影谱科技研发虚拟主播自动编辑和生成系统,提高了虚拟主播合成的准确度与清晰度,并通过低延迟优化技术显著减少了生成时间,实现了虚拟主播的低延迟流式生成。
影谱AI虚拟主播对高时效有强烈要求的场景有着极大地应用价值。除了可以在传媒、科教、客服、零售等领域广泛通用,还可以在政府机关、科研单位、企业展厅、博物馆等公共场所,通过落地一体机终端的形式提供多元化技术服务。
未来,影谱还将持续赋能更多行业领域,拓展更多应用场景,通过规模化智能应用,力促“数字经济”、“智慧媒体”、“媒体融合”、““国家现代化教育2035计划”等国家战略计划实施,为创建全新智能影像数字生态圈,助推数字中国高质量可持续发展持续发力。
众趣科技成立于2014年,是全球领先的VR数字孪生云服务提供商,基于AI机器视觉和云服务技术,专注于大空间3D数字化研发和技术服务。
凭借自主研发的数字孪生AI 3D视觉算法与互联网三维渲染技术,众趣科技为众多行业企业提供低成本、更高效、更便捷的3D实景数字孪生解决方案,涵盖VR看房、场景购、智慧安全、数字文旅、虚拟展馆等细分化行业场景。
具体来说,众趣科技研发了基于深度视觉技术的专业相机和云端重建、展示技术。专业相机中使用了Kinect类或激光雷达的深度传感器,拍摄目标场景或物体的深度图像,再将这些数据上传到云端进行降噪、特征点提取,将图像中的深度、纹理等基本信息一一匹配,再结合相机的相关参数,重建出3D场景的模型。
2020年使用众趣的产品及服务,完成100m²房屋的信息采集仅需要20分钟左右的时间,后期处理大约需要30分钟左右;制作完成的模型数据量仅是同样信息量视频的1/5,同时可以在场景内任意添加标签信息 (文字/图片/声音/视频链接) ,并能够在浏览器端和微信端直接展示。
目前,众趣科技的产品及解决方案已为上千家大中小企业提供服务,包括阿里巴巴、京东、Intel、宜家、红星美凯龙等知名企业,涉及房屋租售、酒店宾馆、家装家居、文博展馆、电商零售、健身、娱乐、学校、工厂、建筑等众多实体领域。
未来,众趣科技将持续加强自身技术研发能力,并不断与多领域企业合作,打造针对全行业VR数字孪生云服务解决方案,加码VR+技术领域多端融合。
网易易盾是网易集团旗下一站式云安全服务商,成立于2016年,致力于面向数字化业务提供内容安全、业务安全、移动安全和和网络安全服务。
在内容安全领域,网易易盾通过深度学习技术,拓展精细化分类审核需求,不断适应新型样本对抗,让算法了有更好的实时识别能力。目前,模糊化、涂改、掩盖、手写手绘等早期复杂内容的对抗样本已经可以通过深度学习模型直接处理。
此外,对于直播、教育、社交等更多类别产品的内容管控需求,网易易盾采用特征分层的多模型融合方法,不仅让服务有能力准确完成精细化分类任务,大规模节省计算量,还可以同时为服务性能和效果提供保障。
最后,面对业内最具挑战性的攻防对抗问题,网易易盾凭借先进的技术优势,设计了一条安全防守技术路径,包括敏捷发现、精细排查、全面布控三个主要环节,最大限度地降低了防守时间的滞后性,以及攻击对业务可能的影响。
作为一家先进的安全厂商,网易易盾强调模型实时拦截能力转向为审核团队提供更有效的技术工具,通过多维度、多因子技术能力协同作用实现防控。
目前,通过人工智能技术已全面赋能企业客户拦截色情、低俗、暴恐、违禁等各种类型的不良有害信息。随着业务的发展,易盾检测能力的覆盖范围将会越来越广,涉及的细分领域也将越来越多。
作为“AI虚拟助手”解决方案,腾讯云小微有形象、有情感、更聪明。依靠AI语音交互、知识图谱、IP虚拟形象、全双工等优势能力,可以成为“虚拟客服”、“AI老师”、“虚拟导游”,助力企业数字化升级,实现降本增效。
腾讯云小微专注于更自然的人机交互体验,拥有全链条的语音语义能力,从唤醒到语音识别,到语义理解,语音合成,知识图谱,将传统机器人真正升级为了能听、会说、知识全面又善于表达的“AI虚拟助手”。目前已在家电、教育、出行、文旅、政务等领域都有落地应用。
此外,腾讯云小微结合IP形象,提供了虚拟客服、虚拟主持人、虚拟助理、虚拟导游等视觉体验、情感体验更丰富的虚拟人方案,让IP持续产生衍生价值。如与腾讯AI Lab 联合打造的那笙,以知名主持人春妮为化身的小春妮,以及2020中国数据与存储峰会主持人雨涵等。
腾讯云小微聚焦AI语音技术研究,致力于打造更自然的人机交互体验,让AI虚拟助手实现“听得清、听得懂、善表达”。目前,腾讯云小微在第八届国际对话系统技术挑战赛(DSTC-8)上获得了四项指标的世界第一。此外,基于ALBERT预训练模型,在大型深层阅读理解任务数据集 RACE 数据集(ReAding Comprehension dataset collected from English Examinations)上登顶第一。雷锋网雷锋网雷锋网