7月8日,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的CCF-GAIR 2017全球人工智能与机器人峰会在深圳大中华喜来登酒店举行。在AI+专场第二场,慧川智能CEO康洪文为我们带来了《AI(爱)让视频更简单》的主题演讲。
对于视频从业人员来说,“加班”、“熬夜”这样的词汇常常出现,他们的工作异常辛苦,那么,究竟该如何改变现状,请看康洪文的描述,通过AI让视频如何让视频创作变得简单?
AI助力视频创作的背景:
视频工作者有非常强大的图文创造能力,有强大的讲故事的能力,不应该让他们的创造力被制造视频的烦琐工作局限掉。
视频市场特别是短视频市场是爆发趋势,目前的视频网络用户已经突破了5.5亿,保持着8.1%的增长速度。很多图文媒体去转作视频,希望在视频市场上获得更多的受众。
在今日头条还有微信公众号平台去统计,里面67%的文章都非常适合用视频的方式来呈现。另外传统的网站以及像电商,淘宝上有十亿级的商品,上面很大量的商家都希望能够为他们的商品制作视频。
智影的产品功能实现:
基于网页的界面,通过界面能够把任何一个网页或者一段文字输入到输入框中,后台的AI算法就会根据这段文字进行分析,找到里面所有这些关键点。
通过文章的语义分析,就能够自动和素材进行匹配,对每一段话、每一个句子找到对应的多媒体素材,比如说图片、视频、社交媒体分享,找到以后自动生成的故事线,在后面还有一些延伸的广告进行匹配。
如果有修改需求,可以再进行修改。提供一个非常简便的在线剪辑和预览平台,客户只需要注册一个账号就可以进行剪辑了。根据用户修改之后,可以在界面上进行素材的调整,比如说还可以截取每个视频片段的长度,起始的时间,甚至在图片上添加一些像画字或者文字的信息。
具体的优点:
通过这个系统能够提升用户的效率近百倍,以前可能会花几个小时去做一个视频,现在通过智能手段能够压缩到几十秒钟。
用户满意之后可以直接点击生成视频,在云端这个视频就可以生成下载好。不用很强大的机器,在任何一个咖啡馆,任何一个笔记本就可以完成这样的创作,完成之后回到家这个视频一键下载好,已经上传到所有的社交媒体上去了。
所用到的技术:
计算机视觉。刚才讲到会去素材库跟结构化素材进行匹配,对所有的素材进行理解,现在已经能看到计算机视觉里面有一些突破性的进展,比如说场景的识别上,计算机的识别能力已经在接近甚至是超越人的识别能力。
自然语言处理。在这方面我们用到了知识图谱,比如说情感识别,名实体识别。
大规模计算。现在GPU的发展速度非常快,将GPU和深度学习这个框架结合起来。
现在所做的动作:
分析海量视频素材,以及图片素材和多媒体素材。通过将素材进行结构化,理解视频里面出现的所有物体和人,以及他们正在进行的动作,能够把它构建一个精确到每一帧的视频内容标签。
开放API。这能够帮助所有对视频有需求的人进行理解,提供这个视频进行全网视频的结构化。这里面包括两个主要功能,一个是视频内容的理解和标签化,我们提供包括时间、地点、人物、事件的多种标签,这里面有一千多个视频结构化标签。另外我们还创造了全球500+明星的数据库。
详细内容请看雷锋网后续报导。雷锋网原创。