粤港澳大湾区创新引擎——深圳正在揭起AI千人创新浪潮!
由深圳市主办的全国人工智能大赛复赛正在火热进行中!自开启报名以来,大赛吸引了来自13个国家的4253 人报名参赛,选手来自300+顶级高校和800+名企。选手共计有1万6千余次的AI作品提交,双赛项每个赛项最终选出前 100 支晋级团队。他们是粤港澳大湾区乃至世界人工智能科学发展的重要支撑、产业创新的活力之源。
千名AI人才为何参加年度权威赛事?优秀AI团队有何特质和梦想?今日起,南方+联合鹏城实验室、新一代人工智能产业技术创新战略联盟(AITISA)开设AI追梦人系列报道,专访大赛优秀团队,和他们一起在AI世界逐梦而行。
在AI+4K HDR赛项中,一名在读研究生和一名算法工程师组成的团队“Webbzhou”,获得初赛中AI+4K HDR赛项季军。正是通过校企联合、产学结合的方式,使团队在参赛中获得技术和创新上的优势。
用学术前沿解决工业实际问题、产学研的打通已经成为青年AI研究者的普遍共识。“AI会渗入到各行各业当中,目前希望能够在学校继续补充基本知识,同时在公司进行相应的实践,提高自己的动手能力。”Webbzhou参赛者周远波说。
比赛思路:
校企联合带来创新优势
我们的团队是由一名来自福州大学物信学院在读研究生以及一名福建帝视信息科技有限公司的算法工程师组成。团队中一人负责数据处理,一人负责算法设计,同时一起进行算法实现。
这次比赛是目前国内最顶级的人工智能赛事之一,我们希望通过比赛结识志同道合的朋友,在参赛过程中进一步了解前沿实况,并在实践中锻炼能力。
凭借福州大学和福建帝视信息科技这样一种校企联合、产学结合的方式,我们团队在本次参赛中获得了技术和创新上的巨大优势。借助学校研究资源,我们则能够获得丰富的理论基础;而借助公司平台,我们能够了解行业技术发展动向及实践经验,为本次参赛提供良好的技术背景和创新思维。
参赛收获:
查阅大量文献寻找灵感
从赛题 AI+4K HDR 的题面来看,它包含了三个关键词,这三个关键词:
AI,计算机视觉近年来凭借深度学习的发展已遍地开花,在画质增强技术方面有了极大的进展,如 RCAN/ESRGAN/EDVR 等针对图像视频的超分模型一次次刷新指标的天花板。
4K,目前的视频规格已经从高清转向4K。4K 视频的拍摄、存储、传输的代价都是十分高昂的,如果能在终端将高清甚至是标清的视频以无损画质的技术转为 4K,那意味着可以在编码传输过程中节省大量的带宽成本,因此超分具有巨大的潜在商业价值。
HDR, HDR 可以提供更多的动态范围和图像细节,因此近年来 SDR 2 HDR 也成为高画质视频图像中必不可少的一个技术环节。
结合当下亟需解决的问题而言,这次比赛是为了利用 AI 画质增强技术,将标高清 SDR 视频尽可能无损地转换到 4K HDR 视频。
我们研究方向主要是图像/视频增强与超分,因此我们会阅读大量的图像/视频处理文献。拿到数据后我们对数据进行了抽帧、切分、清洗。经过方案设计和讨论,再到具体的实验设计与分析,我们投入了大量的精力。
在这次比赛前,我还参加过其他类型的人工智能大赛,但感觉这次比赛的规模更大,领域更专,比如从初赛而言,虽然看上去只包含降噪和超分任务,但视频退化比实际复杂很多。参赛者有来自高校和企业界的研究者和工程师们。这次打比赛也是锻炼自己解决问题的能力,通常需要查阅与阅读大量相应的文献,来寻找灵感。
行业观察:
关注三维重建、图像/视频增强和超分领域
关于AI中的三维重建、图像/视频增强和超分是我目前最关注的的领域,因为他们的市场广阔,前景好,也是我比较感兴趣的领域。
4K视频的拍摄、存储、传输的代价都是十分高昂的,如果能在终端将高清甚至是标清的视频以无损画质的技术转为4K,那意味着可以在编码传输过程中节省大量的带宽成本,因此超分具有巨大的潜在商业价值。
我们认为NAS(网络结构搜索)是今后的一大方向,可以通过定向搜索提高网络神经网络性能并降低功耗,加快AI+4K HDR 的服务端乃至终端的部署;另一方面,则是有监督向半监督或无监督方向发展,将真实场景低清数据分布转向非成对的高清数据分布,一则可直接利用互联网海量真实数据且不引入人为退化方法的干扰,二则可使真实场景落地算法具有更强的多样性、鲁棒性。
在全民AI时代,人工智能将渗入到各行各业。由于AI涉及到的知识领域较广,目前我希望能够在学校继续补充基本知识,后期会继续考虑读博深造。同时在公司进行相应的实践,提高自己的动手能力。
大赛官网:http://www.china-ai.ac.cn