“2+1”技术体系，旷视驶向AIoT蓝海的「帆」

2022/07/15 18:08

7月15日，旷视举办了第二届技术开放日活动，旷视联合创始人、CEO印奇，旷视研究院基础科研负责人张祥雨、算法量产负责人周而进、计算摄影负责人范浩强等出席活动，介绍了旷视对于AIoT、AI基础研究的理解和实践。

锚定AIoT，构建“2+1”的技术科研体系

旷视将AIoT定义为“AIoT=AI+IoT+空间”。其中，“AI”和“IoT”是两个相辅相成的核心关键词。AI是不断演进的算法能力，如今越来越多的AI算法正在各行各业发挥核心的价值；IoT是软硬结合的设备载体，只有在特定的载体中，AI才能最大限度地释放其价值。

在此基础上，旷视还强调“空间”这一关键词，提出空间是应用场景的闭环。在过去二三十年，互联网、5G、AR、VR等技术的不断演进，给虚拟世界带来了翻天覆地的变化。但与此同时，技术对于物理世界的改造并没有发生根本性的变化。旷视认为，“Make the Physical World Better”将是未来AIoT从业者努力追求的方向。

为了支撑AIoT这一长期发展战略，旷视构建了“2+1”的AIoT核心技术科研体系，即以“基础算法科研”和“规模算法量产”为两大核心的AI技术体系，和以“计算摄影学”为核心的“算法定义硬件”IoT技术体系（包括AI传感器和AI机器人）。

AI为“本”，是旷视的核心技术能力；IoT为“器”，是旷视实现AI规模化落地的硬件载体。这一整套科研体系，涵盖了从基础研究、算法生产到软硬一体化产品的AI落地全链路。

视觉AI基础研究的新趋势：“大”和“统一”

基础模型科研是AI创新突破的根基。

在2012年AlexNet被提出之后，基于深度学习的神经网络成为AI视觉发展的主要原动力之一。神经网络根据用途、构建方式的不同，大致可以分为CNN、Transformer、基于自动化神经网络架构搜索的模型以及轻量化模型等。这些模型极大地推动了AI发展的历史进程。

到目前，旷视认为，“大”和“统一”已经成为视觉AI基础研究的最新趋势。

其中，“大”主要是指AI大模型，即利用大数据、大算力和大参数量，提高模型的表达能力，使得AI模型能够适用于多种任务、多种数据和多种应用场景。

旷视研究院基础科研负责人张祥雨认为，“大”是提高AI系统性能的重要捷径之一。但是，大并不意味好，片面地追求大参数量、大计算量和大数据量，并不一定能够实现更强大的模型，反而会产生更大的计算开销，令整体收益非常有限。

旷视基础科研倡导的“大”，是要以创新的算法驱动，充分发挥大数据、大算力的威力，拓展AI认知的边界。旷视关于“大”的研究，从实用角度出发，集中体现在大模型、大算法和大应用三个层面。

同时，AI视觉的研究领域众多，包括CNNs、VL Models、 Transformers等基础模型研发，物体检测、分割等视觉基础应用，优化、自监督、半监督等AI算法演化等。每个研究路径，都会衍生出一系列算法。

旷视发现，这些算法在底层正在走向统一。通过统一的算法、模型来表示和建模各种数据、任务，将产生更加简单、强大且通用的系统。围绕“统一”的趋势，旷视在“基础模型架构”、“算法”和“认知”，进行了全面布局。旷视基础科研的“统一”，集中体现在统一各种基础模型架构，从纷繁的AI算法中提炼其本质特性，使其能支持各种任务、数据和平台，并最终构建统一的、高性能的视觉AI系统。

在“大”和“统一”的理念下，旷视基础模型科研聚焦于通用图像大模型、视频理解大模型、计算摄影大模型和自动驾驶感知大模型四个方向，并取得了多项突出的科研成果。张祥雨强调，基础模型科研需要坚持长期主义，解决人工智能最本质的难题。

AIS平台让算法量产成为现实

“落地实用是算法价值的最终检验标准”。

旷视研究院算法量产负责人周而进表示，算法落地的主要挑战在于整个生产环节的复杂性上。具体来说，分为三个层面：第一，数据生产的复杂性。第二，算法模型本身的不确定性。第三，算法落地的AIoT硬件平台的多样性。

要解决这些问题，他认为“算法生产过程的标准化，是解决复杂的、碎片化的算法生产的有效手段”。这个标准化过程，包括了数据生产的标准化、算法模型的标准化和推理框架的标准化。

为此，旷视发布了自研的算法生产平台AIS（AI Service）。

AIS基于旷视Brain++体系，构建了一套覆盖数据处理、模型训练、性能分析调优、推理部署测试等算法生产全链路的零代码、自动化的生产力工具平台。AIS标志着旷视Brain++的又一次提升，让算法量产真正成为可能。

旷视 AIS 算法生产平台提供多种功能支持算法快速生产部署，可以大幅降低算法生产的门槛，提升算法生产效率。目前，AIS平台已经能够支持100多种业务模型训练，最快2小时即可完成，而且模型产出精度指标远高于业界平均水平。经验证，算法研发人员使用Brain++和AIS平台，可以实现智能标注平均加速30倍，自动学习训练加速4至20倍。

周而进认为，算法量产不是单一的产品，而是对AI生产模式的理念革新和生产力进化。旷视希望通过AI算法生产的标准化以及AI生产力平台的构建，极大地降低算法生产的成本和门槛，让更多人可以参与进来，促进算法在更多行业的落地。

AI传感器是“算法定义硬件”的核心单元

AIoT产生了丰富的应用场景，其需求在不断地改变与升级，这对于算法提出了越来越多的需求。同时，算法本身也对于硬件应该提供怎样的信息和输入提出了要求，甚至从根本上改造了硬件的形态与样式。

因此，“算法定义硬件”的全新理念应运而生。

以AI传感器为例，旷视研究院计算摄影负责人范浩强认为，随着AI、视觉算法等领域的发展，传感器将不再单独的、直接地提供应用价值，传感器和应用之间需要算法来作为承上启下的桥梁。从技术角度讲，这两者最显著的结合点就是计算摄影。

以手机拍照为例，搭载了旷视AI算法和传感器的手机，在灯光、月光、星光等不同环境下成像能力的提升。此外，在非成像的屏下光学指纹方面，算法也在牵引传感技术向前发展。目前，旷视助力某业内公司实现了千万颗级的指纹传感器出货。该产品具备业界最小的尺寸、最快的识别速度以及支付级的安全认证。

范浩强认为，“应用-算法-传感器”的全链路整合能力，是“算法定义硬件”的核心。而旷视是业界少数能将传感器的光学、模组、电子学的设计能力，传感器的物理建模和算法能力，以及传感器的应用能力融为一体的公司。

除此之外，在技术开放日上，20个有料有趣的技术Demo也集中亮相，系统性地展示了旷视在前沿技术探索、软硬件协同设计、算法量产应用，以及商业化产品落地方面的实践。雷峰网(公众号：雷峰网)雷峰网