2022年10月,工信部公示《国家人工智能创新应用先导区“智赋百景”》,涉及AI落地的9大领域、100个场景、8个先导区。
这个举动相当于官方泄题,把AI落地的重点科目和尖子生写在了表格上。
AI科技评论观察到,9大领域中,关于公共安全、交通运输的场景最多,这些场景的AI渗透率已经比较高,旨在发力向纵深探索,属于试卷中的必答题。而制造、农业、能源、金融、医疗作为我国的重要经济支柱,虽然经济贡献和战略地位极高,但尚属AI落地的处女地,是新考试中的新题型。
或许可以从农业中看到端倪:一颗草莓从生长到采摘,需要多少种算法?
草莓的生长过程中有20多种侵染性病害,10多种生理性病害,40多种虫害,要辅助人工准确识别它们,需要不同的AI算法。
在采摘中,确定草莓成熟度核心指标在于果面着色程度,一般分别在果面着色达70%、80%、90%时采收,但如果只有这个指标,机器很容易将草莓和同色系物品混淆,比如圣女果,所以往往还需要辅助纹理识别算法。在通过机器视觉识别成熟度前,需要先区分果与叶,对草莓进行定位并找出根茎部分,采摘后需要用托盘稳稳接住,这个过程对定位识别算法的要求很高。此外,坏果、烂果、小果、异形果也需要被区分。
这仅仅是一颗草莓的生命周期管理,就需要上百种AI算法。
而作为农业大国,仅新中国成立来孕育成功的新品种,就有3万个。近些年,农林牧渔业产值不断攀升,从2010年的67763.13亿元,逐年增长至2021年的147013.4亿元,近11年增量达79250.27亿元、增幅达116.95%。
从看护一颗草莓,到支撑起如此庞大的智能农业产业,AI能发挥的价值难以想象,所需要的算法种类更是浩如星海。
难度加深,题型变广,中国人工智能领域的官方定调已经明白无误:上一个十年,人工智能走出实验室扎根到少数几个头部产业,新十年要从头部产业走向千行百业。
当市场呼唤更多AI能量的观点进入官方文件时,新的故事就开始了。
1、在不确定性中寻找确定性
最先感受到水温变化的,是离客户最近的系统集成商。
“如今70%的集成项目中都有AI,是机遇也是挑战。”
刘先生所在的公司主做无人机巡检领域的系统集成,维护了大量优质的政府、园区客户,也同步对接算法公司、软件公司、硬件公司、工程团队等。
在智慧巡检的建设方案中,传统上靠人工肉眼查看,AI的价值多体现为车辆识别、人员聚集识别等。但今年,刘先生公司接到了更多新需求,最高频的是井盖丢失识别、游摊小贩识别,河道垃圾识别、火焰烟雾识别等;甚至很多算法需求,在市场上几乎找不到供应商,比如农田遥感、电网安全、河网监控等。
这些需求让刘先生很兴奋。人无我有,人有我优。传统的智慧巡检领域竞争激烈,如果能拿下新场景,不仅有利于单个项目的控标,还能抢占一块新高地。
行业数据佐证了刘先生的感知。根据IDC最新发布的《中国加速计算市场(2021年下半年)跟踪报告》,2021年全年,中国AI服务器市场规模达350.3亿元,同比增长68.6%——如果把算法比作是菜谱,那算力和数据则分别是厨具和食材,厨具消耗量的增加,必然与菜品的增加同步——AI市场的需求总量在快速井喷。
更重要的是,IDC报告还显示,AI算力市场规模前6大行业中,金融、服务、制造和能源等新进领域均表现出高达80%的涨幅。也就是说,不仅需求总量增加了,AI算法的多样性也增加了。
这种增加是市场自发行为。比如上海“一网统管”,在疫情发生后,开始使用人工智能来监测车辆违章停放、共享单车跌倒、垃圾抛洒等问题,从原先被动需要人力维护,变成主动进行智慧管理。又比如,人工智能在诊疗领域过去大量应用于人工智能读片,看肺部结节的效率要比人眼读片高很多,而今,人工智能读片则覆盖到了骨科、心脑血管、妇科等全新领域。
市场对人工智能的想象早已跳出了“人、车、非”老三样,能不能尽快占领新需求的高地,也成为集成商们能坐哪把江湖交椅的重要依据。
对于大集成商而言,一个项目中落地上百个AI算法是常有的事,这意味着巨大的潜在增值空间,也意味着不可控的交付风险。
以工业机器人领域为例,2014年系统集成商企业数量不到500家,到2021年数量已经超过3500家。但从财务上看,营收小于1个亿仍然是大部分集成商的命运,能做到5个亿已经是行业佼佼者。从单个项目上看,遇到好项目毛利率能到20%-30%,但大部分情况下,毛利润则低于20%,如果是陌生的全新场景,那么赔本也有可能。
刘先生想带领团队探索AI的未知之境。但是,把AI写进PPT很容易,落到项目里很难。
于是,冰火两重天成了AI行业的现状:一面,是肉眼可见的行业蛋糕变大了;但另一面,是从业者如履薄冰,闻定制而色变。
2、梦想照进现实
究其本质,AI算法无法成为标品。
一条流水线可以生产千万瓶农夫山泉,卖给无数消费者;但算法和场景的关系,却约等于《阿凡达》中纳美人和迅雷翼兽的关系,每一个算法都需要与具体的场景精准适配。
这项工作非常复杂。从数据环开始,算法工程师就需要分析场景的图像数据特点,依次设计对应的算法方案,并根据算法落地的硬件芯片大小设计模型结构,通过超参调节与训练得到一个 AI 模型,然后部署到摄像头、无人机等终端产品上。
而且,这不是一个走一遍就能完成的流程。深度学习是一个「黑盒子」,算法精度的提升可能取决于数据特点,也可能取决于模型参数规模与架构。由于视觉算法天生要与终边端结合,最终的算法调整还与终边端硬件的算力(即芯片)大小有关。牵一发而动全身,所以,算法工程师往往要来来回回走完整条流程,才能得到一个不错的 AI 算法。
计算下来,开发一个 AI 算法大概需要3个月,算法与硬件的适配调优又要耗时 3 个月左右,所以单个 AI 算法的平均交付时间大概 6 个月。AI 算法工程师的人力成本平均在年薪 50 万以上,一个算法项目的研发需要 5 到 10 人,加上图像数据的标注成本等,就构成了 AI 算法的尴尬局面:
「海量需求,精细定制,人力太贵,做不过来」。
图注:人工智能各职能岗位人才供需比
数据来源:工信部人工智能产业人才发展报告(2019-2020年版)报告编写组调研数据库、BOSS直聘
AI是无处不在的需求,也是不敢轻易接手的山芋。作为产业链的中间环节,集成商向上对接核心技术提供商,比如算法厂商、芯片厂商,向下对接终端客户和工程实施方。如果要探索新的算法应用,自然离不开产业链的上下游。
如果我们把视角放得宏观一些,会发现当下的AI产业链已经在慢慢走向成熟了。
最典型的体现是连接数。据 IoTAnalysis 研究数据, 2020年全球AIoT连接数达到117亿, 首次超过非物联网连接数——这个数据在2010年是8亿次,增长近15倍,而每一次连接,背后都有数次AI运算。
15倍速的增长,背后依靠的是数据和算力的循环增强,这些产业基础设施的完善让AI的梦想有了照进现实的条件。
以数据处理为例。吴恩达在“二八定律”中对数据之于AI的重要性有非常直观的描述:80%的数据+20%的模型=更好的AI。
充足的数据是算法模型成功的前提,但数据处理环节极为庞杂,即使是最成熟的人脸识别,训练一个模型也大概需要千万的样本量,整个数据处理工作则要占项目总成本的近60%,占项目开发周期的80%。
如今,随着产业分工的加速和技术的提升,专业数据处理机构和AI算法辅助标注平台,可以通过预识别模型的方式,先将数据处理一遍,尽可能识别物体,再交由标注员操作,就可以将效率提升近一倍。
除了处理效率外,数据处理质量也在提升。在传统数据处理过程中,主要通过人工抽查的方式对数据标注质量进行查漏补缺,但通过AI辅助质检,不仅可以变“抽查”为“遍查”,还可以将平均数据准确率提升5%以上。
除了数据之外,走向成熟和标准化的还有算力产业。
根据方舟评估委员会的研究,虽然过去十年,人工智能计算的复杂度每年飙升10倍(每秒千万亿次运算),但与此同时成本却每年下降10倍。比如, 2017年在公共云上训练像 ResNet-50这样的图像分类器,成本约为1000美元,到了2019年只需大约10美元。
究其原因,一方面是AI架构的升级,另一方面则是专用芯片的出现及其性能的提升,比如 Nvidia于2017年发布的 V100显卡,比三年前发布的 K80 快1800% ,还有一方面则是智能算力建设取得的成就。
据工信部数据,截至2021年底,全国在用智算中心超过20个;算力产业规模近五年平均增速超过30%,排名全球第二。预计到2023年,智能算力在总算力中的比重将超过70%,发挥核心拉动作用。
风云万变一瞬息,在短短几年间,智能算力从新生事物成为新基础设施。这让AI训练和落地更有底气了。
最直观的表现是,2012年前罕见使用GPU进行计算,2015年以后,大规模使用上百个GPU进行训练成为常事。而作为AI落地最常见的载体,智能摄像头的价格单位也早已从万元降至千元甚至百元。
市场需求催生专业分工,专业分工促进技术升级,技术升级导致性能迭代,性能迭代孕育成本降低,成本降低成就广袤的市场需求。
数据端和算力端大致走完了这样的闭环,这在行业层面让算法研发的类型更多元、周期更短、成本更低。但这依旧不足以实现“智赋百景”背后的期望,整个产业对算法生产能力的期待呼之欲出。
3、AI 落地的新支点
如果说,变人力为机器,变复杂为标准,是数据和算力一日千里的秘诀。那么,算法有没有可能标准化?
2012 年,加拿大不列颠哥伦比亚大学的 Frank Hutter 教授等人提出自动选择模型与优化参数的 Auto-WEKA,是第一个 AutoML 点工具。之后,除了调参,也有针对网络结构、函数选择自动化的 AutoML 陆陆续续出现。
AutoML,即自动机器学习,是一种用AI训练AI的工具。
但单点上的突破,并不能真正改变产业模式。AI 算法的生产特性决定了,但凡还有一个环节需要算法工程师操作,包括算法在终边端的部署,就又回到了 AI 落地难的原点:离开算法工程师,算法开发就转不动了。
基于此,更多算法公司将AutoML当做专业算法工程师的提效工具。但只要AI的生产和应用还掌握在少数专业算法工程师手里,AI就像是一种奢侈品;其背后的巨大需求潜力,也就没法释放出来。
如果想让整个AI产业链的齿轮咬合紧密衔接丝滑,必须实现端到端的算法全链条自动化——这是新十年AI创业者的重要方向,「共达地」就是其中之一。
和单点自动化的AutoML不同,共达地要做的是AI算法生产全链路自动化的AutoML,是要将深度学习视觉算法开发的链条细细拆分,分成 13 个环节,从「数据分析」开始,一直到芯片适配,在算法开发的每个环节都设计不同的算法来代替 AI 工程师的工作。最终实现的效果是,数据上传后就能自动训练模型,训练好的模型可以像安装 APP 一样下载。
这个过程相当于把数据、算法与算力进行了拆分,分别自动化,每一个模块都用 AutoML 的算法来实现。例如,数据分析一环,AutoML 可以自动分析上传数据中的场景丰富度、物体类别、目标尺寸、有无遮挡、光照强弱等等。在芯片适配,用户自主选择模型想要适配的芯片,平台同样会通过算法来自动匹配和计算。
用户只需做两件事:一是定义好需求,二是数据迭代。而这两个环节可以由离业务场景最近的人来完成,如上述所说的产线工人、物业经理等等。
图注:共达地自动化训练开发平台流程
原本训练算法是个「黑盒子」,但这个过程被流水线化了。反复调参的前提不存在了,成本和周期自然也就消失了。想要什么样的算法,就喂什么样的数据。
这种能力对集成商来说,很有吸引力。
自建 AI 团队的成本太高,但产品经理与项目经理的人数永远是最多的。所以,如果他们仅仅需要上传数据,就能像安装 APP 一样得到解决自己问题的 AI 算法,那么 AI 的足迹就会迅速布满全国各地,真正促进数字化的转型。
不过,算法生产出的算法,精度能否与人类生产的算法相媲美;
没有专业算法团队的集成商,是否能熟练使用这项能力;
这两大前提,是验证 AutoML 平台是否行得通的试金石。
创立第二年,共达地得到了肯定的答案。一家视觉算法公司想用 AI 识别火焰烟雾。此前,该公司内部的算法团队花了半年左右的时间才做出一个算法。接触到共达地后,在试用他们的算法自动化生产平台时,他们将同一套数据上传到该平台,结果只用了 10 个小时就训练出一个模型,而且算法的精度更胜一筹。
这种震撼是难以名状的:回顾深度学习的历史,深度学习第一次引起人们的震撼,就是 2011 年 Hinton 与邓力在微软语音识别中应用深度神经网络,只用了几天时间就完成了整个团队花半年才做完的事情。而现在,AutoML 生产的算法也能实实在在地匹配人类工程师的工作——算法环节,终于也和数据、算力一样,走上了工业化道路。
4、生产力解放想象力
只有解决长尾匹配,才能完成技术的价值闭环。而在实际业务中,越来越多碎片化的场景证实了 AutoML 平台算法生产的意义。
今年年中,刘先生接到一个来自某地政府的智慧城市项目,需要用无人机+AI巡检的方式,对辖区内的车辆、人员、河道、商贩等进行管理,是刘先生从业以来遇到的覆盖面积最大、算法类型最复杂的项目。
项目试点初期,以河道漂浮物识别为切入点,对比多家供应商的技术实力。刘先生在某专业算法大厂的算法商城中购买了河道漂浮物识别算法,但测试时92%的精度,到应用到业务场景后竟然低于10%。主要原因在于:一是实际河网环境复杂,二是河面反光造成了极大的影响。
后来,刘先生在共达地的 AutoML 平台上通过采集到的视频流自主动手训练了河道漂浮物识别算法,应用到业务场景后,同样由于远距离、夜间识别的问题,精度只达到70%左右,但通过不断巡检,前端回传现场数据进行迭代,5 天迭代 3 个版本后,精度达到了95%。
速度带来质变。如果是之前靠人力迭代,相当于每次都要重新定制算法、重新走一遍上述十几个环节的流程,耗时往往以月计,成本也高。但 AutoML 平台自动生产、无需人力,机器 24 小时云运转,以天为单位迭代,效率更高,得到高精度的时间也更短,对实际落地带来了巨变。
AI 的生产力,解放了行业人士对「AI 能做什么」的想象力。
「过去不敢接的项目需求,现在敢接了;过去要倒腾半年的项目,现在一个月就可以交付妥当了。」这是刘先生最直观的感受。雷峰网
这就好比汽车的发展:汽车最开始出现时,只有少数的富贵人家能拥有汽车,会开车的司机也很少;随着生产力的发展,越来越多中产阶级也能买上汽车;到乘车共享平台诞生时,普通老百姓即使没有汽车,也已经能通过平台享受到汽车出行的服务。
通过 AutoML 平台,AI不再是昂贵的产品,而是触手可及的服务。传统企业也能实现这样的梦想:没有 AI 团队,也能交付靠谱的 AI 产品。
但更具想象力的是,工具升级以后,产业链也有了重塑的可能性。
在AI产业链中,绕不开的无非“算法,算力,数据“三大要素。而项目落地,则又包括需求分析、系统集成、API对接联调、部署运维等细碎工作。
传统AI公司自己下场做总包项目,左手采数据,右手建算力,又用昂贵的人力和组织成本,去做系统集成商的工作。雷峰网
于是,边际效应诚实的反应在财务报表上,摊子铺的越大,企业亏钱越多。
而共达地AutoML平台率先将算法生产能力抽离出来,变成标准化服务,同时打通数据厂商和芯片适配。让整个产业链回归合理分工,各家厂商专注自己擅长的事情。
标准化,是效率的开端,更是协作的开始。
到2021 年,共达地的 AutoML 平台已经打通了多家数据厂商,用户可以无缝实现数据的标注服务。同时,平台适配了超过 100款常见 AI 芯片,涵盖英伟达、英特尔、高通、寒武纪等主流厂商。
这个过程可以参考信息产业。当信息产业从一家独揽咨询、操作系统、CPU、硬盘、整机等所有环节,发展为每个环节都有大量玩家和独角兽时,信息产业生态便建立起来了。信息产业从烟囱林立,到树状相连,IT也在此刻成为各行各业的「基础设施」。也正是在这个基础上,中国经济大体上完成信息化,迈向数字化。雷峰网(公众号:雷峰网)
相应的,人工智能正在经历的这个阶段,或许可以称为「AI生态元年」。
共达地的AutoML平台,作为撬动AI生态的一个工具,只是革命的开始。随着越来越多人参与到这个赛道中,带来新的分工、新的标准、新的理解,共建人工智能的新生态。
在那里,才是AI真正的星辰大海。