让听得见炮火的人来做 AI

共达地 AutoML AI落地

2023/02/09 15:28

2022年10月，工信部公示《国家人工智能创新应用先导区“智赋百景”》，涉及AI落地的9大领域、100个场景、8个先导区。

这个举动相当于官方泄题，把AI落地的重点科目和尖子生写在了表格上。

AI科技评论观察到，9大领域中，关于公共安全、交通运输的场景最多，这些场景的AI渗透率已经比较高，旨在发力向纵深探索，属于试卷中的必答题。而制造、农业、能源、金融、医疗作为我国的重要经济支柱，虽然经济贡献和战略地位极高，但尚属AI落地的处女地，是新考试中的新题型。

或许可以从农业中看到端倪：一颗草莓从生长到采摘，需要多少种算法？

草莓的生长过程中有20多种侵染性病害，10多种生理性病害，40多种虫害，要辅助人工准确识别它们，需要不同的AI算法。

在采摘中，确定草莓成熟度核心指标在于果面着色程度，一般分别在果面着色达70%、80%、90%时采收，但如果只有这个指标，机器很容易将草莓和同色系物品混淆，比如圣女果，所以往往还需要辅助纹理识别算法。在通过机器视觉识别成熟度前，需要先区分果与叶，对草莓进行定位并找出根茎部分，采摘后需要用托盘稳稳接住，这个过程对定位识别算法的要求很高。此外，坏果、烂果、小果、异形果也需要被区分。

这仅仅是一颗草莓的生命周期管理，就需要上百种AI算法。

而作为农业大国，仅新中国成立来孕育成功的新品种，就有3万个。近些年，农林牧渔业产值不断攀升，从2010年的67763.13亿元，逐年增长至2021年的147013.4亿元，近11年增量达79250.27亿元、增幅达116.95%。

从看护一颗草莓，到支撑起如此庞大的智能农业产业，AI能发挥的价值难以想象，所需要的算法种类更是浩如星海。

难度加深，题型变广，中国人工智能领域的官方定调已经明白无误：上一个十年，人工智能走出实验室扎根到少数几个头部产业，新十年要从头部产业走向千行百业。

当市场呼唤更多AI能量的观点进入官方文件时，新的故事就开始了。

1、在不确定性中寻找确定性

最先感受到水温变化的，是离客户最近的系统集成商。

“如今70%的集成项目中都有AI，是机遇也是挑战。”

刘先生所在的公司主做无人机巡检领域的系统集成，维护了大量优质的政府、园区客户，也同步对接算法公司、软件公司、硬件公司、工程团队等。

在智慧巡检的建设方案中，传统上靠人工肉眼查看，AI的价值多体现为车辆识别、人员聚集识别等。但今年，刘先生公司接到了更多新需求，最高频的是井盖丢失识别、游摊小贩识别，河道垃圾识别、火焰烟雾识别等；甚至很多算法需求，在市场上几乎找不到供应商，比如农田遥感、电网安全、河网监控等。

这些需求让刘先生很兴奋。人无我有，人有我优。传统的智慧巡检领域竞争激烈，如果能拿下新场景，不仅有利于单个项目的控标，还能抢占一块新高地。

行业数据佐证了刘先生的感知。根据IDC最新发布的《中国加速计算市场（2021年下半年）跟踪报告》，2021年全年，中国AI服务器市场规模达350.3亿元，同比增长68.6%——如果把算法比作是菜谱，那算力和数据则分别是厨具和食材，厨具消耗量的增加，必然与菜品的增加同步——AI市场的需求总量在快速井喷。

让听得见炮火的人来做 AI

更重要的是，IDC报告还显示，AI算力市场规模前6大行业中，金融、服务、制造和能源等新进领域均表现出高达80%的涨幅。也就是说，不仅需求总量增加了，AI算法的多样性也增加了。

这种增加是市场自发行为。比如上海“一网统管”，在疫情发生后，开始使用人工智能来监测车辆违章停放、共享单车跌倒、垃圾抛洒等问题，从原先被动需要人力维护，变成主动进行智慧管理。又比如，人工智能在诊疗领域过去大量应用于人工智能读片，看肺部结节的效率要比人眼读片高很多，而今，人工智能读片则覆盖到了骨科、心脑血管、妇科等全新领域。

市场对人工智能的想象早已跳出了“人、车、非”老三样，能不能尽快占领新需求的高地，也成为集成商们能坐哪把江湖交椅的重要依据。

对于大集成商而言，一个项目中落地上百个AI算法是常有的事，这意味着巨大的潜在增值空间，也意味着不可控的交付风险。

以工业机器人领域为例，2014年系统集成商企业数量不到500家，到2021年数量已经超过3500家。但从财务上看，营收小于1个亿仍然是大部分集成商的命运，能做到5个亿已经是行业佼佼者。从单个项目上看，遇到好项目毛利率能到20%-30%，但大部分情况下，毛利润则低于20%，如果是陌生的全新场景，那么赔本也有可能。

刘先生想带领团队探索AI的未知之境。但是，把AI写进PPT很容易，落到项目里很难。

于是，冰火两重天成了AI行业的现状：一面，是肉眼可见的行业蛋糕变大了；但另一面，是从业者如履薄冰，闻定制而色变。

2、梦想照进现实

究其本质，AI算法无法成为标品。

一条流水线可以生产千万瓶农夫山泉，卖给无数消费者；但算法和场景的关系，却约等于《阿凡达》中纳美人和迅雷翼兽的关系，每一个算法都需要与具体的场景精准适配。

这项工作非常复杂。从数据环开始，算法工程师就需要分析场景的图像数据特点，依次设计对应的算法方案，并根据算法落地的硬件芯片大小设计模型结构，通过超参调节与训练得到一个 AI 模型，然后部署到摄像头、无人机等终端产品上。

而且，这不是一个走一遍就能完成的流程。深度学习是一个「黑盒子」，算法精度的提升可能取决于数据特点，也可能取决于模型参数规模与架构。由于视觉算法天生要与终边端结合，最终的算法调整还与终边端硬件的算力（即芯片）大小有关。牵一发而动全身，所以，算法工程师往往要来来回回走完整条流程，才能得到一个不错的 AI 算法。

计算下来，开发一个 AI 算法大概需要3个月，算法与硬件的适配调优又要耗时 3 个月左右，所以单个 AI 算法的平均交付时间大概 6 个月。AI 算法工程师的人力成本平均在年薪 50 万以上，一个算法项目的研发需要 5 到 10 人，加上图像数据的标注成本等，就构成了 AI 算法的尴尬局面：

「海量需求，精细定制，人力太贵，做不过来」。

让听得见炮火的人来做 AI

图注：人工智能各职能岗位人才供需比

数据来源：工信部人工智能产业人才发展报告（2019-2020年版）报告编写组调研数据库、BOSS直聘

AI是无处不在的需求，也是不敢轻易接手的山芋。作为产业链的中间环节，集成商向上对接核心技术提供商，比如算法厂商、芯片厂商，向下对接终端客户和工程实施方。如果要探索新的算法应用，自然离不开产业链的上下游。

如果我们把视角放得宏观一些，会发现当下的AI产业链已经在慢慢走向成熟了。

最典型的体现是连接数。据 IoTAnalysis 研究数据， 2020年全球AIoT连接数达到117亿，首次超过非物联网连接数——这个数据在2010年是8亿次，增长近15倍，而每一次连接，背后都有数次AI运算。

15倍速的增长，背后依靠的是数据和算力的循环增强，这些产业基础设施的完善让AI的梦想有了照进现实的条件。

以数据处理为例。吴恩达在“二八定律”中对数据之于AI的重要性有非常直观的描述：80%的数据+20%的模型=更好的AI。

充足的数据是算法模型成功的前提，但数据处理环节极为庞杂，即使是最成熟的人脸识别，训练一个模型也大概需要千万的样本量，整个数据处理工作则要占项目总成本的近60%，占项目开发周期的80%。

如今，随着产业分工的加速和技术的提升，专业数据处理机构和AI算法辅助标注平台，可以通过预识别模型的方式，先将数据处理一遍，尽可能识别物体，再交由标注员操作，就可以将效率提升近一倍。

除了处理效率外，数据处理质量也在提升。在传统数据处理过程中，主要通过人工抽查的方式对数据标注质量进行查漏补缺，但通过AI辅助质检，不仅可以变“抽查”为“遍查”，还可以将平均数据准确率提升5%以上。

除了数据之外，走向成熟和标准化的还有算力产业。

根据方舟评估委员会的研究，虽然过去十年，人工智能计算的复杂度每年飙升10倍（每秒千万亿次运算），但与此同时成本却每年下降10倍。比如， 2017年在公共云上训练像 ResNet-50这样的图像分类器，成本约为1000美元，到了2019年只需大约10美元。

究其原因，一方面是AI架构的升级，另一方面则是专用芯片的出现及其性能的提升，比如 Nvidia于2017年发布的 V100显卡，比三年前发布的 K80 快1800% ，还有一方面则是智能算力建设取得的成就。

据工信部数据，截至2021年底，全国在用智算中心超过20个；算力产业规模近五年平均增速超过30%，排名全球第二。预计到2023年，智能算力在总算力中的比重将超过70%，发挥核心拉动作用。

风云万变一瞬息，在短短几年间，智能算力从新生事物成为新基础设施。这让AI训练和落地更有底气了。

最直观的表现是，2012年前罕见使用GPU进行计算，2015年以后，大规模使用上百个GPU进行训练成为常事。而作为AI落地最常见的载体，智能摄像头的价格单位也早已从万元降至千元甚至百元。

市场需求催生专业分工，专业分工促进技术升级，技术升级导致性能迭代，性能迭代孕育成本降低，成本降低成就广袤的市场需求。

数据端和算力端大致走完了这样的闭环，这在行业层面让算法研发的类型更多元、周期更短、成本更低。但这依旧不足以实现“智赋百景”背后的期望，整个产业对算法生产能力的期待呼之欲出。

3、AI 落地的新支点

如果说，变人力为机器，变复杂为标准，是数据和算力一日千里的秘诀。那么，算法有没有可能标准化？

2012 年，加拿大不列颠哥伦比亚大学的 Frank Hutter 教授等人提出自动选择模型与优化参数的 Auto-WEKA，是第一个 AutoML 点工具。之后，除了调参，也有针对网络结构、函数选择自动化的 AutoML 陆陆续续出现。

AutoML，即自动机器学习，是一种用AI训练AI的工具。

但单点上的突破，并不能真正改变产业模式。AI 算法的生产特性决定了，但凡还有一个环节需要算法工程师操作，包括算法在终边端的部署，就又回到了 AI 落地难的原点：离开算法工程师，算法开发就转不动了。

基于此，更多算法公司将AutoML当做专业算法工程师的提效工具。但只要AI的生产和应用还掌握在少数专业算法工程师手里，AI就像是一种奢侈品；其背后的巨大需求潜力，也就没法释放出来。

如果想让整个AI产业链的齿轮咬合紧密衔接丝滑，必须实现端到端的算法全链条自动化——这是新十年AI创业者的重要方向，「共达地」就是其中之一。

和单点自动化的AutoML不同，共达地要做的是AI算法生产全链路自动化的AutoML，是要将深度学习视觉算法开发的链条细细拆分，分成 13 个环节，从「数据分析」开始，一直到芯片适配，在算法开发的每个环节都设计不同的算法来代替 AI 工程师的工作。最终实现的效果是，数据上传后就能自动训练模型，训练好的模型可以像安装 APP 一样下载。

让听得见炮火的人来做 AI

这个过程相当于把数据、算法与算力进行了拆分，分别自动化，每一个模块都用 AutoML 的算法来实现。例如，数据分析一环，AutoML 可以自动分析上传数据中的场景丰富度、物体类别、目标尺寸、有无遮挡、光照强弱等等。在芯片适配，用户自主选择模型想要适配的芯片，平台同样会通过算法来自动匹配和计算。

用户只需做两件事：一是定义好需求，二是数据迭代。而这两个环节可以由离业务场景最近的人来完成，如上述所说的产线工人、物业经理等等。

让听得见炮火的人来做 AI

图注：共达地自动化训练开发平台流程

原本训练算法是个「黑盒子」，但这个过程被流水线化了。反复调参的前提不存在了，成本和周期自然也就消失了。想要什么样的算法，就喂什么样的数据。

这种能力对集成商来说，很有吸引力。

自建 AI 团队的成本太高，但产品经理与项目经理的人数永远是最多的。所以，如果他们仅仅需要上传数据，就能像安装 APP 一样得到解决自己问题的 AI 算法，那么 AI 的足迹就会迅速布满全国各地，真正促进数字化的转型。

不过，算法生产出的算法，精度能否与人类生产的算法相媲美；

没有专业算法团队的集成商，是否能熟练使用这项能力；

这两大前提，是验证 AutoML 平台是否行得通的试金石。

创立第二年，共达地得到了肯定的答案。一家视觉算法公司想用 AI 识别火焰烟雾。此前，该公司内部的算法团队花了半年左右的时间才做出一个算法。接触到共达地后，在试用他们的算法自动化生产平台时，他们将同一套数据上传到该平台，结果只用了 10 个小时就训练出一个模型，而且算法的精度更胜一筹。

这种震撼是难以名状的：回顾深度学习的历史，深度学习第一次引起人们的震撼，就是 2011 年 Hinton 与邓力在微软语音识别中应用深度神经网络，只用了几天时间就完成了整个团队花半年才做完的事情。而现在，AutoML 生产的算法也能实实在在地匹配人类工程师的工作——算法环节，终于也和数据、算力一样，走上了工业化道路。

4、生产力解放想象力

只有解决长尾匹配，才能完成技术的价值闭环。而在实际业务中，越来越多碎片化的场景证实了 AutoML 平台算法生产的意义。

今年年中，刘先生接到一个来自某地政府的智慧城市项目，需要用无人机+AI巡检的方式，对辖区内的车辆、人员、河道、商贩等进行管理，是刘先生从业以来遇到的覆盖面积最大、算法类型最复杂的项目。

项目试点初期，以河道漂浮物识别为切入点，对比多家供应商的技术实力。刘先生在某专业算法大厂的算法商城中购买了河道漂浮物识别算法，但测试时92%的精度，到应用到业务场景后竟然低于10%。主要原因在于：一是实际河网环境复杂，二是河面反光造成了极大的影响。

后来，刘先生在共达地的 AutoML 平台上通过采集到的视频流自主动手训练了河道漂浮物识别算法，应用到业务场景后，同样由于远距离、夜间识别的问题，精度只达到70%左右，但通过不断巡检，前端回传现场数据进行迭代，5 天迭代 3 个版本后，精度达到了95%。

速度带来质变。如果是之前靠人力迭代，相当于每次都要重新定制算法、重新走一遍上述十几个环节的流程，耗时往往以月计，成本也高。但 AutoML 平台自动生产、无需人力，机器 24 小时云运转，以天为单位迭代，效率更高，得到高精度的时间也更短，对实际落地带来了巨变。

AI 的生产力，解放了行业人士对「AI 能做什么」的想象力。

「过去不敢接的项目需求，现在敢接了；过去要倒腾半年的项目，现在一个月就可以交付妥当了。」这是刘先生最直观的感受。雷峰网

这就好比汽车的发展：汽车最开始出现时，只有少数的富贵人家能拥有汽车，会开车的司机也很少；随着生产力的发展，越来越多中产阶级也能买上汽车；到乘车共享平台诞生时，普通老百姓即使没有汽车，也已经能通过平台享受到汽车出行的服务。

通过 AutoML 平台，AI不再是昂贵的产品，而是触手可及的服务。传统企业也能实现这样的梦想：没有 AI 团队，也能交付靠谱的 AI 产品。

但更具想象力的是，工具升级以后，产业链也有了重塑的可能性。

在AI产业链中，绕不开的无非“算法，算力，数据“三大要素。而项目落地，则又包括需求分析、系统集成、API对接联调、部署运维等细碎工作。

传统AI公司自己下场做总包项目，左手采数据，右手建算力，又用昂贵的人力和组织成本，去做系统集成商的工作。雷峰网(公众号：雷峰网)

于是，边际效应诚实的反应在财务报表上，摊子铺的越大，企业亏钱越多。

而共达地AutoML平台率先将算法生产能力抽离出来，变成标准化服务，同时打通数据厂商和芯片适配。让整个产业链回归合理分工，各家厂商专注自己擅长的事情。

标准化，是效率的开端，更是协作的开始。

到2021 年，共达地的 AutoML 平台已经打通了多家数据厂商，用户可以无缝实现数据的标注服务。同时，平台适配了超过 100款常见 AI 芯片，涵盖英伟达、英特尔、高通、寒武纪等主流厂商。

这个过程可以参考信息产业。当信息产业从一家独揽咨询、操作系统、CPU、硬盘、整机等所有环节，发展为每个环节都有大量玩家和独角兽时，信息产业生态便建立起来了。信息产业从烟囱林立，到树状相连，IT也在此刻成为各行各业的「基础设施」。也正是在这个基础上，中国经济大体上完成信息化，迈向数字化。雷峰网

相应的，人工智能正在经历的这个阶段，或许可以称为「AI生态元年」。

共达地的AutoML平台，作为撬动AI生态的一个工具，只是革命的开始。随着越来越多人参与到这个赛道中，带来新的分工、新的标准、新的理解，共建人工智能的新生态。

在那里，才是AI真正的星辰大海。