雷锋网 AI 掘金志按:7 月 12 日-7 月 14 日,2019 第四届全球人工智能与机器人峰会(CCF-GAIR 2019)于深圳正式召开。峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,深圳市人工智能与机器人研究院协办。
在大会第三天的〖智能商业专场〗,阿里巴巴集团副总裁、CEO助理肖利华,京东零售首席科学家兼技术副总裁胡鲁辉,美国德州农工大学数据挖掘实验室主任胡侠,苏宁零售技术研究院院长王俊杰,TCL研究院 (香港)研究所总经理俞大海,扩博智能CTO柯严先后登台发表精彩演讲,分享了各自对智能商业的理解与实践。
其中TCL研究院 (香港)研究所总经理俞大海以《AIxIoT-TCL人工智能技术在智能制造的应用》为主题,分享了TCL在智能制造领域的实践与经验。
俞大海介绍,制造行业的数据极其不平衡,正样本多,负样本少。用传统机器学习的做法训练模型效果非常差。TCL的做法是用生成对抗网络去模拟真实的生产环境,产生更多的负样本,然后通过强化学习去训练模型。
他指出,现在行业的通行做法是在已有的业务流程上去应用人工智能,效果比较有限。因为现有的业务流程是为人服务的,未来我们也可以尝试去设计一套为机器学习服务的业务流程。
俞大海还提到,很多工厂不便把数据上传到公有云,但在私有云上做人工智能的应用成本又太高。这个问题可以用边缘计算来解决,先在边缘端处理数据,只将特征信息上传至云端,甚至直接在边缘端实现某些功能。
以下是俞大海的全部演讲内容,雷锋网做了不改变原意的整理与编辑:
非常高兴能来这里分享我关于智能制造的经验。今天我分享的主题是“人工智能技术在智能制造的应用实践”。为什么要强调“应用实践”呢?因为智能制造是一个非常大的话题,可以专门开一个这样规模的论坛来讨论。智能制造并不是一个新概念,想必在座各位都很熟悉。无论中国的智能制造2015还是欧洲的工业4.0,内涵都非常接近。所以我今天不给大家科普,而是聚焦我们在一些应用上的实践。
智能制造并不是一件容易的事。尤其是人工智能在制造行业的应用,并不像它在安防、零售这些行业那样立竿见影。因为制造领域的流程从数字化和信息化的角度来说非常复杂。
人工智能可以在制造领域起到怎样的作用呢?过去很多年我们一直在做这方面的研究,做了大量尝试,尤其是TCL,在过去十年里下了很大功夫。我来自TCL研究院,我们聚焦的是人工智能可以为生产、检测等环节带来哪些改变。今天我想跟大家分享我们的一些实践和对于未来趋势的思考。
提到TCL,大家首先想到的是电视,但其实我们不光做电视。TCL有两大事业群:第一个是智能终端和新兴业务版块,包括刚刚说到的电视,目前我们已经超过LG做到了全球第二,仅次于三星;此外我们还有手机和家电,比如黑莓、阿尔卡特等品牌都是TCL旗下的。第二个是半导体显示及材料版块,我们在这个领域探索得非常深入,位居先进制造行业的一线阵营。半导体显示跟传统的组装、OEM行业不一样,它属于精密制造,对自动化、信息化程度的要求非常高。这给我们发展智能制造奠定了非常好的基础。
简单介绍下我们研究院的技术布局,主要有三个方向:一是人工智能及大数据;二是半导体显示技术和材料,后者包括材料的研发和制造;三是智能制造和工业互联网。TCL在全球拥有香港、欧洲、美国、西安、武汉和深圳6大研发中心,有很多的科学家和算法工程师共同为TCL的新材料研发、智能制造和工业互联网服务。
下图是我们一些具体的研究方向,基本涵盖了所有人工智能相关的技术,无论是图像识别、机器学习、数据分析建模,还是NLP、ASR等。其中部分是为智能终端服务的,包括电视、手机、智能家居等。
下图展示了我们智能制造的物联网平台。我们有自己的工业云、大数据云、IoT云,以及人工智能平台。后者在TCL的工业物联网中可以提供机器学习、计算机视觉、NLP、BI等能力,服务于我们的智能工厂、供应链、市场前端甚至研发。这里面的每一个板块都有很多内容可讲,这里不展开叙述。
下面这张图展示了我们的AI服务。最底层是我们团队在过去五六年里积累的各种能力,可以整合成一套高性能计算解决方案进行统一输出,也可以输出给第三方平台。这套高性能计算解决方案可以移植和转化到不同的应用场景当中。我们知道人工智能是由非常复杂的算法组成的,要把它运用到具体的场景中就必须进行移植和转发。我们的这套方案可以完美应用到应用层的各个产品中,包括手机、电视等等;这是我们独有的优势。
工业物联网做为TCL的一个产品,不仅服务于自身,也可以输出给上下游的合作伙伴。我们提供的除了云端解决方案,还有边缘端的解决方案,不同的算法和技术都可以根据客户的需求,形成个性化的解决方案。
接下来分享一些具体案例。我们在这方面有很多案例,比如跟中国最好的电池企业和整机生产代工企业合作,去提升他们的制造能力。但我觉得半导体显示行业是TCL探索非常深的一个领域,而且非常具有代表性,由于时间关系,就只以我们自己的工厂举例。
首先回顾一下TCL在半导体显示领域的投入。2009年我们投建了第一家半导体显示工厂,迄今刚好十年。目前TCL一共有8家半导体显示工厂,3家在深圳,2家在武汉,还有2家在建,一家刚刚立项。半导体显示通俗来说就是显示屏,我们的产品线覆盖了大大小小各种电子设备的显示屏,也包括柔性屏。已经投产的5家工厂,T1、T2、T3都是智能制造2025的示范单位。
我们在建这些工厂的时候就想得非常远,怎么把智能制造做到最优。2016年开始,我们对所有工厂陆续进行了自动化和数据的改造,目前改造工作已经全部完成。2017年至今,我们成功搭建了物联网平台,依托这个平台,所有工厂都能够收集、管理和分析我们想要的数据,真正做到了可视化。去年开始,我们在人工智能领域也进行了很多时间,逐步收获了成效;预计明年我们将把人工智能技术应用到所有工厂。
在智能制造领域,我们关注三个核心部分:
一是IoT平台。如果你的工厂足够自动化,信息化程度很高,精益化管理也没有任何问题。你想让它真正走向智能化,就必须发展IoT平台。因为你的数据是多维度和多模态的,如果没有IoT平台采集数据,让它和机器相关联,后面的智能化是无法实现的。这对工厂提出了很大挑战。
二是大数据平台。大量数据涌进来,可能有些有用,有些没用,怎么对数据进行清洗和管理,把数据转化成服务,这一点非常重要。
最后才是人工智能的平台。用数据结合生产流程去提供智能化的服务,帮助提高效率和降低成本。为什么要智能化?
所有制造企业面临的最根本问题,一是降低成本,二是提高效率,三是产能和良率达到最优的平衡状态。之前精益制造要解决的是这些问题,现在的智能化也是。
其中的挑战非常大。智能制造流程复杂,通过精益制造和自动化我们已经把产能和良率提得很高了,但任有进步的空间。智能化的过程中,我们要做的依托各个设备产生的数据对每一个环节进行优化,以数据为驱动,实现高效的管理和精准的判断。
总而言之,制造业需要解决三个问题:降低成本、提高效率、提高良率。具体怎么做呢?下面用两个案例为大家解答。
下面这张图展示了我们工厂的一条生产线,它大概包含了20道工序,每天会产生70万张图像。我们希望通过这些图像,在保证产品的情况下提高良率。怎么做呢?
过去我们人工总结了100多种缺陷,派10个人三班倒(也就是30个人)来检查这些图象,如果发现问题就进行修补。刚建厂的时候这种方法还是很有效的,使得我们在同行中的良率非常高。但随着产能和良率的提升,我们意识到不能再这样做了,一是成本非常高,二是人工的方法已经很难再提升了。
我们是怎么做的呢?用深度学习技术去分析机器产生的大量图像,这个过程并不复杂,很快就把这个问题给解决了。
过去的人工流程用了5年时间总结经验才达到比较完美的效果,现在我们用人工智能技术一年就把它替换掉了,而且效率还更高。
不需要再人工总结问题和标注,而是让机器从上百万的图片中自动学习,就可以找到自动找到这些缺陷,而且还能发现新的问题。我们原来需要10个人,需要只要一个就行了,他只要保证机器不出大的问题就可以了。
由此甚至还产生了一些边际效应。通过长期的数据积累和自学习,我们在某些环节提前就能发现问题,不必等到良率出问题了再去解决。我们甚至可以提前一到两个小时预警,把问题扼杀在萌芽期。因此我们的检测效率提升了20%,同时节省了大量人力成本。
再看另一个案例。刚才我们说的是用算法检查产品的缺陷,下面谈谈怎么用数据和算法去发现生产流程中的问题。以前这件事情完全依赖于专家,需要一个干了十多年的老工人去判断哪台机器出了问题。以前我们觉得这个事情AI做不了。后来才发现不是,因为人的经验也是一个数据和知识积累的过程,只要把知识和信息数据化,让算法在流程和数据之间寻找相关性,就能够做到。
下图是传统的深度学习或机器学习的做法。用机器学习的方法建模,对大量的数据做分类或回归,从而找到问题,做一些简单的分类预测。这种做法对数据的要求非常高,需要数据非常干净,还需要人去做标注,把人的知识转化过来。
但我们不这样做,我们用对抗生成网络,用历史数据去生成一个环境,模拟数据产生的过程,让数据更贴近真实情况。为什么要做这个呢?因为生产制造行业的数据极其不平衡,正常的数据非常多,负样本非常少,可能99%都是正样本。如果单纯用这些样本分析,效果非常差。如果我模拟一个环境,就可以让他在线下学习,就像下围棋一样,让机器跟自己下3000万盘棋。这样就会产生更多贴近真实情况的负样本,我们把它用于强化学习去训练预测模型。这个预测模型可以根据你的任务去调整,最终得到想要的效果。
举一个Pump寿命预测的例子。这个工作以前完全靠人的经验,没有几年产线工作经验的人做不了这个。人工检测,稍微判断失误就会导致停机,停机一个小时,将给企业带来非常大的损失。我们现在用机器学习做,一次停机都没有。而且还是提前预测它的健康寿命,提前进行维护和维修,保证它绝不宕机。
前面介绍了TCL在工厂里应用人工智能的两个案例,下面再分享一些我们的经验。
人工智能在工厂里可以做到什么?我觉得有三项:发生了什么、为什么发生、还会发生什么;这是我们已经在实践中证明过的。我们接下来要思考的是,如何更好地把人工智能应用到这些环节。过程中有不少的挑战,因为我们面临着大量结构化和非结构化的数据,如何把数据和人工智能有效结合起来,充分发挥其价值,是我们需要思考的命题。
此外,人工智能能不能做决策,能不能做认知智能,怎么去做,这是很多人关心的话题。从实践来看,我们暂时还没有做到,但这是不是值得研究的方向呢,会不会出来一些新的应用。
还有知识图谱。我们调研大量制造业企业后发现,知识图谱对智能决策和智能预测非常关键。没有知识图谱,说明你对自己的生产工艺流程并不了解。我们希望大家都能建立自己的知识图谱,不是画出来的文本,而是真正数字化的知识图谱。
我们的实践证明,深度学习非常好用。未来它能不能跟自动化学习或者强化学习结合起来呢?从我们的时间来看,这是有效果的。我认为这个方向值得深入研究。
数据方面,有标签的数据实在太重要了。即使我们做了一些自动化学习的方案,也仍然很依赖有标签的数据,有标签的数据越多,对效果的提升就越快。
我们现在的做法是把人工智能加到已有的生产流程中去,它可以起到一些作用,但不能发挥全部价值。于是我们开始思考,现有的生产流程是不是可以改进呢?改变生产的整个框架和流程,把人工智能作为一个核心部件放进去。因为现有的流程一开始就是为人服务的,如果人工智能有效,是不是可以专门为它去设计一个流程呢?我想不只是智能制造,在零售等其他领域这个问题也同样值得思考。
另外,我觉得边缘计算将是人工智能的关键。很多企业——尤其是工厂,很难把数据上传到公有云,他们都有自己的私有云。但是如果所有东西都在私有云上做,成本太高了,这时候边缘计算就可以发挥作用了。我们希望未来的人工智能不需要把所有数据都上传到云端,而是在机器端就已经处理了,只上传一些特征信息,甚至某些功能直接在机器端就能实现。
最后插播一则小广告。TCL跟香港大学合作成了一个人工智能联合研究中心,我们投入了很多资源,也获得了香港政府和香港大学的大力支持。希望有志于人工智能的朋友可以跟我们联系,寻找合作的机会。TCL开放了13个项目,包括智能终端、智能制造、半导体显示材料等,我们将提供自己优势,比如数据和应用场景,欢迎大家来合作。