百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

深度学习百度滴滴吴恩达

作者：董飞

2016/05/19 19:13

按：本文作者董飞，整理自百度深度学习研究院人机交互负责人顾嘉唯在硅谷关于智能计算和无人车的讲座雷锋网首发，转载请注明出处和作者。公号：董老师在硅谷。

前天看到新闻苹果10亿美元投资了滴滴，感觉是醉翁之意不在酒，苹果在2013年WWDC上就发布了iOS in the car的车载系统，后来升级成为CarPlay，后来又从特斯拉挖角，研发成本大幅上升，可以揣测秘密筹备自己的无人驾驶技术iCar，而滴滴庞大的用户量可以给苹果提供真实的大数据样本，对于苹果自主研发智能汽车和智能驾驶都是直接获益，所以这次可以说是为了无人车布局，具体怎么整合到iOS，我们期待一下6月的WWDC见分晓吧。

这是一周前百度少帅在硅谷关于智能计算和无人车的讲座。全文整理如下：

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

顾嘉唯是谁？

顾嘉唯是百度深度学习研究院人机交互负责人，主任研发构架师，百度少帅，主要研发项目为新型用户体验和智能化（包括可穿戴设备、智能交通、智能家居、机器人和物联网）

他主导利用深度学习和大数据的人工智能技术创造自然的用户界面和新颖的互动方式。领导项目包括：百度智能眼镜BaiduEye，盲人智能助理DuLight，实时变脸App脸优Face-It和百度智能自行车DuBike等。

他所在百度的IDL（深度学习实验室）是由余凯建立，现在余凯创业做机器人智能——地平线机器人公司。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

先从一个引子说起：现代人最焦躁的问题，没wifi，一直在载入和没电，时不时就要摸一下口袋，感觉手机随时都在震动，每时每刻都在用手机，就像一个人体器官。而其中微信可能就要占用85%以上的耗电。我们每天无时不刻被各种提醒或信息提示打扰，我们是被数字世界绑架的一代人。回到90年代前，我们没有那么多联网设备，那是一个“不插电”的时代，那时候人与人之间真诚的交流远多过于今天。我们可以预见不久的将来IOT物联网时代，每个人身边充斥各种联网的智能设备，设备之间的摩擦将会无以复加。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

| “互联网+”的实现

自互联网衍生以来，其发展经历了三个阶段：

第一阶段：满足基础的通讯功能（通讯，门户，社交）
第二阶段：满足大众娱乐需求（视频，游戏，电商，音乐，阅读，服务）
第三阶段：实现互联网+X 在各个领域：金融，教育，旅游，医疗，餐饮，汽车…….而这个X预示着无尽的可能性与商机。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

自互联网于1995年兴起到现如今2015年，我们正在实现从第二阶段到第三阶段的过渡。而O2O（On demand service）在中国的兴盛也由中国市场的两大因素构成：社会劳动力价格低廉，服务需求密度高，以至于涵盖了生活各个方面的生活服务类APP的兴盛。因此当代的年轻人都更为热衷于用这种更方便快捷并且能获取充足信息量的方式实现生活中的服务需求：电影购票，美甲，按摩，买蔬果，上门寄养动物，甚至上门打胎……两个不可逆的趋势：线下细分服务的线上化，和服务链接的碎片化。

吐槽：这么多你可以连接服务的APP，手机能装得下么？

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

即使你已经觉得这样够方便了，但其实其中还存在着小bug，当你被大量可选择信息淹没的时候，你的选择障碍症让你无从下手。当你需要在不同的App上切换以实现信息处理、物品购买、微信沟通、导航的时候，你仍然会觉得焦头烂额…….因此，更加智能化的设备具有很高市场需求以节省人类的时间和精力。但还是需要回归到商业本质——那么，如何商业化？

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

即使你已经觉得这样够方便了，其实其中还存在着小bug，当你被大量的可选择信息淹没的时候，你的选择障碍症让你无从下手。当你需要在不同App上切换以实现信息处理，物品购买，微信沟通，导航的时候，你仍然会觉得焦头烂额…….因此，更加智能化的设备具有很高其市场需求以节省人类的时间和精力。本质是AI着眼于解决设备之间的摩擦，通过场景感知和用户意图预测。

现在人工智能已经被媒体和社会炒作地如此火热，就像之前所有IT公司都称自己是做大数据的，今天所有创业公司如果不讲点和AI沾边的梗，都不好意思说自己是科技公司，那么多打着“智能”旗号的，但最终还是需要回归到商业本质，如何商业化？如何讲人工智能技术商业化？在百度深度学习研究院的职责就是将百度的人工智能技术以创新产品线的方式进行商业化AI的迭代。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

Amazon Echo 已百万级的销量，入户后相对高频的内容场景，回味之前发的微信朋友圈一条评价Apple Siri、Google Now、MSFT Cortana、Amazon Alexa的record，很明显，Amazon Alexa在硬件入口上的投入和坚定比Google MSFT Apple都有耐心得多。

自然人机交互 Conversational UI对话交互在手机上一定是最容易开始，但最快会过去的一波，在手机这个小盒子里，Facebook也好微信也好上各种chat bots想要通过智能多轮对话交互完全取代APP的愿景是好的，场景是纠结的。

Amazon Echo的阶段性成绩算是开启了，无论是Amazon的echo还是Google Now，或是苹果siri，Facebook的M机器人，微软小娜小冰，平台型技术都在蓄力阶段，智能对话交互新一代终端的“feature phone”早期时代显现，谁能做出最新一代交互时代的“iPhone”突破性产品，让我们拭目以待。

我们看到一路走来Amazon Echo的初步成果的原因，可以总结如下三条：

1、持续投入底层识别语音NLP整条链基础技术；
2、背后的数据服务链接，从内容调用到服务消费行为；
3、利用一定的刚需培养用户交互习惯作为切入点，市场的持续教育培养，耐心与坚持。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

回顾历史，最早是基于命令行，然后有了图形界面GUI，之后有了平板，很容易上手，现在是语音，手势的NUI，未来人机交互是什么？基于人工智能的AIUI的革命创新。

现代年轻人从物联网-移动互联网-移动互联网+的需求的逐步提升。当用户不断地在不同的APP之间跳转时我们需要一个更智能化的平台，这个平台能够打通不同APP之间的边界，把人找服务（APP）的模式改变为服务（APP）找人的智能化模式。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

Deepmind创造的AlphaGo通过对KGS服务器上千万个棋局点的统计分析，事先算出不同棋局状态下，最有可能下子位置的概率分布。然后根据这个概率分布，进行蒙特卡洛树搜索（MCTS），快速的推算如果走某一步，对方可能会走哪些步，然后对各种可能性依据概率进行加权汇总，计算出胜算的期望值。AlphaGo是Google的一次相当成功的PR，验证了深度学习和大规模并行计算能力的实力。

而他认为，智能助理和无人车才是真正改变人类生活的人工智能商业化前景。事实上下围棋还是有限范围内的解决方法，而实际环境道路变量还是非常多，在一个更大的维度上。通过高精度地图，高精度摄像，就比如在路面上还有人驾驶的汽车与无人车共存的阶段，红绿灯识别上还是很多复杂因素，不是简单的数据问题。

除此之外还有非常多真实世界复杂的视觉问题，要达到准确的视觉判断能力，机器必须拥有真正的认知能力和常识，这并不是AlphaGo所用的树搜索和神经网络那么简单的方法，就可以解决的。由于需要以极高的速度处理“模拟信号”，机器视觉可能根本就不是人们常用的“数字计算机”可以解决的问题。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

另一个问题是在如今如此繁荣以及多样的O2O服务平台上，某个用户无法实现能够同时拥有大量的面向不同产品的APP并从中筛选出最优化信息。因此百度在研发度秘一类的产品优化了这种用户体验即通过与度秘对话聊天的形式来智能化的提供给用户需要的服务建议以及服务连接。在去年百度大会上，李厂长就演示了通过度秘语言操作点了一杯咖啡，直接送货上门的服务。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

这其中很酷的一项功能是度秘可以通过图像分析来解读用户的需求。比较有趣的一个例子是：如果你把腿磕破了，可以上传照片给度秘，度秘会提供药品以及附近医生的建议。上面就是度秘在实体肯德基店里作为服务员帮顾客点餐的活动。

| 如何实现从“互联网+”到“智能+”

虽然现阶段APP十分的盛行，但是在不久的未来，以下三个要素会实现更智能化的all demand service，那时候App会消失，取而代之的是下一时代人与信息连接的节点。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

个人助理是很大可能是下一代的搜索引擎，通过自然原因处理，语音识别，人工智能的结合。

不断提升的智能系统（Emerging Intelligence）——人工智能的提升要基于数据量的提升+数据算法的提升
场景感知 (Context Awareness)
无处不在的计算（Ubiquitous Computing）

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

从“互联网+”到“智能+”需要以下几个要素

AI 技术的实现
人机交互技术（CLI – GUI – TUI – NUI (natural: speech, gesture)）而NUI是现阶段各大网络公司在投入研发并希望抢占市场先机。
互联网的智能化反作用会逐渐重塑人类的行为习惯，从而改变现阶段产品的形态及种类。
互联网和送达人的服务不再由人来完成而是由机器人完成。

当AI技术逐渐开始被平台化，等各种bot framework和AI open API建立起来之后，层出不穷的基于人工智能的创业公司会像今天的互联网创业公司一样如雨后春一般兴起。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

这里，我把物联网（IOT）分成联网设备（smart device）和自动化家居（home automation），用户要的是什么？并不是左边的联网设备，而是右边的智能自动化场景。举例，早上起床闹铃把我叫醒，我当天的日历上有我一早开会的时间地点，根据现在路况和距离推算出我还有多久要出门，提醒我有多少时间洗漱吃早饭。

我的咖啡机、面包机在我闹钟响的时候就运作起来了。当我洗漱、早餐完毕之后，会议室目的地坐标就会在无人车导航里，下楼坐上车以后，直接把我运到相应的位置。用户是需要这样的智能自动化场景，但真实情况下，这种场景中的变量很多，简单的联网硬件无法处理和预判用户的多维场景，更没有全场景自动化服务的可能了。好的用户体验设计不只是让东西可以运作起来，更应该考虑让他不会出错，但不幸的是，大多数自动化智能场景都只是热衷于让东西联动运转起来，而完全不考虑出错怎么办。这里，我们做智能化一定切记，人类不是算法逻辑，更不能简单粗暴地把数字规则应用于模拟物理任务上去。

智能硬件现在有几个误区，有人将能联网的硬件当做智能硬件；也有人将有App控制的硬件当做智能硬件，还有人把加上充电宝的硬件叫智能硬件，就像“八星八箭，有mp3功能一样”。

在顾帅眼中认为的真正的“万物智能”时代的产品应该具备以下三大要素：

1. 还原三次元世界“物”的操作，消灭触屏+App控制（二次元）

忽视人与硬件的直接交互，是一件很不自然的事情。人若想开窗，自然的反应就是用手推开窗，而不是找一个叫做“开窗”的按钮。人与二次元世界沟通，用屏幕是可以理解的，但是人与三次元世界沟通，为什么还要通过屏幕呢？

2. 能学习会决策 AI

智能硬件首先是要“智能”，随着经验演化，越变越聪明，学习的能力，是智能的本质之一。它可以感知世界、理解甚至预测人类的需求，主动调整做出一些符合人类期望的反馈。

这些均需要基于数据收集和挖掘才能做到。如果一个机器是通过感知、理解和决策这一过程完成任务，并且随着经验的积累在不断的演化，那它就是一个能够自我学习的人工智能系统。所谓经验积累，就是数据，数据就是经验。在机器学习这个领域里有一个概念叫经验数据。随着经验演化，也就是随着数据的不断增长，来增长你的能力。从PC互联网时代到移动互联网时代，我们迎来了一个数据爆发式增长的时代，这为人工智能的发展提供了沃土。

3. 做到“用户与物IT交互”同“人与人交流”一样（AI＋HCI）

虽然关于人工智能的准确定义还不明确，但是通常已经形成了一个普遍共识，那就是通过技术手段使人与非人物体之间的交互能与人与人之间的交流类似（对话，洗衣机君）人机交互：电器设备旋钮时代，键盘鼠标时代，触屏智能机时代，智能硬件万物智能时代。

如果依据上面提到的共识来定义，那么智能硬件指的就是使用者能与产品的交互近似于人与人之间交互的硬件产品。按此标准来审视目前市场上的各类智能硬件的话，绝大部分都是不合格的。

| 人工智能的发展与展望

顾帅用下面有趣的火箭图阐释了人工智能的实现方法：

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

如果把人工智能比作火箭的话那么有两个核心元素作为火箭助推器即：大数据作为燃料，深入学习作为引擎。这两个核心早就了人工智能火箭的助推力。

人工智能分为强人工智能与弱人工智能。许多计算机领域的科学家都对强人工智能提出过质疑，比如“铁钉灭世”的猜想，认为人工智能达到一定的高度之后，机器人最终会将指令的执行带入极端从而想消灭人类。但是顾帅认为，现阶段的科学发展还离强人工智能很远，实现弱人工智能依然能够为人类带来无限的方便与可能，但下一步，首先是要解决信息之间的打通和用户行为的预测，进而消除设备与设备之间的摩擦，还原“不插电”的智能生活。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

实现弱人工智能（从底往上）的三个核心是：

感知（Perception）：通过多维传感器搜集人的生理信息和环境的物理信息
理解（Understanding）：即深度学习（Deep Neuronal Network + Deep Learning）
决定（Decision）：比如推荐服务

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

深度学习之所以有很大前景来源于以下几个优势：

具有来自于人脑的运算机制（inspiration by brain）
适合大数据运算（suitable for big data）
端到端的学习体（end-to-end learning）
具有丰富的建模语言（a rich modeling language）

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

这张图体现了深度学习如何影响到未来互联网。

1. 网页的索引知识，搜索，广告，预测

2. 人的维度：图形，声音（百度没有使用科大讯飞的接口，而是自主开发，性能和识别率都非常好）

3. 实体世界：感知到3D，VR，增强现实。

百度搜索在这个方面的进步是可以通过语音的输入来筛选出重要的语义，另一个很酷炫的功能是拥有图像搜索的入口并且能够识别图像进行相关信息的推介。另一个有关深度学习的产品是一款叫“脸优”的APP，其技术核心是深度学习的本地化以及在手机端完成实时把2D图片生成3D图片，并且是只有200k的实时3D化渲染。

Baidu Eye

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

看过电影《她》的同学是否对人工智能感触颇深呢？对于机器人的理解，顾帅是这么解释的，可以接受人类指挥，能感知场景和预测情景，通过自动执行任务，辅助人类拓宽能力的设备，进而协助或取代人类的部分工作，形态多样，可虚可实。比如顾帅领导开发的BaiduEye实现了一款产品类似于一个戴在耳朵边的帮助人们索引实物和连接数字的第三只眼。2014年9月，百度在世界大会展示了 BaiduEye。作为百度新的搜索入口，索引真实世界的尝试，是 “对人工智能和人机交互终极形态的技术探索”，是连接所有计算设备的大脑和终极人机接口。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

有些人拿这个跟Google Glass对比，但其实还是很不一样的。光机如同Google的智能眼镜，显示画幅大小是一个局限，戴上Google Glass眼球会翻白眼，这是很不好的体验。BaiduEye可以通过其图像识别技术实时的为用户对目中所见进行解释答疑或者商品推介，可以在博物馆和商场中使用。比如在商场中给女朋友挑选花或者礼物，商家也知道了你的停留时间和购物习惯，进而做更精准的推荐策略。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

这是Baidu Eye的原理图

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

最好的人机交互是让人意识不到人机交互的存在，我们正朝着这个目标不断演进——BaiduEye。

Baidu Eye 背后核心能力来自百度大脑，也就是集合了百度的人工智能技术引擎。百度希望将百度大脑核心能力通过视听说多维度能力创新实践落地，为公司连接人、数据与服务和 O2O 战略意义带来实质性价值。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

探讨BaiduEye 进入医疗领域的可行性，比如通过 Baidu Eye 进行手术室直播和远程直播，帮助医生远程问诊，最终帮助医疗体系实现分级问诊，合理疏导患者。Baidu Eye有图像识别、语音识别的功能，随着技术成熟度提升和迭代，也许还能有机会切入电子档案这个领域。

DuLight

人工智能技术可以成为给盲人看世界的窗口，为他们点亮生活。在未来，我们希望dulight不仅能帮助正常人更便捷的生活，还能成为盲人的日常生活私人助理。结合百度大数据分析能力和自然人机交互技术，帮助盲人“洞见”真实世界，实现平等的各行各业的服务便利。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

一款可穿戴设备，这款设备是用来帮助盲人和视力障碍者导航的，叫做Dulight，它可以像蓝牙耳机一样挂在耳朵上，能够捕捉任何面前的东西，然后传输到图像识别系统中进行确认。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

当把Dulight指向椅子和盆景，Dulight发声说：“识别中，轻塑料椅，识别中，绿色盆景。”当他把Dulight指向我的时候，Dulight发声说：“这个男人在笑，大约30岁。”Dulight能记住那个人的名字，并在以后认出那个人。

了解到微软最近也做这个类似技术来帮助实现盲人眼镜，这是计算机视觉的一种场景化刚需。

黑科技产品

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

黑百度的梗

顾帅认为，“让机器人能够在棋盘下赢下棋局，还是帮助消费者吃到更热乎、更优质的饭菜，究竟哪一种人工智能更有价值？这或许是一个尚需讨论的话题。”

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

百度外卖骑士的实时调度，应该到哪一个餐馆接哪一个单子送到哪里，他的路线和时间都是由系统决定，系统会实时推送给他。所以智能派单，智能路径规划。

基于互联网大数据与深度学习算法智能优化的外卖解决方案：百度外卖可以实现精准的去单时间和去单分配，通过算法和经验数据计算出不同时段建议餐馆准备的内容时长，并且能够实时计算等候时间，以及根据插单调配情况增加指令信息给送外卖的员工，随着业务增长，随着数据量积累，预测会越来越准确。这样导致外卖小哥觉得自己像个执行指令的机器人，是不是可以脑补一下机器人送外卖就在不久的将来了呢？

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

Uber也使用这个智能系统在中国落地，调配各种数据源，比如哪里有球赛，天气，新闻。

无人驾驶

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

进入2016年，百度正在重新聚焦下一步的方向：用人工智能重塑公司技术架构，包括将之前深度学习实验室孵化的无人车项目扩大，成立自动驾驶事业部。3月，百度在媒体沟通会上高层表示会巨额投资无人驾驶汽车。此外，百度要在未来3-5年内，将激光雷达的价格从70万降到2至3万，从而实现无人车3年商用5年量产的目标。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

无人驾驶汽车的成功涉及高精地图、实时定位以及障碍物检测等多项技术，而这些技术都离不开光学雷达（LiDAR）。最早跟宝马合作的一款无人车。在乌镇的互联网大会上，习大大点赞。极客公园的创始人第一时间体验了一下百度无人车，说是坐过无人车中最激进的，最高时速100公里/h。提到跟传统车软件相比，有恐怖的1300倍的代码量。在新能源趋势下，传统汽车制造向电动汽车转移，零部件的迅速减少大大降低了制造门槛，反倒是在软件上的代码量快速增长，能够预见今后汽车行业玩家的新变化，尤其是无人车技术本质上是基于高性能计算与人工智能技术的核心

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

现在93%以上的事故是有人为因素造成的，行车最大的愿景就是安全，人开车是很危险的，驾驶员反应+液压制动的反应时间是1.2秒，就50米的刹车距离，而计算机电控0.2s，刹车距离6.7米。另外，驾驶员安全视距50米，而自动驾驶汽车的有效视距超过200米，更重要的是没有疲劳驾驶问题。由数字可见，自动驾驶技术首当其冲可以大大降低交通事故的人员伤亡概率。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

除了个体车的自动驾驶技术需要形成突破，车车联网环境下的智能交通更是重点发展方向。举个例子，人到十字路口的时候，因为不知道灯是什么情况，所以会慢下来，所以通过效率是很低的。交通堵塞的一部分原因，就是大家都会慢下来。车和车，车和交通系统都是互联的，这使得汽车可以以比较高的系统通过路段。汽车本身的使用效率也能够提高。能够使道路交通状况改善。

无人车的推行，在整体国家经济上是有非常大的提升的，不仅仅是在极大节省了出行运营成本，还会包括节省下来的出行时间和交通路网城市规划的区域空间，进而提升的国民生产总值。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

自动驾驶的8大技术分支，这必须要跟车厂合作。无人驾驶技术是多个技术的集成，包括了计算机视觉、环境感知、传感器融合、高精定位、高精地图、路径规划、障碍物检测与规避、机械控制、系统集成与优化、能耗与电管理。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

上图显示了无人车的通用系统架构，系统的感知端由不同的传感器组成，其中GPS用于定位，光学雷达（Light Detection And Ranging，简称 LiDAR）用于定位以及障碍物检测，照相机用于基于深度学习的物体识别以及定位辅助。

无人车通用技术发展路径

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

自动驾驶的5个进阶，特定功能辅助：自动巡航，自动泊车，固定路段有限条件自动驾驶，完全自动驾驶。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

两大派系：特斯拉，mobileeye，雷达传感

Google，百度：使用激光雷达（厘米级别定位），高精度雷达。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

Google的自动驾驶汽车很萌很玩具

Google的自动驾驶汽车，可以称为“全自动驾驶汽车”，这种汽车没有方形盘，没有刹车，全部靠感应器和软件自动驾驶，Google宣称它非常安全。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

借助感应器等部件实现对自我和周围环境的认知

特斯拉的“半自动驾驶”更倾向于”有人监督的自动驾驶技术“，就像是飞机的”Autopilot“功能一样，而不是把自己完全交给感应器和软件，并且随时可以切换到人工驾驶模式。使用的硬件包括：

前置摄像头：识别车道，实现车道保持。
前置雷达：加上摄像头追踪前车，控制车速。
12个超声波传感器：感应车辆周围和驾驶员盲区内车辆和障碍物，实现碰撞回避。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

百度深度学习方面的成果在最近两年在多项计算机视觉上的国际竞赛中世界领先，KITTI公开数据集上车辆识别精度百度拿到第一名89.32%！

趋势：汽车新能源化，制造门槛降低
汽车智能化：自动驾驶大势所趋
汽车共享化：高效淘汰低能

同时，顾嘉唯提到，既智能手机在中国市场的大飞跃之后，智能汽车市场一定是中国一块最大的蛋糕，庞大的人口和城市化进程，独特的法律政策环境及消费市场特性，电动车和无人车会在中国接下去几年引爆。中国国情是道路规划车况拥堵很厉害不同于美国公路旷阔，面对复杂的行驶路况，会经常需要刹车停车，中国驾驶者更需要机器帮助人做无人驾驶，机遇与挑战并存，难点与需求共生。

除了前面介绍的大量自动驾驶技术积累之外，在中国做无人车的时候需要考虑的人机交互现实问题：

比如如何解决无人车在经常刹车停车环境下的实时性处理和精密运算压力；比如在国内行人法规意识淡薄的条件下，如何设定无人车的机动预判和决策算法；又比如在中国地图定位限制条件下以及城市规划区域城管法规政策下，在未来叫无人车来接的时候精准定位和最后几百米的人车关系上，如何做到车内的乘客，车外的行人，车的暂时归属权交付和控制权限上的人机融合问题。

在从由自动驾驶车辆和人为驾驶车辆交融的路网条件，过度到完全由自动驾驶替代还有非常长一段路线，在降低技术门槛和成本以及配套法规政策和伦理因素的前提下，自动驾驶技术前景根本上是会首先在公共交通场景下解决固定路段行驶问题，不止是单体车的智能驾驶技术，更重要的是配合低成本车联网传感器和道路路网主动感知融合。

| 未来展望

尽管无人驾驶技术渐趋成熟，但激光雷达始终是一个绕不过去的坎。纯视觉与GPS/IMU的定位以及避障方案虽然价格低，却还不成熟，很难应用到室外场景中；但同时激光雷达价格高居不下，当务之急就是快速把系统成本大幅降低。其中一个较有希望的方法是使用较低价的激光雷达，虽然会损失一些精确度，但可以使用其它的低价传感器与激光雷达做信息混合，补偿算法得到车辆的位置。

通过更好的算法去弥补硬件传感器的不足，无人车近期的发展方向。而高精度激光雷达的价格由于市场需求大增也将会在未来的一两年内出现降幅，为无人车的进一步普及铺路。

属于我们这个时代的 NUI

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

顾帅最后展望了为实现一个“智能+”的时代，称今天的人工智能应用仅露出冰山一角，未来对社会的影响将远超我们的想象！我们需要实现万物互联以搜集充分的有效数据，然后通过神经网络的AI 算法实现对数据的结构化，最后实现基于人工智能的自然人机交互。可以展望在不久的将来，我们可以实现一个全智能化的生活工作环境，互相连接配合的物品可以智能地提供人类需要的服务，如生活助理，秘书一样地存在来便利人类的生活。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

互联网的飞速发展将大大的提升人类的生活体验并且重塑人类的生活方式。经历了比尔盖茨的GUI时代，乔布斯的TUI时代，我们可以期待AIUI时代！

最后附上今年4月百度硅谷研究院一位重要人物加盟，百度首席科学家吴恩达喜形望外在FB上宣布这个消息。

百度少帅顾嘉唯：智能人机对话和自动驾驶汽车才是人工智能的核心场景

刚满30岁的楼天城是目前百度最年轻的T10工程师，他将与百度首席科学家吴恩达一起，全面参与无人车的技术研发。