“罗马人的路途尽管曲折反复,但最终还是沿着格拉古两兄弟所立路标指示的道路行进。”
这是李彦宏过去推荐的书籍《罗马人的故事》中的一段话,正如主观形态所反映的,百度与李彦宏,也如罗马帝国一般开放、前进。
2018年7月4日的百度AI开发者大会不同于以往,因着陆奇的离开,落在李彦宏肩头的担子更重了些。
相较于去年坐在无人车内、驶在五环、还吃了一张罚单的境况,今年的的李彦宏开门见山、话带机锋——“造车和造PPT不一样,造车会经常有延迟交付的……”不过百度量产无人车今天如约而至。
“自从上次吃了无人车罚单,不断有人问我百度无人车到底什么时候量产。去年我承诺过2018年7月份实现量产,今天已经是期限了。”李彦宏继而卖了个关子说:“创新总是有很多风险,造车也跟造PPT不太一样的。造车是有延迟交付的,做软件的也知道,新系统上线面临很多不确定性,经常有delay,到底能不能实现。”
“皮一下很开心”的李厂长随即将镜头切到厦门金龙联合汽车工业有限公司董事长谢思瑜,见证了第100台“阿波龙”的量产下线。
据雷锋网了解,此次百度量产的“阿波龙”将发往北京、雄安、深圳、福建平潭、湖北武汉、日本东京等地开展商业化运营。在日本,阿波龙将被用于一些核电站内部的人员接驳,也会用于东京地区一些高龄化社区的穿梭接送。其中,“阿波龙”销往日本实现我国自动驾驶电动车的首次“出海”。
此次“阿波龙”搭载的“面向量产的解决方案”,成为 Apollo 3.0的核心。其所发布的三套自动驾驶解决方案帮助开发者及合作伙伴三个月内即可打造出属于自己的“阿波龙”。
李彦宏称,今天的“阿波龙”从机械结构上看起来是减少了汽车零件数,还没有驾驶位和方向盘。但实际上背后是 Apollo 开放平台的快速发展,仅 Apollo 托管在 GitHub 上的开放代码数量,在一年之内就增长了6倍。
今年1月,百度发布Apollo 2.0 ,具备最开放、最完整、最安全的自动驾驶能力,百度 Apollo 平台研发负责人王京傲称——这是“one giant leap in to future”。支持简单城市道路的自动驾驶,同时在高速上也能无压力运行。
实际上,百度在Apollo无人驾驶方面的开放,最能反映李彦宏于百度AI方面持有的开放、积极态度——百度自动驾驶团队一直与“阿波罗生态圈”的合作伙伴们密切合作,不断迭代自动驾驶原型车。这其中就包括百度联合英伟达、AutonomouStuff 共同打造的搭载了 Apollo 2.0 系统的 L4 级别林肯 MKZ 自动驾驶原型车以及百度与采埃孚、盼达用车联手推出的首款搭载了采埃孚自动驾驶控制平台 ProAI 的 L3 级别自动驾驶共享车型。
陆奇当时评价称“这是最强大的自动驾驶生态,也是整个工业最强大的自动驾驶布局。”
除了百辆无人车实现量产,百度此次另一大亮点,就是李彦宏发布了由百度自主研发的中国首款云端全功能AI芯片——“昆仑”。
据雷锋网了解,“昆仑”是中国在大规模AI运算实践中催生出的芯片,基于百度8年的CPU、GPU和FPGA的AI加速器的研发,20多次迭代而生,需要特别注意的是,目前该芯片还没有实现量产,预计将于明年流片。
具体参数上,“昆仑”采用14nm 三星工艺;260Tops性能;512GB/s内存带宽;100+瓦特功耗,由几万个小核心构成。概括来讲,“昆仑”具备高性能、高性价比、易用三大特点:
(1)高效:针对语音、NLP、图像等专门优化;
(2)低成本:同等性能下成本降低10倍;
(3)易用:支持paddlepaddle等多个深度学习框架;编程灵活度高;灵活支持训练和预测。
“昆仑”是迄今为止业内设计算力最高的AI芯片(100+瓦特功耗下提供260Tops性能),可高效地同时满足训练和推断的需求,除了常用深度学习算法等云端需求,还能适配诸如自然语言处理,大规模语音识别,自动驾驶,大规模推荐等具体终端场景的计算需求。
中国著名计算机专家,首批中国工程院院士倪光南对此表示,百度一贯重视AI,这次做AI芯片,可以发挥他们在AI方面的积累的技术优势,而且做出的芯片可以首先在它自己的AI平台及其应用上得到应用,通过应用可以推动芯片的发展,形成一个良性循环。当然,如果这个芯片使用效果好,就可以被更多的用户所采用。大家知道,芯片的成功,需要有生态的支持,这方面百度有较好的条件。
实际上据雷锋网了解,早在2013年,百度即成立全球首个以深度学习命名的研究院IDL,并于多个场合强调AI战略布局以及在国家层面的意义。
围绕着开放包容的核心,李彦宏称百度的使命就是让人们最平等便捷地获取信息——通过技术创新,不断弥合信息鸿沟。在未来,百度将通过把积累多年的AI技术,也就是数据、算力、算法开放出来,让人们平等获取AI能力,来一起跨越 “智能鸿沟”。
据雷锋网了解,从去年11月份百度世界大会到现在,百度语音能力的调用次数增长了94%,视觉能力日调用量增长了416%,自然语言处理日调用次数增长了180%。此外,视觉中的人脸识别技术,调用次数更是涨了近8倍。这些显著的增长也仅仅是开始。
李彦宏称——因为开源和开放,AI正在渗透到经济社会毛细血管中。
具体案例上,李彦宏邀请援藏医生陈静飞展示了由百度 AI 技术成功训练出的一套可以辅助基层医生用显微镜识别寄生虫虫卵的模型。这套系统只用了几个月时间就训练完成,已经可以识别10多种寄生虫虫卵,其中几种在小范围临床检验试点里识别准确率稳定在97%以上,识别能力相当于一位具有20多年临床经验的检验专家。
李彦宏于 AI 方面的开放布局,另一个体现,便是在近年来频繁举办的百度AI 开发者实战营上,帮助各行各业的合作伙伴真正用上百度 AI。
四月的实战营活动上,百度更是直接开放 EasyDL 平台、发布「深度学习工程师评价标准」、人脸识别全部接口面向中小企业与开发者将永久免费。
对于中小企业颇为在意的成本问题,百度 AI 更是直接提供免费模式——对于人脸应用 QPS 不高的中小企业,可以永久免费使用百度AI开放平台语音技术,而对于有大量需求的企业,人脸识别的调用成本降低 40%。
百度在资费方面的普惠直接体现了李彦宏在 AI 平台与技术开放上的坚持——希望早日实现技术”平民化“,让所有的合作伙伴都能使用百度 AI 技术做出更多产品和创新,进而惠及全社会。
百度大脑是另一项体现李彦宏开放态度的产品。
百度高级副总裁、AI技术平台体系(AIG)总负责人、兼任百度研究院院长王海峰出场,宣布推出了百度大脑3.0。
王海峰总结过往百度大脑版本称——
百度大脑1.0完成了基础能力的搭建和新技术的初步开放,对外开放20多种能力;
2017年百度大脑2.0已形成完整体系,开放60多种能力;
今天的百度大脑3.0已开放110多项能力,AI技术能力也在不断提升。人百度大脑3.0最大的优势,就是多模态深度语义理解技术。
王海峰在现场演示AI如何看世界杯,机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件,进而提炼出结构化语义信息。
此外,百度大脑视觉语义化技术还能被运用到无人超市中去——无人超市等新零售场景中,视觉语义化技术可以准确识别顾客“拿起商品”、“放下商品”、“将商品从A处放到B处”等行为,从而判断用户购买了哪些商品,并在用户离店时通过人脸支付主动扣款。
总之,百度大脑的语音语义一体化技术,配合WaveNet+拼接情感语义合成技术,可以提高语音识别的流畅度以及自然度。如对百度地图导航进行的改进,更加智能的通过语音识别进行道路规划等。
百度大脑是在2016年9月,百度首次向外界展示的人工智能综合平台,同时向开发者、创业者以及传统企业开放百度大脑的核心功能和底层技术。
当时,百度即宣布向各行业开放百度大脑平台,并衍生出不同领域的行业大脑——医疗大脑、交通大脑、金融大脑等。“有了开放共享,(百度大脑)将给各行各业的人群带来过去大家做不到的、不敢想的能力。”李彦宏称。
智能小程序与DuerOS
在布局未来AI核心业务的同时,Robin将AI 融入到现有营收支撑业务——搜索之上。智能小程序的发布,就是百度扩大AI场景应用、创新流量分发模式的案例。
百度副总裁沈抖宣布,智能小程序正式上线,他表示,百度智能小程序全面接入百度大脑3.0,开发者几行代码就可以调用,同时,智能小程序将于今年12月全面开源,未来智能小程序不仅可以运行于百度系App上,还将可以运营于哔哩哔哩、58同城等外部合作伙伴App上。
现场,沈抖携知名说唱歌手孙八一,发布“爱说唱”智能小程序。借助“爱说唱”智能小程序,用户只需选择背景音乐,然后说出歌词,就可自动生成一段有模有样的RAP歌曲。
Apollo之外,百度AI另一核心——DuerOS 伴随着百度智能生活事业群组(SLG)总经理景鲲的上台而登场。
“分享与合作才是这个时代的‘聚宝盆’。”李彦宏如此阐释百度开放战略的初衷。而百度 AI 战略布局上,另一个最能体现李彦宏此番理念的,就是百度DuerOS 。
景鲲首先分享了DuerOS的最新数据——截至2018年6月,DuerOS智能设备激活量超过9000万,月活跃设备超过2500万。场景上,DuerOS几乎全部覆盖了电视、手机、音箱、儿童设备、汽车等各类场景,而且每个领域DuerOS都和国内头部厂商达成了合作,如华为P20、P20 Pro、vivo X21、NEX,OPPO FindX等。
景鲲表示,目前 DuerOS3.0在国内率先打通商业模式闭环生态,开发者可通过四种方式从DuerOS获取收益。尤其是动对话式技能商业分成模式,前6个月,技能收入100%回馈开发者。
除了唱吧和VIPKID等知名创业公司,在DuerOS上面还有超过16000人的智能语音开发者在为DuerOS打造技能。
DuerOS3.0的最大亮点则是在国内率先打通了商业模式闭环生态,这意味着为DuerOS增添新技能的开发者,可以通过技能开发“淘金”变现。
作为国内首个让开发者有收益的对话式AI平台,开发者可通过四种方式从DuerOS获取收益:技能内付费、付费技能、亿元开发者支持计划、DuerOS对话技能大赛。
当天,DuerOS 正式启动商业分成模式,当景鲲宣布在前6个月将会把技能收入100%回馈开发者时,引发现场开发者的尖叫欢呼。DuerOS亿元开发者支持计划和DuerOS对话技能大赛也在当天启动,鼓励开发者打造更优质的技能。
《罗马人的故事》中讲到,古罗马人智力不及希腊人,体力不及高卢人和日耳曼人,技术不及埃特鲁利亚人,经济不及迦太基人,但为什么能够一一打败对手,建立并维持一个庞大的罗马帝国。是因其热情、开放、积极探索的民族性格。在时间的长河里,输或者赢都只是暂时的一种状态,后来者仅仅也只能知道当时的概貌,期间到底发生过什么,大概只有坚持自我的当局者才会清楚。李彦宏推荐并研读这本书,大概也是因书中所传达的开放的理念与态度。
“ 不必引用普鲁塔克的话,我们也能想到,罗马人只是忠于自己的性格而已。”忠于自我性格的李彦宏,正在率领百度战队,走向愈发清晰的 AI 前景。