在今天凌晨的Made by Google大会上,谷歌秀出其“AI+硬件+软件"整体实力。
大会上,谷歌一口气发布了5款硬件,包括Google Pixel 3/ Pixel 3XL手机、Google Pixel Slate平板电脑、Google Home Hub智能音箱、Google Pixel Stand无线充电底座,但是在雷锋网看来,硬件显然不是重点。
谷歌将包括Google Maps/Calendar/Photos/Youtube等全线产品都整合进了手机、智能音箱中,在全新的场景中升级体验,同时,谷歌将自己积累多年的AI能力全部整合进硬件产品,包括:自然语言处理、对话式人工智能、图像处理、AR等。这个气势和上个月的苹果秋季新品发布会有得一拼。
Pixel 3最令人惊艳的一个新功能是,它可以自动帮你接电话了。
这个功能被称为Call Screen。
在很多的情况下,你可能无法接听拨打进来的电话,此时,你可以点击屏幕上的Call Screen,此时谷歌就接管下了你的电话。谷歌会以文字对话的方式显示接管后的对话内容,首先谷歌会告诉来电者谷歌已经接管电话,要求其说明来电者名字和来电目的,用户可以根据反馈信息决定接起电话还是拒绝电话,还可以一键拉黑骚扰电话。
谷歌演示这个功能时,台下不少人发出Wow的声音。不得不说,Call Screen这个功能就像一个贴身秘书。
这应该是Google Assistant扩展的又一新场景。此前,谷歌Google Assistant推出能模仿人类给餐厅拨打电话订座的Duplex,其也正式开始在手机上使用,Pixel 3将在11月1日首发这一功能。
5月发布的Duplex刷爆了朋友圈,主要是因为其具有和真人一样的声音和语调,并且能正确地使用“umms” 、“uhhs”等语气词,很多接到Duplex电话的用户无法辨认其是机器人。这一问题也引发了争议,因为在加州等地区,这样做是不合法的。现在Duplex在打电话时会首先告知其为机器人。
据雷锋网了解,谷歌在今年夏天开始进行Duplex测试,主要是预定餐厅、理发店等行程安排事宜,谷歌称80%的测试电话都能在没有人类干预的情况下顺利进行。
现在,Pixel 3中的Duplex能在纽约,亚特兰大,凤凰城和旧金山湾区这四大地区使用,随后会扩展到更多地区。
当然,智能音箱才是Google Assistant的天然领地。谷歌新发布的Google Home Hub智能音箱目前整合了谷歌的全线产品,包括:Calendar、Maps、YouTube、Search、Photos,为了给每个用户提供整合所有产品的个性化体验,谷歌推出了新功能 Voice match,其可以识别不同的对话者,然后根据说话者个人账户信息,提供日程、交通、提醒事项等个性化服务。
除了强大的对话式人工智能之外,Pixel 3还首发了Google Gmail邮件自动预测下文的功能。当你用Google Gmail写邮件时,Gmail可以根据你已经输入的文字预测你即将输入的下文内容,比如如果你提到地址,就会自动显示出你的常用地址,一键输入。这个功能是首次支持智能手机。
以上的新功能都来自于谷歌多年的自然语言处理技术积累。谷歌一开始做自然语言处理是为了提升搜索引擎的准确度,而后运用来做翻译、对话式人工智能、邮件预测等。在对话式人工智能方面,谷歌Duplex目前已然超过苹果Siri,不过苹果也在通过Shortcuts、Siri Suggestions等功能使得对话式人工智能为用户提供更多的便捷服务。
拍照是智能手机一项重大的功能,也是各大公司卖弄AI技术的关键。8月份,三星推出Galaxy Note 9时,它展示了全新的AI赋能的相机,其具备场景优化器和缺陷检测,可以在拍摄之前调整曝光和颜色。上个月,苹果发布iPhone XS时,也重点展示了如何其A12仿生芯片和神经网络引擎加持的AI拍照,比如Smart HDR拍摄、后期调焦等。
现在,该是谷歌的show time了。
Pixel系列手机的拍照功能一直有不错的认可度,它还有更多惊喜吗?谷歌的回答是,你可以用AI做的事情,我们可以做得更好。
Google Pixel相机团队的产品经理Isaac Reynolds表示,该公司在Pixel 3相机上的工作在Pixel 2手机推出之前就开始了。“如果手机会提前12到24个月启动,相机工作还要早六到八个月开始,”在那段时间里,Pixel相机团队确定了多达10个功能,但不是所有功能最后都进入了Pixel 3。
低光照是谷歌一直在研究的领域,目前也已经有很好的进展。谷歌对Pixel 3的Night Sight夜间模式很是自信,一上来就赤裸裸地展示了与iPhone XS夜间拍照效果的对比图。
不知道苹果做何感想。
谷歌此次更新的一系列拍照功能,大部分是解决人并不擅长的事情,比如人不擅长在拍照时静止不动、不知道如何做出最自然的表情、也不知道如何能把所有人都放进镜头。
Top Shot 功能:其可以连续拍摄多张HDR+照片,然后从中选出最好的一张,将眨眼、抖动这样的废片去除掉。这一项功能是通过用百万张图片来训练机器学习实现的。
Photo Booth 模式:简单来说,当拍摄的人物处于运动时其将不会拍摄,而当相机发现人脸上有微笑和有趣的表情时,它将自动拍摄。
Super Res Zoom:“超级分辨率”变焦,通过AI补偿图像放大之后的像素,提供超分辨率变焦图像,人工智能填充像素空白。
运动自动对焦:其可以持续追踪移动的物体,持续对焦。
Group Selfie Cam功能: Pixel 3前置摄像头现在由1200万像素的两个广角摄像头镜头组成,更适合广角自拍。用户可以调整相机取景的宽度,更加适合多人拍摄,取景范围增加180%。
以上的功能更多的是计算摄影,谷歌也带来了计算机视觉、AR的全面更新。
首先是图片搜索,此前,图片搜索依靠的是图片的标签,而现在谷歌希望能够直接理解图片内容来进行搜索。经过二十年的CV技术积累,谷歌目前能理解图像中的物体、人脸甚至是概念。
Pixel 3的相机除了拍照外也具备了更强的理解功能。比如,用手机拍摄电影海报就能获得详细的院线排片信息,查看演员的简介。此外,当你看到你朋友戴了一副很好看的墨镜时,还可以直接用相机去识别,获得商品信息。
最后是谷歌一向重视的AR。目前,谷歌的前置和后置摄像头都能支持AR,其新推出Playground 模式,该模式允许用户为场景添加 AR 形象及其他场景、贴纸等,有了更多的内容。在使用前置摄像头自拍时,AR内容还能够模仿人的动作,与人互动。
这一系列的新功能可谓是十全大补丸了。谷歌将现在市面上有的拍照新功能都挨个实现了,在很多手机厂商用双镜头甚至3个镜头时,谷歌依然只有前后的单镜头,它是如何做到的呢?
谷歌产品管理部门副总裁马里奥·奎罗兹说:“我们发现并不需要另一个镜头”,得益于机器学习等知识,Pixel已经能通过传感器获得足够的深度信息,然后通过上百万照片的训练,来产生需要的照片效果。当相机组件成为智能手机成本的关键因素时,这或许是谷歌这样专注软件的公司能给出的最好答案。
不过,AI还是得依靠硬件支持的足够算力,这是谷歌无法逃避的一点。Pixel 3相机的AI功能实现依赖于其此前与英特尔合作的视觉芯片Visual Core,其作为作为Pixel相机的专用AI芯片,最初在Pixel 2推出。正如苹果的A12仿生芯片支持其Smart HDR一样,Visul Core成就了Pixel值得称赞的HDR +模式。
在这次Made by Google大会上,谷歌推出了5款新硬件,展示了AI+硬件+软件的整体实力。可以看到,5款硬件与谷歌的全系列产品都有了无缝的整合,Google Photos/Maps/Calensar/YouTube/Google Assistant在Pixel手机、Google Home Hub智能音箱里有了全新的场景和体验;谷歌的自然语言处理、计算机视觉等AI能力也全程在线,Pixel 3的Google Assistant能够帮助用户接听电话,多项全新拍照功能也足够炫酷。
不过,在雷锋网看来,上个月发布iPhone XS系列产品的苹果相比,谷歌在软件、硬件的整合上还只能算是新手。目前,苹果的7nm制造工艺的A12仿生芯片配合上神经网络引擎已经成为移动终端最强芯片。苹果还通过Core ML和Create ML等机器学习工具,建立起AI开发者生态,将自己的AI能力开放给上千万苹果开发者,为iPhone开发更多的AI应用。
在AI+软件+硬件这条路上,巨头们你追我赶之势,越加明显了。
相关文章: