利用深度学习做语音交互的开发者,很可能对两个谷歌的产品特别关心:
五月初,谷歌 AIY 项目(“Artificial Intelligence Yourself”)的首款产品——Voice Kit 面世。
Voice Kit 套件可借助 Google Assistant SDK 和 Cloud Speech API,将树莓派3 转换为语音数字助理。用户可在此基础上创建虚拟语音助手、为自己的项目添加语音交互功能。当时,在全球开售的几小时内,Voice Kit 就被抢光——这对谷歌而言是一个很强烈的信号。AI 社区对 DIY 人工智能开发套件的需求存在,并且特别强烈。
上周,谷歌 AIY 和 TensorFlow 团队开源了语音命令数据集。该数据集包含数千个志愿者对 30 个命令短语 65000 次长约一秒钟的发音。开发者可借此创建最基础的语音交互应用。
今日,好消息来了。雷锋网 AI 科技评论获知:谷歌将把两者结合,下个版本的 Voice Kit 会内置语音命令数据集。用新版的 Voice Kit,开发者可直接搭建能用简单语音命令交互的 DIY 设备,不需要设置以某个按钮开启语音交互功能,也不需要联网。
新版 Voice Kit 今日在美国开启预订。开发者也可在线下门店,以及线上 Micro Center 购买。谷歌表示,年底将向全球市场开放购买。
如果等不及,你可能就不得不自己动手了。一名叫 Shivasiddarth 的开发者,就在 hackster 创建了“Make Your Own Google Voice HAT”(“制作你自己的谷歌 Voice HAT”)项目,指点大家如何自己动手。
谷歌表示,AIY 项目的最终目的,是“让开发者进行实验,制作能理解人类语音、视觉和动作的设备”。
雷锋网还得到消息,下一步,谷歌将推出能与 Voice Kit 配套的视觉、动作检测工具。AIY 项目将会向大家提供具备“眼睛”“耳朵”“嗓音”“平衡”功能的开发套件,创造简单但强大的人机交互。
“1986 Google Pi 对讲机”
受老式对讲机的启发,Martin Mander 用 Voice Kit 搞出了这么个玩意儿:
他称之为 “1986 Google Pi 对讲机”。这是一个“挂在墙上的谷歌语音助理”,硬件包含树莓派3、谷歌 AIY 的 Voice Kit,以及他用 4 英镑买的一部 1980 年代中期的对讲机。
DIY Dalek
英剧《神秘博士》的粉丝可能会喜欢这个:Tom Minnich 搞了个 Dalek 嗓音的语音助理。
当他问:“生命的意义是什么?”
“Dalek”回答道:“我有生产商的质保,所以用不着考虑这种问题。”
网络直播收音机
Victor Van Hee 用 Voice Kit 开发了一套语音控制的网络直播收音机,也能播放其它音频文件。
雷锋网