亚马逊的Alexa又在继续学习新技能,将可以被用于进行专业的新闻解读,几周后,具有“播音员风格”的声音即会被内置于Alexa中。
9月初,亚马逊智能家居副总裁Daniel Rausch在IFA大会上公布了Alexa的各项数据:全球范围内,Alexa已经拥有50,000个技能,与20,000种设备兼容,并与超过3,500个品牌合作。
据雷锋网了解,在2018年年初,Alexa的公布数据还只有4,000种设备,1,200个品牌。几个月时间,各方数据上涨都很快。
雷锋网注:NTTS技术和传统的TTS技术对比
亚马逊称,Alexa新的语音运用了公司开发的 NTTS(neural text-to-speech)技术,这种新一代语音合成技术可以更快地使用机器学习来生成富有表现力的声音。
目前,Alexa使用的是衔接语音合成(concatenative speech synthesis),这种方法已经存在了几十年。该技术将语音样本分解成独立的声音音素,然后缝合在一起形成新的单词和句子。
雷锋网注:衔接语音合成示意图
固然,衔接语音合成效果不错,但新的融入AI技术的方法正在将其迅速迭代。去年10月,谷歌为其谷歌助手采用了一种新型语音合成方法,该方法使用了DeepMind AI实验室最新开发的机器学习技术。
亚马逊称,未来几周内将把Alexa的声音切换成使用神经语音合成的新语音(完整的新闻播音员的声音)。
播音员说话的声音来自于现实生活中新闻频道的录音音频片段,然后使用了机器学习技术识别模仿,使机器可以像播音员一样读新闻。
亚马逊的AI语音负责人Trevor Wood表示,这种方法更容易捕获人类讲话风格的细节。“这其间的细微差别很难用语言描述,但显然,使用AI技术,以数据驱动,可以比人类更有效地捕捉和模拟这些细节”。
值得注意的是,亚马逊说,他们只花了几个小时来训练Alexa的“新闻播音员”声音,这表明未来亚马逊应该还会为Alexa开发出一系列的人类声音风格。
到目前为止,亚马逊已经添加了Alexa耳语模式,再加上几周内将更新的“新闻播音员”声音,我们有望在2019年听到Alexa模仿更多的不同风格的声音。
via: The Verge
相关文章:
问Alexa问题,回答不上来怎么办?别担心,它找到答案就会告诉你