谷歌正在开发一种使用自己声音的翻译AI

  到一个你不会说当地语言的地方旅游,最糟糕的是当你眯着眼睛看一本常用语手册,张开嘴,准备完全毁掉这种语言时,你会有一种沮丧的感觉。如果那是你的噩梦,那么好消息来了。谷歌正在开发一种可以用你自己的声音讲另一种语言的人工智能。

  在谷歌博客中,人工智能被恰当地命名为Translatotron,被描述为一种端到端、语音到语音的翻译模型。它的新颖之处在于它避开了通常的语音到文本再到文本到语音的转换方法,而这正是谷歌翻译所做的。相反,它使用了一个神经网络,这样它就可以跳过将音频转换为文本的中间步骤,然后再转换回来。它还包括一个“扬声器编码器”,可以保存原始扬声器的声音。

  与传统方法相比,新的人工智能有一些优势。也就是说,谷歌指出了更快的推理速度,消除了复合错误,以及更好地处理不需要翻译的单词,如专有名词和名称。目前,谷歌表示,使用Translatotron的翻译质量落后于传统方法。也就是说,如果您查看示例音频,最终结果不仅相当准确,而且听起来更自然。仍然会有机械的语调,但比亚马逊的Alexa强多了。

  目前,已经有一些文本到语音的翻译应用程序,包括谷歌翻译、SayHi、Microsoft Translator、iTranslate和TripLingo。也就是说,他们都没有在最终产品中使用你真实的声音,这在现实生活中听起来可能有点不舒服 。

  Translatotron可能还在研发中,但我希望在不久的将来,我可以去一次我一直想去的巴黎旅行,而不用在一家高档餐厅里因为把“confit de canard”发错音而尴尬。

  原文出自:https://gizmodo.com/googles-working-on-a-translation-ai-that-uses-your-own-1834825088