论坛 产品库 视频 专题 CIO俱乐部 Windows8 实验室 CMO俱乐部 案例

通过声音、语调表达感情的语音合成技术

发布时间:2014-05-23 14:58:00 来源:比特网 作者:邵鸿明
关键字:富士通 语音合成技术

  我们日常中经常接触到人工语音技术。高速公路上的交通信息播报、城市中的防灾广播、美术馆或博物馆展示的解说以及电话的自动答录等自动语音等等,身边随处可见。起初,这种人工语音都会给人一种电脑制作的声音的感觉,而最近随着技术的进步,能够模仿正常人说话,自然阅读文章的语音技术出现了。为此,未来通过人工合成的语音技术的场景也会越来越多见。

http://journal.jp.fujitsu.com/2014/04/16/01/img/index_pic_1.jpg

  现在被广泛使用的普通语音技术,很难实现人类说话的语调,当然感情差异也很难被表达出来。富士通这一最新的额语音合成技术,就是为了表现出更丰富、更容易被理解的人工语音而推出的。

  原先的语音合成技术,就是简单讲播音员的所念的每一个词记录下来,形成文章,录制成语音文件。因此,为了满足合成需求,需要收集大量录音,准备时间耗费巨大。

  而在最新的技术中,将音质、音调及停顿作为特征收集,然后作为参数进行语音合成。例如,调整该参数后,形成更紧迫感等场合,更如何真实的声音。

  这样一来,就能表现出急躁、发怒的声音了,带有语调也成为了可能。此外,可爱的声音、悦耳的声音都可以合成出来。

  今后只要有记录声音,通过参数的调节,就能达到声音强弱的控制。而且预先收录的声音的音量也可以缩短至原先的1/30,在短时间内合成为新的声音。

  通过这样的方法,例如通过收录动漫的角色、企业社长等人物的声音后,通过声音合成,就能实现正常人的声音阅读文章或者台词了。

  再者,对于生病时可能说不出话的人来说,事先录下声音的话,通过该技术也能够在特殊情况也能够发出自己的声音。

  这一全新的声音合成技术,将会在未来发挥出巨大的作用,并被利用到各种各样的场景中。这也是一个开始。


比特微信账号
比特微信账号

微信扫一扫
关注Chinabyte

返回首页 长微博 返回顶部