在央视纪录频道播出的大型纪录片《创新中国》,可以说是今年非常热门的纪录片了。《创新中国》最大的亮点是,解说部分全程利用人工智能配音,同时也让这部片子成为世界首部利用人工智能模拟人声完成配音的纪录片。
《创新中国》合成模仿的是“配音大师”李易的声音,很多网友纷纷表示听不出来是机器在配音。”就连央视主持人朱军、李瑞英也不得不为这样的技术折服。李易老师在2013年就已去逝,而人工智能却实现了原声“重现”,究竟是采用什么样的技术才达到 “以假乱真”的效果呢?
1. 如何实现AI为纪录片配音?
其实人工智能合成语言早已出现,语音识别技术作为人工智能的一部分,中国已达到世界领先水平,目前也已应用在多个领域。比如高德地图志玲姐姐的语音导航、听Angela baby版本的天气播报、有声阅读让看书不再枯燥...这些AI配音正在为我们的生活带来便利。但作为全球第一部全篇采用人工智能配音的纪录片,很多人还是对《创新中国》产生了疑问。
2.AI能否取代人工配音
AI配音在《创新中国》中的试验看起来非常成功,如果在行业内广泛应用,配音这个职业真的会被AI取代吗?同样的道理,译制片、动画片、电影、电视剧是不是也可以利用AI进行配音呢?配音这个行业是不是不需要真人了呢?答案并没有这么简单。
以《创新中国》为例,片中配音整体效果很好,从表面上几乎听不出太多差别,但仔细听不难发现依然存在很多问题。比如片中第一集的配音:“与市面上其他无人机相比,物流无人机的不同在于,它既要适应高频次的飞行,还要保证把货物安全送往目的地…”,这段AI配音字与字之间的黏连太过机械,重音也不清晰,这样的情况出现了很多处。又如配音:“2017年9月15日深夜,72岁的天文学家,中国“天眼之父”南仁东去逝。”这段应该表达对科学家的怀念之情,但是AI的配音冰冷刻板,没有感情色彩。
除此之外,对于激动等情绪的表达,也明显能够感受到AI和真人配音之间的差距。为了达到最大的效果,技术团队从细节做起,不断反复对比几个版本内容的差别,在字与字之间的流畅性、个别词语的重音、语句的节奏变化和合成后的噪音等问题上入手,利用专业的算法程序进行针对性的优化,进一步改善了发音、音质、重音、停连等方面的效果。即使是这样,配音中需要流露感情的地方,机器人也没有办法实现。
除了纪录片,其他类型的影视作品配音更需要感情丰富的配音员进行艺术演绎,AI配音目前还达不到要求。