关注2 “原汁原味”的表达让川人一听就有亲切感 方言大赛冠军周玥偲的配音, 是否令人满意? 李辉:从大赛选拔一开始,我们对于选手们的标准就是百里挑一,进入到决赛的选手都是优中选优。周玥偲作为最终选出的声音模特,她的声音是很好听的,也是资深的四川方言用户。更重要的是,她原本的工作就是配音演员,非常符合我们的要求。我希望她能将积极向上、热爱生活的一面表现出来,给人邻家小妹的感觉,把整个四川人骨子里的乐观主义,通过声音表现出来。 天猫精灵开出的700元的时薪, 在业内合理吗? 杨光:我觉得700元一小时的薪水,处于业内中上等水平。按时薪来讲的话,从几十元到几百块的都有。我举个例,录音棚的费用大概是500元一小时,但配音演员一个人的薪水就超过了录音棚、设备、建造费,已经是相当高了。 拿到十万元的报酬, 将做出怎样的分配呢? 周玥偲:十万块钱,可以吃好多好吃的东西哦!我肯定会出去走一趟,走到哪吃到哪。我平时就喜欢出去吃东西,打算先把四川吃遍,再走出四川去其他的地方吃,要吃遍全国的美食。只要有时间,我会带上钱,带上背包,去吃遍全世界。 如何保证天猫精灵, 能说出地道的四川方言? 李辉:考虑到音素覆盖、模型的训练复杂度等,天猫精灵团队会通过上千万的语料,筛选出对算法训练贡献最大的内容。“声模”周玥偲会在录音棚里完成1.5万句左右的语料录制。其中,大部分是四川发音相关的俚语,机器除了要学习方言的发音方式、语音语调外,还要最大程度上实现“原汁原味”的表达,让川人一听就有亲切感。 关注3 天猫精灵四川话版什么时候可以上线? 天猫精灵四川话版, 具体何时可以与用户见面? 李辉:方言大赛冠军选出来之后,会进棚试音确定人设风格,确定下来后会在6月底7月初开始正式录音。正式录音的周期大概是1到2个月,录制的内容作为基本素材,会被拿到技术部门进行1到2个月的算法学习,学习完成后,年底前就可以上线到天猫精灵中让天猫精灵说四川话了。 天猫精灵背后的阿里, 在语音合成技术领域处于什么水准? 杨光:现阶段,很多技术已经实现开源,影音爱好者可以在线合成自己想要的声音。但随着技术的突破,现有技术已达到瓶颈,如果想再突破,还需要一些新的技术。比如,许多公司都在研发的神经网络。阿里巴巴的天猫精灵在声音选择上花了很多功夫,能在几千人中选出最优者录制语料,这意味着各个公司在语音技术处于持平水平时,阿里通过优质的声音数据实现了0.1分的超越。 下一站方言大赛, 地点会选在何地? 李辉:天猫精灵会推出更多的方言版本,但下一个地区的决定权我们将交给用户。目前,还在内部商定用户参与的方式,最终获得最多用户支持的地区,将会成为我们下一站方言大赛的举办地。华西都市报-封面新闻记者欧阳宏宇 |