番茄小说团队随笔
番茄小说团队随笔
当前位置:首页 > 玄幻 > 番茄小说团队随笔 > 第11章 AI有声,让角色动听起来

第11章 AI有声,让角色动听起来

加入书架
书名:
番茄小说团队随笔
作者:
番茄小说团队
本章字数:
6300
更新时间:
2024-11-21

办公室一如往常忙碌。

公子楚和公猿一号正坐在一起,讨论最新的产品功能优化问题。

作为一个写代码的"码农",公猿一号有着不符合人设的健美身形。发达的手臂肌肉让加大号卫衣在他身上都显得有些紧绷,在健身增肌期,衣服的尺码追不上肌肉膨胀的速度是他的日常。

反观公子楚,均码的衬衫可以装下两个文弱的他。

两个人坐在一起,这种对比就更加明显。公子楚不得不站起来,为了把手伸到稿纸上,还要越过公猿一号雄伟的背阔肌。

公子楚:"……你下班能别去健身房了吗?"

公猿一号:"那你下班能多去健身房吗?"

两个人互瞪一眼,把彼此的那句"不能"咽回肚子里,继续指着稿纸上的某处小声讨论。

在他们对面,达拉萌巴和五百亿在笔记本上敲敲打打,忙着各自的方案。

远处的艾玛妮俯首翻着发票夹,正把票据一张一张理得整整齐齐。

这时候,办公室忽然响起几道好听的声音:

——"哇,番茄小说总部原来长这样。"

——"这些忙碌的人都是作者太太吗?"

番茄掌柜答:"不是,我们的作者遍布大江南北,借由网络联系在一起。公司在职办公的人员诸位可以理解成是作者的后勤保障部,我们所做的一切工作都是为了让好故事影响更多人。"

办公室的人顺势好奇看过去。

只见番茄掌柜正带着一群人陆陆续续走进来,似乎是参观。

那些人年龄各异,气质各异,但都是女性。

她们的声音很好听,绝不是听完就忘记的路人音,咬字清晰,方正有力,像是播音员。

简单说的几句话非常入耳,听进来都像是一种享受。

番茄掌柜恰好站在达拉萌巴的工位旁边。

达拉萌巴压低声音问:"这些是……?"

番茄掌柜:"试音演员。"

达拉萌巴:"?"听了但没完全明白……

番茄掌柜已经凑到公子楚旁边:"准备开工,待会录音室见。"

公子楚比了一个"OK"的手势。

公猿一号干脆地拔掉电源,捧起笔记本:"我去录音室等你们。"

待番茄掌柜带队离开,达拉萌巴才从工位上探出头:"什么情况?"

公子楚答:"一个月前番茄掌柜提交了AI(注:人工智能,下同)音色定制服务研发申请,这些是入复审的人。"

近年来,番茄小说投入了大量精力进行TTS (注:文本转化成声音)功能的开发,取得了一定成效。

番茄的AI有声功能优势明显,可以模拟真人对话,情感表达丰富饱满,且有更多类型的声音选择。

如今这项功能已经被广泛使用,解放了读者的双手和眼睛,为读者提供了极大便利,反响一直很好。

达拉萌巴也是有声功能的忠实用户,期待地问:"是要在现有的音色之外,再新增一个声音选择吗?"

公子楚:"对,如果效果好,还会不断更新。"

"我我我!"达拉萌巴举起小手:"我请求一款御姐音!"

公子楚推了推眼镜框,显得有些少年老成:"掌柜这批新增的就是御姐音,试音样本是《芸汐传》里的台词。"

达拉萌巴顿时露出星星眼:"那请允许我原地一个猛虎催更!"

番茄的AI朗读现有"甜美少女音"和"成熟大叔音"等多种选择,但因为小说人设层出不穷,声音类型的开发仍然是一件需要持续进行的工作。其中适配大女主文的御姐音近来呼声日渐高涨。

番茄掌柜已经注意到读者的意见,经过审慎考虑,她递交了一份AI音色定制服务的需求申请。

AI的音色要以真人真声为数据样本,因此研发音色的第一步就是发音人的招募和筛选。

由于在初期参与过AI有声的研发策划,番茄掌柜对于研发流程十分了解。在这份需求中,她详细写明了声音设定的年龄、性格等细节,为发音人的筛选工作尽可能地提供便利。

果然,清晰的声音需求设定让招募进行得十分顺利。消息发布后十天内,就收到了来自全国各地的声音样本。

在经过海量试听和筛选后,番茄掌柜确定了数十人的复试名单,并邀请她们到番茄小说总部参与试音。

此时的番茄掌柜已经带队穿过主办公区域,来到了专业试音间。

在这里,专业的设备和录音师早就准备就绪。公猿一号端坐中间,16寸大屏幕的电脑被他宽阔的肩膀衬得有些娇小。

公子楚稍慢一步,在他旁边落座。

番茄掌柜正在组织录音顺序,所有的试音者坐在一排,拿着号码牌,有条不紊。

"为了保证试音的公平性,我们采用不记名试音的方式,每个人按照抽中的号码顺序开始。"番茄掌柜介绍完,回到外面,跟公子楚交换了一个眼神,示意可以开始。

一号主播进去,很快,就有声音清晰地传递出来:

——"我是秦王妃啊!这普天之下莫非王土,那么普秦王府莫非我秦王妃的住处,所以我爱睡哪儿就睡哪儿。"(注:出自《芸汐传》,下同。)

——"下辈子,你我是否会有机会,在漫山遍野的花丛中,在纷飞的蝶舞中邂逅?又或者蓦然回首,想起前尘往事。"

几个人一边听一边交换意见。

"这个声音条件还不错。"公子楚说。

公猿一号:"但我感觉有点吞字,可能取样的时候不方便。"

公猿一号与研发团队要做的工作就是反复取样,将发音人的声音进行数字化的标注处理,使得AI可以学习其发音方法、语调等,最终形成富有表达力的拟人音色。

因此在试音阶段,公猿一号的意见也很重要。

番茄掌柜表示明白,又说:"下一位。"

——"我是秦王妃啊!这普天之下莫非王土,那么普秦王府莫非我秦王妃的住处,所以我爱睡哪儿就睡哪儿。"

同样的台词更能对比出高下。

"这个声音似乎压不住女主的人设。"番茄掌柜评价说。

AI就像一位学生,想要学得优秀,必然要找一位优秀的老师,可以说最终发音人的能力直接影响着AI语音的上线效果。

因此,最终发言人的筛选条件十分苛刻。

几个人交换了意见,番茄掌柜继续叫号:"下一位。"

……

试音工作持续开展,推进了数日。

办公室的人每天只看见番茄掌柜和公子楚频繁出入试音间,或者戴着耳机四处寻找有空的同学,拜托他们盲听几条片段,从普通听众的角度给与意见,忙得团团转。

而公猿一号压根不见人影,只能从他桌上已经浇过水的小绿植判断他的确来过。

几天后,番茄掌柜终于坐回办公桌前。

达拉萌巴连忙问:"辛苦啦,看你脸色,最终发音人终于定了?"

"定了。"番茄掌柜又提起一口气,"但是真正的工作量现在才开始。"

达拉萌巴:"……"我听不懂,但我大受震撼。

番茄掌柜豪气云天地撸了撸袖子:"干活去了,告辞!"

.

公子楚和公猿一号等人早就在录音室等她。

番茄掌柜把最终发音人引进来,简单介绍两句,就说:"开始吧。"

达拉萌巴以为,声音取样就是用电脑录音,然后数字转化。即便发音人念得再慢,工作量也不会很大。而且,这项工作并不需要发音人念遍所有的词语。

没想到,他们这一干就是好几天。

试音间里,公猿一号正对一个词语进行第十九次的取样,他灵活的手指把键盘敲得飞起,一丝不苟地说:"再来一次。"

整个录制过程中,公猿一号比导演还要苛刻。

而公子楚就担任了安慰者的角色,在发音人受挫的时候及时给予鼓励和帮助。

发音人极其敬业,并没有因为短短几秒的语料录制了一个小时而感到不耐烦。

她稳住了呼吸,开始念出第二十遍。

公猿一号终于点头:"能用。"

公子楚也跟着松了一口气:"好,过了,下一段。"

.

达拉萌巴足足等了三个月。

盼星星盼月亮才终于盼到了番茄掌柜的好消息:"御姐音开发完成,今天内测。"

达拉萌巴:"哈!我先冲为敬!"

她连忙点开内测版,翻出书架上最近阅读的小说开始试听……

几分钟后,她大呼过瘾地摘下耳机:"我喜欢!"

番茄掌柜:"没有友情滤镜?"

"绝对没有!"

旁边刚刚试听过的五百亿也点头表示认可:"很好听啊,而且跟甜美萝莉音有很明确的区别。"

"那我就放心了。"番茄掌柜展颜,望着电脑上其他同学发来的内测版反馈,露出满脸成就感。

听完一段的慕容知春也放下耳机:"最近大家辛苦了,这个内测做完批准掌柜休息,公子楚和公猿一号也……"

话没说话,回头已经看见公子楚和公猿一号菜色的脸。

慕容知春:"嗯?"

公子楚:"就在刚刚,亲爱的番茄掌柜同学提交了新音色的开发需求……"(生无可恋脸)

公猿一号:"魔鬼竟在我身边。"

慕容知春:"……"

告辞。

只有达拉萌巴满脸期待地探个脑袋过去:"掌柜,这次是什么音?"

番茄掌柜眨眨眼,用家乡的东北话回答她:"我不让(yang)你知(zi)道~"

错乱章节催更!
返回
指南
快捷键指南
全屏模式
上下移动
换章
加入书架 字号
调整字号
A-
A+
背景
阅读背景
错乱漏章催更
  • 新书推荐
  • 热门推荐
  • 猜你喜欢