第113页
付费音频是新热点,行业拓荒者数不胜数,且已经有了珠穆朗玛那种成功的企业,没钱就没法高速铺开业务,就抢不过别人,就注定失败。
完了,一切都完了。
窗外华灯初上,邵逸明的脸反射在玻璃上,长达一个小时的时间,他脑中一片混乱。
一个小时后,他突然想:为什么?
为什么会被那么多家风投连续放鸽子?难道是背后有人在搞他?
还未来得及仔细思考,员工电话打进来,大呼小叫地跟他说:“邵哥!你看到了吗!变天了!怎么办!我们怎么办啊!”
“怎么回事?”邵逸明这会儿异常冷静,嘴里回答着电话,脑海里还在想,谁会费这么大力气给他使绊子。
“快去看看新闻啊邵哥!!!都一下午了难道你还不知道吗!!!”
邵逸明飞快挂掉电话打开新闻网站,一个不容忽视的大头条挂在那里。
“回声科技今日震撼发布,划时代语音合成技术,我国人工智能已领先世界!”
他呆了一瞬,才打开新闻,拉下去细看。
整篇新闻的口吻带有一种明明很激动却强自抑制的感觉,这小编也真是厉害,用特别理性客观的文字把回声从上到下夸了一个遍,还不着痕迹地介绍了新软件的各种功能。
软件的名字很普通,就叫回声配音,和之前一模一样。
只不过之前的回声配音是个网页程序,这回有了客户端。
“基于这种划时代语音合成技术,回声科技目前仅发布‘回声配音’一项产品,仅仅是这一款软件,已经展现出令人震惊的功能效果。这一技术的后续开发非常值得期待。”
邵逸明看完软件,强压着内心的惊疑不定,去应用商店下载了手机app。
移动端的app设计非常简单,就是输入一段文字转换成语音,带有简单的参数调试功能。
AI配音对硬件的要求相当高,手机端不能一次转换太多内容,一次输入仅限五十字。
邵逸明第一时间想到那个刚刚通过海选的动画剧本,随意从剧本中拉出一句词输入进去。
文字输入完毕,蹦出挑选音色的选项,预置音色有最基本的童音、少年、青年、中年、老年,每一样都分男女。
点击某个音色,就直接输出声音。
仅仅是一句简短的对话,邵逸明点开每一个音色来回听了三遍,越听越觉得难以置信。
是语音合成,真正的语音合成。
和软件唱歌不一样,语音合成不是简单的声音排列组合,还需要自然语言处理,识别文字语义等等。现在,程序识别出了某句话的语义,根据语义配置了合理的起伏、韵律和声调,然后播放出来。
逼真程度之高,就像是有一个真人在手机里说话一样!
程序的表达不一定最动听,但绝对是符合语境的,让人找不出违和感。
换句话说,软件不具有顶尖配音演员的实力,但是却具有普通配音演员的能力。
邵逸明强自镇定,安慰自己说:平平无奇,没有灵魂。别怕别怕。
机器终归是机器,就算能配音,也只是套路化模仿人的语气,配不出有力量的情感表达。就像是演技拙劣的演员非要去演戏
他随便选了一个音色,点击确认,来到了下一个页面——情感选择。
下面有四个滑条,分别是喜悦、激动、愤怒、恐惧。
邵逸明滑动这四个滑条的时候,感觉异常不真实,就好像在滑动图片的RBG滑条一样。
滑动之后,实时生成的语音果然出现了微妙的语气变化。
这一页下面还有一样小字:“登陆电脑客户端,调节更多情感维度,还可以自行设计维度模型,保存参数建立情感滤镜。”
邵逸明犹豫了一下,没有理会,点击确定来到下一个页面。
这一步的名字叫“音频液化”,选择一个参数,在屏幕上生成一条曲线,手指涂抹就可以改变曲线的形状,纵轴是该项参数,横轴是时间。
音量是一条直线,用手指向上抹出一个小山包,山包对应的时间段的音量就会发生变化。
语调是曲线,可以用手指涂抹直接改变声调的上扬或下抑。
语气轻重是折线,可以制造强调声或轻声。
发声位置,可以调出气音、鼻音、胸腔共鸣、丹田发声不同的效果。
还有音高、语速等等各种各样的参数。原本“平平无奇没有灵魂”的普通对话,可以在这个界面往千奇百怪的方向去调整,输出令人叹为观止的多样性成果。
第四步就是最后一步,完成这一步之后,系统就生成了mp3文件。
邵逸明听了一遍又一遍,最后靠在椅子上,用手盖住脸,长叹一口气。
除了音色有些出入,这整句话和他所设想的一模一样。
过了半天,他终于找到理由安慰自己:“……第四步也太复杂了,选择困难症怕不是能玩一年。要是都这么一句话一句话地调,猴年马月才能完成一段配音?”
厉害归厉害,效率反而降低了。
这个想法刚一冒出来,app页面弹出提示:“是否感觉参数太细致,建立音频太麻烦,耗时过长?下载pc客户端,体验高效率AI配音。”
邵逸明立刻捕捉到关键点:pc端的功能更加强大?