如何用高質(zhì)量的TTS音效本地化“多配體配音”
你是否因?yàn)橐獮槊糠N語(yǔ)言尋找和試聽(tīng)解說(shuō)員,預(yù)定錄音棚,不料卻發(fā)生了意想不到的變化,需要后期重新錄制而感到沮喪?對(duì)于電子學(xué)習(xí)和培訓(xùn)視頻,解決方案可能只是文本到語(yǔ)音轉(zhuǎn)換(TTS)。對(duì)于英語(yǔ)以外的語(yǔ)言,解決方案最好來(lái)自真正理解該語(yǔ)言的本地實(shí)體。
正如我的同事Jill Polanycia在她的文章“文本到語(yǔ)音:令人驚嘆的無(wú)處不在的時(shí)尚技術(shù)”中所寫(xiě)的那樣,TTS可以將訓(xùn)練提升到一個(gè)新的水平,因?yàn)槿藗兛梢栽诼?tīng)指令的同時(shí)執(zhí)行任務(wù),而不必將眼睛粘在屏幕上。當(dāng)你認(rèn)為一個(gè)TTS系統(tǒng)可以在五分鐘內(nèi)完成制作,而它需要大約八個(gè)小時(shí)的語(yǔ)音人才可以看到一些時(shí)間和金錢(qián)的節(jié)省。
聽(tīng)起來(lái)就像你的意思。十年前的TTS聽(tīng)起來(lái)非常機(jī)器人化。但是現(xiàn)在,TTS聽(tīng)起來(lái)更人性化了(嗯,有些人是這樣的)。這是因?yàn)槁曇羰腔诓蓸拥娜寺?,而不是基?00%算法的合成音頻波。
有跡象表明,許多在線(xiàn)資源讓你用自己的文本字符串試駕他們的聲音,這讓我體驗(yàn)和測(cè)試了由Linguatec提供的Acapela Group、NaturalReader和voice reader。公司HOYA的VoiceText(它的名字不屬于日本的NeoSpeech)和AITalk。通過(guò)支付這些服務(wù),你可以獲得更多的聲音,以及調(diào)整聲音和微調(diào)其交付的能力。但是對(duì)于這篇文章,我堅(jiān)持什么是免費(fèi)的。
你可能會(huì)猜測(cè),這不是一個(gè)科學(xué)的研究,這些選擇可能會(huì)因個(gè)人喜好而有所偏差。但在我們的業(yè)務(wù)中,我們看到機(jī)器人聲音和人類(lèi)聲音的標(biāo)準(zhǔn)往往是有利的,所以對(duì)聲音做出最終決定的總是客戶(hù)。
所有服務(wù)都有好聲音,所以我的前五聲都是散的。Acapela占了兩個(gè),其中一個(gè)用于NaturalReader、Voice Reader和VoiceText。
五個(gè)男性英語(yǔ)TTS聲音因?yàn)槟承┰?,男性的聲音似乎更有個(gè)性。還是因?yàn)楹芏喔哔|(zhì)量的聲音都是英式英語(yǔ)?
阿卡貝拉總是表現(xiàn)出色,提供了你剛剛聽(tīng)到的五大聲音中的兩個(gè)。也許令人驚訝的是,剩下的三個(gè)是日本HOYA的VoiceText和德國(guó)Linguatec的Voice Reader。
如果這些是在德國(guó)和日本,公司有很多和自己母語(yǔ)相關(guān)的技術(shù),他們也一定會(huì)這么做。人們可能認(rèn)為他們?cè)谶@些語(yǔ)言中的聲音是一流的。雖然我不會(huì)說(shuō)德語(yǔ),但是日語(yǔ)有全面的VoiceText和AITalk選擇。

我讀到的文本是之前英文文本的日文本地化版本:コンテンツのや???.デジタルがみこのきにりどれなぃためにはォムニチチチチォ.
正如我們所料,我對(duì)日本最佳女聲的前五名選擇都來(lái)自日本供應(yīng)商——四名來(lái)自VoiceText,一名來(lái)自AITalk。毫無(wú)疑問(wèn),在完整版軟件應(yīng)用的頭對(duì)頭比較中,AITalk會(huì)更強(qiáng)大,但就其免費(fèi)的在線(xiàn)采樣器而言,VoiceText占了上風(fēng)。
雖然Acapela的櫻花還不錯(cuò),但是被日本供應(yīng)商提供的品質(zhì)和豐富的選擇所覆蓋。Acapela的聲音確實(shí)進(jìn)入了在成田機(jī)場(chǎng)測(cè)試的人形機(jī)器人Kokoro,但使用的聲音是美式英語(yǔ)語(yǔ)音Sharon(我的五強(qiáng)之一),而日語(yǔ)語(yǔ)音是由AITalk提供的。
日本TTS五大男聲這不是設(shè)計(jì),日本最優(yōu)秀男性的前五個(gè)選擇其實(shí)是VoiceText的四個(gè)和AITalk的一個(gè),就像女聲一樣。
也許我應(yīng)該提一下,VoiceText的名為SHOW的聲音提供了稍微不標(biāo)準(zhǔn)的音調(diào),但這是因?yàn)樗奶摌?gòu)角色“來(lái)自熊本縣”。“它被用作電視節(jié)目《摩亞-摩亞·薩默斯》(Moya-Moya Summers)的旁白,其略帶偏差的語(yǔ)調(diào)為節(jié)目增添了獨(dú)特的口音(雙關(guān)語(yǔ))。
許多其他可能性許多TTS提供商不提供在線(xiàn)樣本,但他們有可以免費(fèi)試用的可下載軟件,如Balabolka、AudioBookMaker和NaturalReader(它們也提供在線(xiàn)樣本)。
根據(jù)您的具體需求,您可能希望完全集成IBM Watson(英語(yǔ)使用男聲,日語(yǔ)使用女聲),或者嘗試使用Amazon Polly。
互聯(lián)網(wǎng)是一個(gè)奇妙的地方——所以環(huán)顧四周(像我一樣),看看你有什么解決方案。如果您還沒(méi)有這樣做,請(qǐng)通過(guò)電子學(xué)習(xí)行業(yè)在這里和這里查看這些精彩的文章。
我差點(diǎn)忘了...Acapela豐富的聲音選擇包括許多獨(dú)特的產(chǎn)品,可以以有趣的方式增加您的項(xiàng)目的興趣。
如果你希望你的聲音不僅會(huì)說(shuō)話(huà),還會(huì)唱歌,你可以去VoiceText,讓聲優(yōu)為你唱歌。當(dāng)我們通過(guò)雅馬哈進(jìn)入Vocaliod時(shí),我們將完全跑題,但從某種意義上說(shuō),我們談?wù)摰氖峭瑯拥募夹g(shù)。
曾經(jīng)有一段時(shí)間,人類(lèi)歌手演唱數(shù)字音樂(lè)。現(xiàn)在,您可以在最熱情的現(xiàn)場(chǎng)觀(guān)眾面前體驗(yàn)投影的數(shù)字角色和帶數(shù)字聲音的現(xiàn)場(chǎng)樂(lè)隊(duì)。
數(shù)字語(yǔ)音永遠(yuǎn)不會(huì)老,不會(huì)感冒。他們是可靠的,可靠的,可以無(wú)限地重現(xiàn)同樣的品質(zhì)。(有沒(méi)有后續(xù)作品中可以出現(xiàn)的聲音,聽(tīng)起來(lái)完全不一樣?數(shù)字聲音沒(méi)有這個(gè)問(wèn)題。)
對(duì)于某些人來(lái)說(shuō),圖尼在音樂(lè)會(huì)中的數(shù)字角色可能有點(diǎn)太遠(yuǎn)了,正如我們?cè)趦和屠先说倪@些反應(yīng)中看到的那樣。但是不管你的表現(xiàn)如何,技術(shù)就在那里,你已經(jīng)準(zhǔn)備好利用它了。如果要本土化,為什么不更進(jìn)一步,發(fā)出聲音?