猜你喜歡
更多>(相關(guān)資料圖)
記者23日從內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院獲悉,該院劉瑞研究員所在科研團(tuán)隊(duì)與日本大阪大學(xué)科學(xué)與工業(yè)研究所科研團(tuán)隊(duì)合作,在國際信號處理領(lǐng)域TOP期刊《IEEE/ACM音頻、語音和語言處理會(huì)刊》發(fā)表了“通過源濾波網(wǎng)絡(luò)將獨(dú)立于說話人的情感解耦以進(jìn)行語音轉(zhuǎn)換”的最新研究成果。
據(jù)介紹,情感語音轉(zhuǎn)換(VC)旨在將中性語音轉(zhuǎn)換為情感聲音,同時(shí)保留語言信息和說話者的身份??蒲袌F(tuán)隊(duì)注意到,將情感特征與其他語音信息(例如內(nèi)容、說話者身份等)解耦是實(shí)現(xiàn)高質(zhì)量轉(zhuǎn)換效果的關(guān)鍵。由于情感語音中聲學(xué)特征的解耦更加復(fù)雜,面向中性語音的特征解耦一直無法得到很好的處理。
科研團(tuán)隊(duì)針對情感語音轉(zhuǎn)換的聲學(xué)特征解耦問題開展研究,提出了一種基于“源—濾波器”模型的情感語音轉(zhuǎn)換系統(tǒng),具體來說,是為了解決情感語音轉(zhuǎn)換的特征解耦問題而提出一種新穎的基于“源—濾波器”模型的情感VC模型(簡稱SFEVC),以從音色和音調(diào)特征中準(zhǔn)確過濾說話人獨(dú)立的情感線索。SFEVC模型由多通道編碼器、情感獨(dú)立編碼器、預(yù)訓(xùn)練的說話人相關(guān)編碼器和相應(yīng)的解碼器組成。所有編碼器模塊都采用信息瓶頸自動(dòng)編碼器。
為了進(jìn)一步提高各種情緒的轉(zhuǎn)化質(zhì)量,研究團(tuán)隊(duì)還提出了基于二維VA(激活度—效價(jià))空間的訓(xùn)練策略。實(shí)驗(yàn)結(jié)果表明,SFEVC模型以及VA訓(xùn)練策略的表現(xiàn)均優(yōu)于所有基線系統(tǒng),并基于非平行數(shù)據(jù)在說話人無關(guān)的情感VC場景下實(shí)現(xiàn)了最優(yōu)性能。
標(biāo)簽: 技術(shù)研究 語音轉(zhuǎn)換
最新推薦
更多>石榴快播丨推動(dòng)國資國企高質(zhì)量發(fā)展邁上新臺(tái)階 自治區(qū)區(qū)屬國有企業(yè)座談會(huì)今日召開
武漢地鐵幾點(diǎn)開班收班(武漢地鐵幾點(diǎn)開班)
河北啟動(dòng)干旱防御Ⅳ級應(yīng)急響應(yīng) 多措并舉保障農(nóng)業(yè)生產(chǎn)
鄧倫犯了什么事 鄧倫被強(qiáng)制執(zhí)行 基本情況講解
國產(chǎn)小爆款《火山的女兒》銷量60萬!Steam好評如潮
GGII:6月全國備案154個(gè)儲(chǔ)能項(xiàng)目 總規(guī)模達(dá)15.4GW/34.9GWh
猜你喜歡
更多>要聞
更多>終極斗羅15:家丑不可外揚(yáng),傳靈塔卻反其道而行之
新化:洋溪鎮(zhèn)撬動(dòng)行業(yè)協(xié)會(huì)力量,助推農(nóng)村建筑安全、耕地保護(hù)和控違拆違工作良性開展
嘉峪關(guān)酒泉機(jī)場工程順利通過行業(yè)驗(yàn)收 計(jì)劃9月7日復(fù)航
3連板大連熱電(600719.SH):擬籌劃的資產(chǎn)重組事項(xiàng)存在不確定性
昊華科技(600378)周評:本周跌3.29%,主力資金合計(jì)凈流出1578.27萬元
借力AI賦能全球創(chuàng)作者 萬興科技攜Wondershare Filmora亮相創(chuàng)作
全部真實(shí)業(yè)務(wù)系統(tǒng)!華為云展示盤古大模型行業(yè)應(yīng)用