一区二区三区电影_国产伦精品一区二区三区视频免费_亚洲欧美国产精品va在线观看_国产精品一二三四

聯(lián)系我們 - 廣告服務(wù) - 聯(lián)系電話:
您的當(dāng)前位置: > 熱點(diǎn) > > 正文

【一線:360行】語(yǔ)音合成架構(gòu)師:“看到”你的聲音

來(lái)源:中工網(wǎng) 時(shí)間:2021-10-11 20:10:28

兩年前的經(jīng)歷讓孫濤至今難以忘懷。“有一位抗美援朝的老戰(zhàn)士,很懷念已經(jīng)過(guò)世的老排長(zhǎng)。” 語(yǔ)音合成架構(gòu)師孫濤就和同事錄制了一些老排長(zhǎng)在世時(shí)的聲音,并通過(guò)語(yǔ)音合成技術(shù)把老排長(zhǎng)留給老戰(zhàn)士的信讀給他聽(tīng),老人頓時(shí)淚流滿面。

語(yǔ)音合成廣泛應(yīng)用于播報(bào)、客服、導(dǎo)航、虛擬主播、虛擬主持人等等。語(yǔ)音合成有三大關(guān)鍵因素:文本內(nèi)容、發(fā)音人音色和說(shuō)話的韻律節(jié)奏。發(fā)音人音色的不同在于喉嚨。每個(gè)人的喉嚨結(jié)構(gòu)比較固定,如果把它比喻成一個(gè)樂(lè)器,文本內(nèi)容和韻律節(jié)奏更像是樂(lè)譜。語(yǔ)音合成相當(dāng)于只要掌握了樂(lè)器(喉嚨)的基本結(jié)構(gòu),想要合成什么樣的語(yǔ)句,只要提供樂(lè)譜(文本內(nèi)容和韻律節(jié)奏)就可以了。

“只要收集你說(shuō)的9句話,就能復(fù)刻你的聲音”。語(yǔ)音合成架構(gòu)師孫濤自信地對(duì)中工網(wǎng)記者說(shuō)。每天,孫濤要處理大量采集來(lái)的聲音。看著高低不平的聲波,就像看著即將亮相的樂(lè)譜,人工智能是“演奏家”,而他,就是那個(gè)“作曲家”。

語(yǔ)音合成需要很多環(huán)節(jié),比如聲音的質(zhì)量、錄制時(shí)的環(huán)境、數(shù)據(jù)規(guī)整等等,最關(guān)鍵的還是如何讓機(jī)器通過(guò)學(xué)習(xí)獲得聲音與文本的匹配關(guān)系,這是語(yǔ)音架構(gòu)師花費(fèi)時(shí)間最多的地方。并且,語(yǔ)音跟圖像、文本不一樣,它具有時(shí)序性和交互性特點(diǎn),要求系統(tǒng)具有快速響應(yīng)用戶的能力,這樣,如何更好地完成時(shí)序模型系統(tǒng)的設(shè)計(jì)是考驗(yàn)一名語(yǔ)音架構(gòu)師是否合格的因素之一。

“以前客戶服務(wù)電話的拒接率很高,大家一聽(tīng)就知道這不是真人,從情感上就不想交流。” 人工智能的快速發(fā)展,語(yǔ)音合成也搭上了這趟順風(fēng)車。“語(yǔ)音合成的效果提升以后,已經(jīng)無(wú)法分辨接客服電話的是真人還是機(jī)器,與客戶溝通的效率也提升了。”孫濤對(duì)中工網(wǎng)記者說(shuō),語(yǔ)音合成發(fā)展到現(xiàn)在已經(jīng)進(jìn)步為個(gè)性化的合成,會(huì)帶上情感表現(xiàn),甚至還有一些人文關(guān)懷的成分。“語(yǔ)音合成發(fā)展的大方向是交互,讓人與人工智能自如地對(duì)話。不僅能傳遞信息,也能傳遞情感。”孫濤滿懷憧憬地說(shuō)。

責(zé)任編輯:

相關(guān)推薦:

精彩放送:

新聞聚焦
Top 主站蜘蛛池模板: 兴山县| 桦南县| 兰西县| 尤溪县| 佳木斯市| 连南| 卓尼县| 贡觉县| 曲松县| 江达县| 清河县| 邹平县| 花垣县| 霍林郭勒市| 星子县| 平山县| 柞水县| 合阳县| 丽江市| 文化| 金坛市| 永城市| 海安县| 东乡族自治县| 营口市| 朝阳县| 扬中市| 烟台市| 墨竹工卡县| 宣汉县| 凌源市| 阜南县| 灌云县| 黑山县| 阳谷县| 新沂市| 平利县| 无锡市| 新龙县| 淄博市| 海淀区|