一区二区三区电影_国产伦精品一区二区三区视频免费_亚洲欧美国产精品va在线观看_国产精品一二三四

聯(lián)系我們 - 廣告服務(wù) - 聯(lián)系電話: 2025年05月16日 01:52 星期五
您的當前位置: > 關(guān)注 > > 正文

世界速訊:MS-TTS:免費微軟TTS語音合成工具 一鍵合成導出MP3音頻

來源:CSDN 時間:2023-02-10 13:46:16

聲明

本工具是個免費工具,遇到問題,還請自行解決,下面有文字教程,B站有視頻教程(鏈接在文章末尾);


(資料圖片僅供參考)

其次,微軟接口卡頓,連接超時等問題下方有詳細說明,請仔細看一下;

再次,強制升級是為了統(tǒng)一版本方便問題的收集與解決,如果你能理解最好,不能理解的話,那建議你還是不要用了,強扭的瓜不可能甜!

前言

微軟TTS文本轉(zhuǎn)語音引擎的確是非常NB,合成語音非常接近真人,應(yīng)該是當前同類產(chǎn)品中體驗最好的,官網(wǎng)有提供在線語音合成,但不提供合成后的音頻文件下載,使用時會比較麻煩,所以寫成工具;

目前,MS-TTS工具經(jīng)過N個版本更新,該實現(xiàn)的功能都已經(jīng)一點點肝出來了,稱它為全網(wǎng)最強免費TTS文本語音合成工具應(yīng)該不為過,所以,接下來可能在很長一段時間內(nèi),除去發(fā)現(xiàn)重大bug外,應(yīng)該都不會再進行大的更新了,當然,有什么好的意見建議可以繼續(xù)留言告知(提示:少數(shù)人需要的特殊功能不在此范圍,真有需要可聯(lián)系定制)。

當前版本:v1.9.6.3

Bug反饋

使用說明(以下內(nèi)容請仔細閱讀)

1、下載的壓縮包記得先解壓縮,再使用!!!

2、解壓后運行主程序 MS-TTS.exe(注意:軟件有加密保護,會被部分殺毒軟件和電腦管家勿報及限制操作權(quán)限,建議將殺毒軟件及電腦管家關(guān)閉后使用,當然,如果不放心,可以不要使用)

3、軟件界面

3.1 接口設(shè)置

左側(cè)最上方為TTS接口選項,當前軟件支持 微軟、 Edge兩大接口,優(yōu)缺點如下:

微軟Edge

角色個性化設(shè)置支持不支持

穩(wěn)定性不穩(wěn)定較穩(wěn)定

合成速度一般快

WAV格式支持不支持

接口下方代理選項專為微軟接口設(shè)置,原因就是因為微軟TTS服務(wù)器網(wǎng)絡(luò)非常不穩(wěn)定,如果一定要使用微軟接口,有條件的話就可以使用http代理,如果沒條件且又一定要使用微軟接口的話,建議在01:00-11:00時間段使用,連接穩(wěn)定性及合成速度相對會好一些!

3.2 選項

合成音頻保存質(zhì)量選項,微軟接口mp3、wav兩種格式都支持,Edge只支持保存mp3格式;

3.3 角色

語言:TTS文本轉(zhuǎn)語音中的文本內(nèi)容所屬語言(一定要和合成內(nèi)容的語言相對應(yīng))

語音:根據(jù)所先語言不同,對應(yīng)的語音角色也不相同,要自行根據(jù)實際情況選擇

風格:角色的說話語氣風格

角色:這個角色一般是指角色的年齡段(實際使用效果不明顯,且只有少部分角色支持)

語速:語音合成時的說話速度,0是正常水平,>0加快,<0減慢

音調(diào):語音合成時的說話音調(diào),0是正常水平,>0音調(diào)升高,<0音調(diào)降低

添加角色:可將設(shè)置好的角色添加到下方的角色列表,用于文本轉(zhuǎn)語音時實現(xiàn)多角色配音的效果(不添加角色時,所有語音合成直接使用上方角色及各項設(shè)置)

3.4 簡單模式-中小文本

主要用于合成文本內(nèi)容不多的情況,可以更為方便快捷的對文本內(nèi)容進行各種自定義

在編輯區(qū)域點擊鼠標右鍵,會彈出右鍵菜單

粘貼:將復制好的文本內(nèi)容粘貼到編輯區(qū)域

清空:清空編輯區(qū)域所有內(nèi)容

插入間隔:在光標所以位置插入間隔標記,后面在進行語音合成時,將會在指定位置按照設(shè)置好的間隔時間進行停頓

設(shè)置角色:使用此功能需要在左側(cè)列表先添加角色,然后使用指定角色對選中范圍文本內(nèi)容進行標記,進行過角色標記的內(nèi)容在后面進行語音合成時,將以指定的角色設(shè)置進行語音合成。

3.5 簡單模式-超長文本

在表格區(qū)域點擊鼠標右鍵,會彈出右鍵菜單:

導入:導入需要進行tts合成的txt文本文件

導入的txt文本大小不能超過5MB(超過5MB文本文件無法導入)

導入的txt文本文件編碼格式必須為UTF-8,非UTF8編碼文件在導入后,在狀態(tài)欄會顯示“編碼錯誤”,在進行tts語音合成時,會直接跳過

清空:清空列表

也可以直接選中多個txt文本文件,拖動到軟件界面完成導入

3.6 SSML

SSML:是一種基于XML的語音合成標記語言,此功能一般只用于需要深度自定義的場景,使用SSML一定要按照其規(guī)定的語法及命令,否則將無法合成(命令語法錯一個字母都不行),具體可點擊右上方綠色文字,跳轉(zhuǎn)到官方SSML文檔進行學習。

SSML:主體內(nèi)容不能超過2500字符(微軟官方有限制)

3.7 軟件設(shè)置

保存目錄:可自定義合成音頻保存目錄(打開:快速打開保存目錄,選擇文件夾:選擇保存目標文件夾)

合成音頻使用原始文件名命名:在超長文本模式下生效,勾選后,最終合并音頻文件名以“原始導入文本文件名_tts”進行命名

合成結(jié)束打開保存目錄:在語音合成任務(wù)完成后打開保存目錄(如果保存文件夾已經(jīng)有打開則不會再打開)

分段音頻合并數(shù)量:在進行超長文本合并時,如果將所有音頻進行完整合并,最終生成的音頻文件將會非常大,動轍幾GB,于是采取了二級合并的模式,可以自行根據(jù)需求按指定數(shù)量合并(如果還是不能理解,打個比方,你的文本合成音頻后,有300個音頻文件,如果對這300個音頻文件進行完整合并,最終合成的文件只有一個,且文件大小將會達到幾GB,不方便移動傳輸,且合成時間會非常長,現(xiàn)增加的二級合并,意思就是按照指定的數(shù)量對前面生成的300個文件進行合并,比如默認二級合并數(shù)量50,意思就是以50個音頻為一組,對前面的300個音頻進行分開合并,這樣300個音頻文件合成完成后,就會生成6個二級合并的音頻文件,每個二級合并音頻文件大小就會降到幾百MB)

合成結(jié)束刪除1級音頻片段:1級音頻片段就是最多的,4位數(shù)字開頭的音頻片段文件

合成結(jié)束刪除2級音頻片段:2級音頻片段就是按照上面指定分段音頻合并數(shù)量對1級音頻片段進行合并后生成的3位數(shù)字開頭音頻文件

是否進行最終完整合并:就是將所有分段音頻文件合并成一個音頻文件。

路徑檢測:顯示YES表示路徑正常,可正常進行音頻合并

保存配置:將各項設(shè)置內(nèi)容保存至配置文件(./Nconfig.ini)

注:刪除音頻片段時,將遵循保護性邏輯,即:在只存在1級音頻片段時,即使勾選合成結(jié)束刪除1級音頻片段也不會執(zhí)行刪除,在同時存在1級音頻片段與2級音頻片段時,勾選刪除1級音頻片段生效,而2級音頻片段即使勾選刪除將不會執(zhí)行,同理,在同時存在1級、2級音頻片段,且進行了最終完整合并的前提下,勾先刪除1級、2級音頻片段才會生效執(zhí)行。

4、多音字

MS-TTS運行后會自動在程序目錄生成“dict.txt”詞典文件,

將需要自動替換的內(nèi)容按照: 原始內(nèi)容,替換內(nèi)容的格式一行一條,寫入“dict.txt”詞典文件保存即可,如下:

5、試聽合成

5.1 試聽

提供最長不超過150字符內(nèi)容的角色聲音試聽,多角色只試聽第一段內(nèi)容

5.2 合成

按照設(shè)置好的角色對指定內(nèi)容進行TTS語音合成

5.3 停止

停止正在進行的任務(wù)

軟件報病毒

視頻教程

視頻為1.9.3版本視頻,多數(shù)操作相同

責任編輯:

標簽:

相關(guān)推薦:

精彩放送:

新聞聚焦
Top 主站蜘蛛池模板: 鄂州市| 台前县| 互助| 澄迈县| 内乡县| 莲花县| 北宁市| 江达县| 会泽县| 嘉定区| 宜黄县| 高尔夫| 元江| 长兴县| 宜兰县| 兰州市| 上蔡县| 盱眙县| 乌兰察布市| 兴业县| 观塘区| 沛县| 马鞍山市| 万年县| 德钦县| 和林格尔县| 乌鲁木齐县| 泗阳县| 通许县| 平湖市| 讷河市| 麻栗坡县| 和田市| 清河县| 东乌| 增城市| 姜堰市| 新津县| 肥东县| 五华县| 怀来县|