日本一区二区三区播放,日韩性xxx,国产精品极品尤物在线观看,草莓视频一区二区三区

阿里發(fā)布語音合成技術 與原始音頻錄音接近程度高達97%

7月10日下午消息,阿里巴巴發(fā)布新一代語音合成技術KAN-TTS,稱可大幅提高合成語音與真人發(fā)聲的相似度,并將語音合成定制成本降低10倍以上。該技術由達摩院機器智能實驗室自主研發(fā)。

阿里方面稱,當前業(yè)界商用系統(tǒng)的合成語音與原始音頻錄音的接近程度通常在85%到90%之間,而基于KAN-TTS技術的合成語音可將該數(shù)據(jù)提高到97%以上。

據(jù)悉,KAN-TTS由達摩院機器智能實驗室自主研發(fā),深度融合了目前主流的端到端TTS技術和傳統(tǒng)TTS技術,從多個方面改進了語音合成。傳統(tǒng)語音合成定制需要10小時以上的數(shù)據(jù)錄制和標注,對錄音人和錄音環(huán)境要求很高。從啟動定制到最終交付,項目周期長成本高。

阿里利用Multi-Speaker Model與Speaker-aware Advanced Transfer Learning相結合的方法,將語音合成定制成本降低10倍以上,周期壓縮3倍以上。也就是說,用1小時有效錄音數(shù)據(jù)和不到兩個月制作周期,就能完成一次標準TTS定制。

此外,這使得普通用戶定制“AI聲音”的門檻更低。只需手機錄音十分鐘,就能獲得與錄制聲音高度相似的合成語音。

推薦DIY文章
聯(lián)想小新Air14 2023公開部分規(guī)格:新筆電將搭載下沉式鍵盤
朗科新推絕影NV5000-t固態(tài)硬盤 溫控技術更高 售價暫未公布
2022款iPadPro將可使用視頻編輯軟件達芬奇 使用軟件更專業(yè)
蘋果全新推出AppleTV 4K產(chǎn)品:流式傳輸可以千兆以太網(wǎng)進行
智己L7SnakePerformance高性能版:新車瞄準數(shù)秒級圈速提升
閃迪大師PRO-G40SSD外置固態(tài)硬盤:兼具極速傳輸與耐用優(yōu)點
精彩新聞

超前放送

主站蜘蛛池模板: 铁岭市| 遂溪县| 乐至县| 汕头市| 新民市| 分宜县| 茌平县| 皮山县| 库尔勒市| 邳州市| 凉山| 从化市| 赞皇县| 仙桃市| 凤阳县| 东丽区| 巨野县| 隆德县| 二手房| 新野县| 尉犁县| 白山市| 丰台区| 霸州市| 汽车| 祥云县| 墨脱县| 南乐县| 沾化县| 成安县| 汶川县| 车险| 鄄城县| 通辽市| 清丰县| 凤庆县| 谢通门县| 依兰县| 铜山县| 青浦区| 鹤岗市|