兩年前的經歷讓孫濤至今難以忘懷。“有一位抗美援朝的老戰(zhàn)士,很懷念已經過世的老排長。” 語音合成架構師孫濤就和同事錄制了一些老排長在世時的聲音,并通過語音合成技術把老排長留給老戰(zhàn)士的信讀給他聽,老人頓時淚流滿面。
語音合成廣泛應用于播報、客服、導航、虛擬主播、虛擬主持人等等。語音合成有三大關鍵因素:文本內容、發(fā)音人音色和說話的韻律節(jié)奏。發(fā)音人音色的不同在于喉嚨。每個人的喉嚨結構比較固定,如果把它比喻成一個樂器,文本內容和韻律節(jié)奏更像是樂譜。語音合成相當于只要掌握了樂器(喉嚨)的基本結構,想要合成什么樣的語句,只要提供樂譜(文本內容和韻律節(jié)奏)就可以了。
“只要收集你說的9句話,就能復刻你的聲音”。語音合成架構師孫濤自信地對中工網記者說。每天,孫濤要處理大量采集來的聲音。看著高低不平的聲波,就像看著即將亮相的樂譜,人工智能是“演奏家”,而他,就是那個“作曲家”。
語音合成需要很多環(huán)節(jié),比如聲音的質量、錄制時的環(huán)境、數據規(guī)整等等,最關鍵的還是如何讓機器通過學習獲得聲音與文本的匹配關系,這是語音架構師花費時間最多的地方。并且,語音跟圖像、文本不一樣,它具有時序性和交互性特點,要求系統(tǒng)具有快速響應用戶的能力,這樣,如何更好地完成時序模型系統(tǒng)的設計是考驗一名語音架構師是否合格的因素之一。
“以前客戶服務電話的拒接率很高,大家一聽就知道這不是真人,從情感上就不想交流。” 人工智能的快速發(fā)展,語音合成也搭上了這趟順風車。“語音合成的效果提升以后,已經無法分辨接客服電話的是真人還是機器,與客戶溝通的效率也提升了。”孫濤對中工網記者說,語音合成發(fā)展到現在已經進步為個性化的合成,會帶上情感表現,甚至還有一些人文關懷的成分。“語音合成發(fā)展的大方向是交互,讓人與人工智能自如地對話。不僅能傳遞信息,也能傳遞情感。”孫濤滿懷憧憬地說。
關鍵詞: 語音合成 架構師 時序模型系統(tǒng) 客服電話
新聞發(fā)布平臺 |科極網 |環(huán)球周刊網 |新商報網 |中國商界網 |互聯(lián)快報網 |萬能百科 |薄荷網 |資訊_時尚網 |連州財經網 |劇情啦 |5元服裝包郵 |中華網河南 |網購省錢平臺 |海淘返利 |太平洋裝修網 |勵普網校 |九十三度白茶網 |商標注冊 |專利申請 |啟哈號 |速挖投訴平臺 |深度財經網 |深圳熱線 |財報網 |財報網 |財報網 |咕嚕財經 |太原熱線 |電路維修 |防水補漏 |水管維修 |墻面翻修 |舊房維修 |參考經濟網 |中原網視臺 |財經產業(yè)網 |全球經濟網 |消費導報網 |外貿網 |重播網 |國際財經網 |星島中文網 |上甲期貨社區(qū) |品牌推廣 |imtoken下載 |imtoken |名律網 |項目大全 |整形資訊 |整形新聞 |美麗網 |佳人網 |稅法網 |法務網 |法律服務 |法律咨詢 |尼達尼布翻譯 |媒體采購網
中國資本網 版權所有
Copyright © 2011-2020 資本網 All Rights Reserved. 聯(lián)系網站:55 16 53 8 @qq.com