国产一区二区三区在线看片_日本韩国黄色_国产福利视频在线_成人97在线观看免费高清

巨靈鳥(niǎo)

電話   4000156919
當(dāng)前位置:首頁(yè) > 網(wǎng)絡(luò)和服務(wù)器管理_ERP百科

語(yǔ)音識(shí)別技術(shù)簡(jiǎn)史(一)

來(lái)源:巨靈鳥(niǎo)軟件  作者:進(jìn)銷(xiāo)存軟件  發(fā)布:2018/3/3  瀏覽次數(shù):4929

語(yǔ)音識(shí)別,通常稱為自動(dòng)語(yǔ)音識(shí)別,英文是Automatic Speech Recognition,縮寫(xiě)為 ASR,主要是將人類(lèi)語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,一般都是可以理解的文本內(nèi)容,也有可能是二進(jìn)制編碼或者字符序列。但是,我們一般理解的語(yǔ)音識(shí)別其實(shí)都是狹義的語(yǔ)音轉(zhuǎn)文字的過(guò)程,簡(jiǎn)稱語(yǔ)音轉(zhuǎn)文本識(shí)別( Speech To Text, STT )更合適,這樣就能與語(yǔ)音合成(Text To Speech, TTS )對(duì)應(yīng)起來(lái)。

語(yǔ)音識(shí)別是一項(xiàng)融合多學(xué)科知識(shí)的前沿技術(shù),覆蓋了數(shù)學(xué)與統(tǒng)計(jì)學(xué)、聲學(xué)與語(yǔ)言學(xué)、計(jì)算機(jī)與人工智能等基礎(chǔ)學(xué)科和前沿學(xué)科,是人機(jī)自然交互技術(shù)中的關(guān)鍵環(huán)節(jié)。但是,語(yǔ)音識(shí)別自誕生以來(lái)的半個(gè)多世紀(jì),一直沒(méi)有在實(shí)際應(yīng)用過(guò)程得到普遍認(rèn)可,一方面這與語(yǔ)音識(shí)別的技術(shù)缺陷有關(guān),其識(shí)別精度和速度都達(dá)不到實(shí)際應(yīng)用的要求;另一方面,與業(yè)界對(duì)語(yǔ)音識(shí)別的期望過(guò)高有關(guān),實(shí)際上語(yǔ)音識(shí)別與鍵盤(pán)、鼠標(biāo)或觸摸屏等應(yīng)是融合關(guān)系,而非替代關(guān)系。

深度學(xué)習(xí)技術(shù)自 2009 年興起之后,已經(jīng)取得了長(zhǎng)足進(jìn)步。語(yǔ)音識(shí)別的精度和速度取決于實(shí)際應(yīng)用環(huán)境,但在安靜環(huán)境、標(biāo)準(zhǔn)口音、常見(jiàn)詞匯場(chǎng)景下的語(yǔ)音識(shí)別率已經(jīng)超過(guò) 95%,意味著具備了與人類(lèi)相仿的語(yǔ)言識(shí)別能力,而這也是語(yǔ)音識(shí)別技術(shù)當(dāng)前發(fā)展比較火熱的原因。

隨著技術(shù)的發(fā)展,現(xiàn)在口音、方言、噪聲等場(chǎng)景下的語(yǔ)音識(shí)別也達(dá)到了可用狀態(tài),特別是遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別已經(jīng)隨著智能音箱的興起成為全球消費(fèi)電子領(lǐng)域應(yīng)用最為成功的技術(shù)之一。由于語(yǔ)音交互提供了更自然、更便利、更高效的溝通形式,語(yǔ)音必定將成為未來(lái)最主要的人機(jī)互動(dòng)接口之一。

當(dāng)然,當(dāng)前技術(shù)還存在很多不足,如對(duì)于強(qiáng)噪聲、超遠(yuǎn)場(chǎng)、強(qiáng)干擾、多語(yǔ)種、大詞匯等場(chǎng)景下的語(yǔ)音識(shí)別還需要很大的提升;另外,多人語(yǔ)音識(shí)別和離線語(yǔ)音識(shí)別也是當(dāng)前需要重點(diǎn)解決的問(wèn)題。雖然語(yǔ)音識(shí)別還無(wú)法做到無(wú)限制領(lǐng)域、無(wú)限制人群的應(yīng)用,但是至少?gòu)膽?yīng)用實(shí)踐中我們看到了一些希望。
本篇文章將從技術(shù)和產(chǎn)業(yè)兩個(gè)角度來(lái)回顧一下語(yǔ)音識(shí)別發(fā)展的歷程和現(xiàn)狀,并分析一些未來(lái)趨勢(shì),希望能幫助更多年輕技術(shù)人員了解語(yǔ)音行業(yè),并能產(chǎn)生興趣投身于這個(gè)行業(yè)。

 

語(yǔ)音識(shí)別的技術(shù)歷程
現(xiàn)代語(yǔ)音識(shí)別可以追溯到 1952 年,Davis 等人研制了世界上第一個(gè)能識(shí)別 10 個(gè)英文數(shù)字發(fā)音的實(shí)驗(yàn)系統(tǒng),從此正式開(kāi)啟了語(yǔ)音識(shí)別的進(jìn)程。語(yǔ)音識(shí)別發(fā)展到今天已經(jīng)有 70 多年,但從技術(shù)方向上可以大體分為三個(gè)階段。

下圖是從 1993 年到 2017 年在 Switchboard 上語(yǔ)音識(shí)別率的進(jìn)展情況,從圖中也可以看出 1993 年到 2009 年,語(yǔ)音識(shí)別一直處于 GMM-HMM 時(shí)代,語(yǔ)音識(shí)別率提升緩慢,尤其是 2000 年到 2009 年語(yǔ)音識(shí)別率基本處于停滯狀態(tài);2009 年隨著深度學(xué)習(xí)技術(shù),特別是 DNN 的興起,語(yǔ)音識(shí)別框架變?yōu)?DNN-HMM,語(yǔ)音識(shí)別進(jìn)入了 DNN 時(shí)代,語(yǔ)音識(shí)別精準(zhǔn)率得到了顯著提升;2015 年以后,由于“端到端”技術(shù)興起,語(yǔ)音識(shí)別進(jìn)入了百花齊放時(shí)代,語(yǔ)音界都在訓(xùn)練更深、更復(fù)雜的網(wǎng)絡(luò),同時(shí)利用端到端技術(shù)進(jìn)一步大幅提升了語(yǔ)音識(shí)別的性能,直到 2017 年微軟在 Swichboard 上達(dá)到詞錯(cuò)誤率 5.1%,從而讓語(yǔ)音識(shí)別的準(zhǔn)確性首次超越了人類(lèi),當(dāng)然這是在一定限定條件下的實(shí)驗(yàn)結(jié)果,還不具有普遍代表性。

GMM-HMM時(shí)代
70 年代,語(yǔ)音識(shí)別主要集中在小詞匯量、孤立詞識(shí)別方面,使用的方法也主要是簡(jiǎn)單的模板匹配方法,即首先提取語(yǔ)音信號(hào)的特征構(gòu)建參數(shù)模板,然后將測(cè)試語(yǔ)音與參考模板參數(shù)進(jìn)行一一比較和匹配,取距離最近的樣本所對(duì)應(yīng)的詞標(biāo)注為該語(yǔ)音信號(hào)的發(fā)音。該方法對(duì)解決孤立詞識(shí)別是有效的,但對(duì)于大詞匯量、非特定人連續(xù)語(yǔ)音識(shí)別就無(wú)能為力。因此,進(jìn)入 80 年代后,研究思路發(fā)生了重大變化,從傳統(tǒng)的基于模板匹配的技術(shù)思路開(kāi)始轉(zhuǎn)向基于統(tǒng)計(jì)模型(HMM)的技術(shù)思路。

HMM 的理論基礎(chǔ)在 1970 年前后就已經(jīng)由 Baum 等人建立起來(lái),隨后由 CMU 的 Baker 和 IBM 的 Jelinek 等人將其應(yīng)用到語(yǔ)音識(shí)別當(dāng)中。HMM 模型假定一個(gè)音素含有 3 到 5 個(gè)狀態(tài),同一狀態(tài)的發(fā)音相對(duì)穩(wěn)定,不同狀態(tài)間是可以按照一定概率進(jìn)行跳轉(zhuǎn);某一狀態(tài)的特征分布可以用概率模型來(lái)描述,使用最廣泛的模型是 GMM。因此 GMM-HMM 框架中,HMM 描述的是語(yǔ)音的短時(shí)平穩(wěn)的動(dòng)態(tài)性,GMM 用來(lái)描述 HMM 每一狀態(tài)內(nèi)部的發(fā)音特征。

基于 GMM-HMM 框架,研究者提出各種改進(jìn)方法,如結(jié)合上下文信息的動(dòng)態(tài)貝葉斯方法、區(qū)分性訓(xùn)練方法、自適應(yīng)訓(xùn)練方法、HMM/NN 混合模型方法等。這些方法都對(duì)語(yǔ)音識(shí)別研究產(chǎn)生了深遠(yuǎn)影響,并為下一代語(yǔ)音識(shí)別技術(shù)的產(chǎn)生做好了準(zhǔn)備。自上世紀(jì) 90 年代語(yǔ)音識(shí)別聲學(xué)模型的區(qū)分性訓(xùn)練準(zhǔn)則和模型自適應(yīng)方法被提出以后,在很長(zhǎng)一段內(nèi)語(yǔ)音識(shí)別的發(fā)展比較緩慢,語(yǔ)音識(shí)別錯(cuò)誤率那條線一直沒(méi)有明顯下降。

DNN-HMM時(shí)代
2006年,Hinton 提出深度置信網(wǎng)絡(luò)(DBN),促使了深度神經(jīng)網(wǎng)絡(luò)(DNN)研究的復(fù)蘇。2009 年,Hinton 將 DNN 應(yīng)用于語(yǔ)音的聲學(xué)建模,在 TIMIT 上獲得了當(dāng)時(shí)最好的結(jié)果。2011 年底,微軟研究院的俞棟、鄧力又把 DNN 技術(shù)應(yīng)用在了大詞匯量連續(xù)語(yǔ)音識(shí)別任務(wù)上,大大降低了語(yǔ)音識(shí)別錯(cuò)誤率。從此語(yǔ)音識(shí)別進(jìn)入 DNN-HMM 時(shí)代。

DNN-HMM主要是用 DNN 模型代替原來(lái)的 GMM 模型,對(duì)每一個(gè)狀態(tài)進(jìn)行建模,DNN 帶來(lái)的好處是不再需要對(duì)語(yǔ)音數(shù)據(jù)分布進(jìn)行假設(shè),將相鄰的語(yǔ)音幀拼接又包含了語(yǔ)音的時(shí)序結(jié)構(gòu)信息,使得對(duì)于狀態(tài)的分類(lèi)概率有了明顯提升,同時(shí)DNN還具有強(qiáng)大環(huán)境學(xué)習(xí)能力,可以提升對(duì)噪聲和口音的魯棒性。

簡(jiǎn)單來(lái)說(shuō),DNN 就是給出輸入的一串特征所對(duì)應(yīng)的狀態(tài)概率。由于語(yǔ)音信號(hào)是連續(xù)的,不僅各個(gè)音素、音節(jié)以及詞之間沒(méi)有明顯的邊界,各個(gè)發(fā)音單位還會(huì)受到上下文的影響。雖然拼幀可以增加上下文信息,但對(duì)于語(yǔ)音來(lái)說(shuō)還是不夠。而遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的出現(xiàn)可以記住更多歷史信息,更有利于對(duì)語(yǔ)音信號(hào)的上下文信息進(jìn)行建模。

由于簡(jiǎn)單的 RNN 存在梯度爆炸和梯度消散問(wèn)題,難以訓(xùn)練,無(wú)法直接應(yīng)用于語(yǔ)音信號(hào)建模上,因此學(xué)者進(jìn)一步探索,開(kāi)發(fā)出了很多適合語(yǔ)音建模的 RNN 結(jié)構(gòu),其中最有名的就是 LSTM 。LSTM 通過(guò)輸入門(mén)、輸出門(mén)和遺忘門(mén)可以更好的控制信息的流動(dòng)和傳遞,具有長(zhǎng)短時(shí)記憶能力。雖然 LSTM 的計(jì)算復(fù)雜度會(huì)比 DNN 增加,但其整體性能比 DNN 有相對(duì) 20% 左右穩(wěn)定提升。

BLSTM 是在 LSTM 基礎(chǔ)上做的進(jìn)一步改進(jìn),不僅考慮語(yǔ)音信號(hào)的歷史信息對(duì)當(dāng)前幀的影響,還要考慮未來(lái)信息對(duì)當(dāng)前幀的影響,因此其網(wǎng)絡(luò)中沿時(shí)間軸存在正向和反向兩個(gè)信息傳遞過(guò)程,這樣該模型可以更充分考慮上下文對(duì)于當(dāng)前語(yǔ)音幀的影響,能夠極大提高語(yǔ)音狀態(tài)分類(lèi)的準(zhǔn)確率。BLSTM 考慮未來(lái)信息的代價(jià)是需要進(jìn)行句子級(jí)更新,模型訓(xùn)練的收斂速度比較慢,同時(shí)也會(huì)帶來(lái)解碼的延遲,對(duì)于這些問(wèn)題,業(yè)屆都進(jìn)行了工程優(yōu)化與改進(jìn),即使現(xiàn)在仍然有很多大公司使用的都是該模型結(jié)構(gòu)。

圖像識(shí)別中主流的模型就是 CNN,而語(yǔ)音信號(hào)的時(shí)頻圖也可以看作是一幅圖像,因此 CNN 也被引入到語(yǔ)音識(shí)別中。要想提高語(yǔ)音識(shí)別率,就需要克服語(yǔ)音信號(hào)所面臨的多樣性,包括說(shuō)話人自身、說(shuō)話人所處的環(huán)境、采集設(shè)備等,這些多樣性都可以等價(jià)為各種濾波器與語(yǔ)音信號(hào)的卷積。而 CNN 相當(dāng)于設(shè)計(jì)了一系列具有局部關(guān)注特性的濾波器,并通過(guò)訓(xùn)練學(xué)習(xí)得到濾波器的參數(shù),從而從多樣性的語(yǔ)音信號(hào)中抽取出不變的部分,CNN 本質(zhì)上也可以看作是從語(yǔ)音信號(hào)中不斷抽取特征的一個(gè)過(guò)程。CNN 相比于傳統(tǒng)的 DNN 模型,在相同性能情況下,前者的參數(shù)量更少。

綜上所述,對(duì)于建模能力來(lái)說(shuō),DNN 適合特征映射到獨(dú)立空間,LSTM 具有長(zhǎng)短時(shí)記憶能力,CNN 擅長(zhǎng)減少語(yǔ)音信號(hào)的多樣性,因此一個(gè)好的語(yǔ)音識(shí)別系統(tǒng)是這些網(wǎng)絡(luò)的組合。

來(lái)源:巨靈鳥(niǎo) 歡迎分享本文

  • 點(diǎn)擊這里給我發(fā)消息
  • 點(diǎn)擊這里給我發(fā)消息
国产一区二区三区在线看片_日本韩国黄色_国产福利视频在线_成人97在线观看免费高清

              9000px;">

                          国产精品三级久久久久三级| 久久青草国产手机看片福利盒子| 欧美一个色资源| 一区二区在线观看免费 | 国产精品一区免费视频| 日韩欧美国产1| 韩国理伦片一区二区三区在线播放| 日韩一区二区三区电影| 精品亚洲欧美一区| 久久久久久夜精品精品免费| 粉嫩av一区二区三区在线播放 | 另类综合日韩欧美亚洲| 精品免费日韩av| 91福利在线观看| 午夜精品一区二区三区免费视频| 欧美精品日日鲁夜夜添| 亚洲成人免费影院| 欧美一区二区播放| 国产精品系列在线观看| 久久精品一区二区三区不卡牛牛 | 亚洲影院理伦片| 欧美日韩中文字幕一区| 日韩高清不卡在线| 日韩一区二区三免费高清| 国产精品一区二区无线| 亚洲视频综合在线| 欧美视频一区二区三区在线观看| 丝袜美腿成人在线| 欧美日韩日日摸| 韩国女主播成人在线| ●精品国产综合乱码久久久久| 91免费精品国自产拍在线不卡| 亚洲成人综合网站| 精品国产凹凸成av人导航| 波多野结衣视频一区| 水蜜桃久久夜色精品一区的特点| 精品对白一区国产伦| 成人99免费视频| 亚洲福利视频一区二区| www精品美女久久久tv| 99久久精品久久久久久清纯| 日本午夜一区二区| 中文字幕精品一区二区精品绿巨人| 欧美在线你懂的| 国产综合一区二区| 亚洲一区中文在线| 国产午夜一区二区三区| 欧美日韩夫妻久久| 成人免费毛片片v| 久久成人免费日本黄色| 一区二区三区波多野结衣在线观看| 日韩视频一区二区三区在线播放| 91香蕉视频mp4| 精品在线播放午夜| 亚洲高清免费观看高清完整版在线观看| 日韩欧美三级在线| 欧美三级欧美一级| 欧美在线高清视频| 99久久久免费精品国产一区二区| 麻豆国产一区二区| 亚洲在线观看免费| 国产精品你懂的| 精品奇米国产一区二区三区| 欧美制服丝袜第一页| 99久久精品国产网站| 国产寡妇亲子伦一区二区| 免费欧美在线视频| 三级影片在线观看欧美日韩一区二区 | 欧美日韩色一区| 国产在线精品一区二区不卡了| 五月天一区二区| 成人免费在线观看入口| 国产女人水真多18毛片18精品视频 | 香蕉久久一区二区不卡无毒影院| 日本一区二区三区高清不卡| 欧美一区二区三区婷婷月色| 欧美日韩一区二区在线视频| 色哟哟一区二区三区| 白白色亚洲国产精品| 国产精品99久| 国产成人免费视| 国产成人午夜视频| 国产精品18久久久久久久网站| 久久99精品国产91久久来源| 日韩电影在线观看一区| 水蜜桃久久夜色精品一区的特点| 亚洲午夜激情av| 亚洲成人午夜影院| 性久久久久久久久| 舔着乳尖日韩一区| 免费一区二区视频| 蜜臀av在线播放一区二区三区| 日本成人中文字幕| 久久不见久久见免费视频7| 另类中文字幕网| 国产乱人伦精品一区二区在线观看| 国产精品综合视频| 成人深夜福利app| gogo大胆日本视频一区| 色综合久久88色综合天天6 | 国产欧美一区二区精品秋霞影院 | 久久精品国产成人一区二区三区 | 亚洲一级电影视频| 亚洲一区二区三区四区中文字幕| 亚洲精品成人a在线观看| 亚洲第一成人在线| 久久精品二区亚洲w码| 国产夫妻精品视频| 91年精品国产| 欧美视频在线一区二区三区| 欧美一区二区人人喊爽| 欧美第一区第二区| 国产精品你懂的| 亚洲成人综合网站| 麻豆成人久久精品二区三区红| 国产伦精品一区二区三区免费迷 | 偷拍亚洲欧洲综合| 国模少妇一区二区三区| www.亚洲在线| 欧美日韩一本到| 日韩免费性生活视频播放| 国产欧美精品一区二区色综合| 夜夜亚洲天天久久| 日韩成人伦理电影在线观看| 国产乱国产乱300精品| 91视视频在线观看入口直接观看www | 国产a久久麻豆| 欧洲av在线精品| 精品乱码亚洲一区二区不卡| 国产精品久久久久久久裸模| 婷婷一区二区三区| 成人午夜av在线| 欧美日本高清视频在线观看| 国产亚洲精品久| 亚洲va在线va天堂| 成人午夜在线免费| 欧美一区二区三区系列电影| 亚洲欧洲成人av每日更新| 久久国产乱子精品免费女| 99re66热这里只有精品3直播| 日韩美女视频一区二区在线观看| 亚洲精品欧美激情| 国产福利精品导航| 日韩一卡二卡三卡| 亚洲免费观看视频| 国产成人精品三级麻豆| 一区二区三区免费看视频| 久久爱www久久做| 欧美视频精品在线| 日本一区二区三区在线不卡| 偷偷要91色婷婷| 在线中文字幕一区二区| 国产精品免费看片| 国产老肥熟一区二区三区| 91精品中文字幕一区二区三区| 国产精品丝袜在线| 久久精品国产一区二区三| 欧美日韩一级视频| 国产精品福利影院| 国产suv一区二区三区88区| 精品卡一卡二卡三卡四在线| 午夜日韩在线观看| 欧美亚洲日本国产| 亚洲人成亚洲人成在线观看图片| 国产在线一区观看| 欧美一级一区二区| 日韩电影在线观看电影| 欧美日韩精品一二三区| 一区二区三区四区五区视频在线观看| 国产福利一区二区三区在线视频| 久久综合色综合88| 国产一区二区女| 欧美一区二区免费视频| 日韩av中文字幕一区二区三区| 欧美日韩在线观看一区二区 | 午夜精品福利久久久| 一本色道综合亚洲| 亚洲欧美日韩中文字幕一区二区三区| 国产精品一级片在线观看| 精品国产乱码久久久久久浪潮| 麻豆精品视频在线观看视频| 日韩视频中午一区| 另类人妖一区二区av| 日韩免费性生活视频播放| 九一久久久久久| 久久久精品中文字幕麻豆发布| 久久精品噜噜噜成人av农村| 欧美不卡一区二区三区| 久久99在线观看| 久久综合久久久久88| 懂色av一区二区三区蜜臀| 国产精品你懂的在线欣赏| 91社区在线播放| 一区二区三区四区激情 | 欧美日韩黄色影视| 日韩av在线发布| 精品美女在线播放| 成人免费毛片aaaaa**| 一区二区三区四区不卡在线| 欧美三级在线播放|