2018-06-01 15:03:37分類:行業(yè)資訊5061
如今物聯(lián)網(wǎng)的時(shí)代,而語音識(shí)別被視作為人機(jī)交互的入口,由于人工智能和機(jī)器學(xué)習(xí)迅猛發(fā)展,語音控制也變得更為實(shí)用。在接下來的幾年里智能語音將成為人機(jī)交互的新范式,語音識(shí)別技術(shù)將解放人類雙手和眼睛,用戶以較低的成本實(shí)現(xiàn)隨時(shí)訪問。未來與智能家居、可穿戴設(shè)備、機(jī)器人等交互模式,智能語音識(shí)別芯片將是最佳人機(jī)交互模式。
語音識(shí)別芯片也叫語音識(shí)別IC,與傳統(tǒng)的語音芯片相比,語音識(shí)別芯片最大的特點(diǎn)就是能夠語音識(shí)別,它能讓機(jī)器聽懂人類的語音,并且可以根據(jù)命令執(zhí)行各種動(dòng)作,如眨眼睛、動(dòng)嘴巴(智能娃娃)。除此之外,語音識(shí)別芯片還具有高品質(zhì)、高壓縮率錄音放音功能,可實(shí)現(xiàn)人機(jī)對話。
語音識(shí)別芯片所涉及的技術(shù)包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。
一、語音識(shí)別分類
按照使用者的限制而言,語音識(shí)別芯片可以分為特定人語音識(shí)別芯片和非特定人語音識(shí)別芯片。
特定人語音識(shí)別芯片是針對指定人的語音識(shí)別,其他人的話不識(shí)別,須先把使用者的語音參考樣本存入當(dāng)成比對的資料庫,即特定人語音識(shí)別在使用前必須要進(jìn)行語音訓(xùn)練,一般按照機(jī)器提示訓(xùn)練2遍語音詞條即可使用。
非特定人語音識(shí)別是不用針對指定的人的識(shí)別技術(shù),不分年齡、性別,只要說相同語言就可以,應(yīng)用模式是在產(chǎn)品定型前按照確定的十幾個(gè)語音交互詞條,采集200人左右的聲音樣本,經(jīng)過PC算法處理得到交互詞條的語音模型和特征數(shù)據(jù)庫,然后燒錄到芯片上。應(yīng)用這種芯片的機(jī)器(智能娃娃、電子寵物、兒童電腦)就具有交互功能了。
非特定人語音識(shí)別應(yīng)用有的是基于音素的算法,這種模式下不需要采集很多人的聲音樣本就可以做交互識(shí)別,但是缺點(diǎn)是識(shí)別率不高,識(shí)別性能不穩(wěn)定。
二、語音識(shí)別基本原理
嵌入式語音識(shí)別系統(tǒng)都采用了模式匹配的原理。錄入的語音信號(hào)首先經(jīng)過預(yù)處理,包括語音信號(hào)的采樣、反混疊濾波、語音增強(qiáng),接下來是特征提取,用以從語音信號(hào)波形中提取一組或幾組能夠描述語音信號(hào)特征的參數(shù)。特征提取之后的數(shù)據(jù)一般分為兩個(gè)步驟,第一步是系統(tǒng)"學(xué)習(xí)"或"訓(xùn)練"階段,這一階段的任務(wù)是構(gòu)建參考模式庫,詞表中每個(gè)詞對應(yīng)一個(gè)參考模式,它由這個(gè)詞重復(fù)發(fā)音多遍,再經(jīng)特征提取和某種訓(xùn)練中得到。第二是"識(shí)別"或"測試"階段,按照一定的準(zhǔn)則求取待測語音特征參數(shù)和語音信息與模式庫中相應(yīng)模板之間的失真測度,最匹配的就是識(shí)別結(jié)果。
相信這不僅對于智能手機(jī),對于可穿戴設(shè)備、智能家居而言也是十分受用的產(chǎn)品;因?yàn)檫@些設(shè)備因?yàn)轶w積而受限的交互界面可借助語音識(shí)別進(jìn)入新階段。而在續(xù)航問題上也能得到又有效的保證。
賽億方案十年電子產(chǎn)品硬件及嵌入式軟件開發(fā)設(shè)計(jì)經(jīng)驗(yàn),累計(jì)開發(fā)產(chǎn)品電子應(yīng)用設(shè)計(jì)完成5000多個(gè)方案設(shè)計(jì);目前為客戶提供理念超前的手機(jī)app開發(fā)、智能家居系統(tǒng)、電子技術(shù)、電子線路設(shè)計(jì)、PCB設(shè)計(jì)、電路板設(shè)計(jì)、單片機(jī)技術(shù)、智能控制、嵌入式系統(tǒng)等。如有產(chǎn)品方案開發(fā)意向,期待您的來訪。