智能語音作為入口已滲透到了很多領域,從智能音箱到智能臺燈,從智能家電到汽車的智能中控、后視鏡,以及工業或陪伴式機器人,智能語音可在消費、汽車、教育、工業等各個領域開花結果。
所謂的智能語音就是給語音加了“大腦”,讓其理解用戶通過語音表達出來的意圖和需求,并且可以把對應的內容返回給用戶。
“現階段,智能語音的落地主要受消費電子市場激烈的競爭格局所驅動,各廠商都期望賦予產品新賣點與新亮點。語音在消費市場尤為火熱,除了蘋果、谷歌、亞馬遜等行業巨頭紛紛入場之外,還存在眾多跟風者。而其它領域,如汽車電子、工業醫療等,由于行業門檻或需求不集中等原因,雖被看好但仍需一定時間才能被市場接受。” 意法半導體模擬、微電機產品部市場經理倪明如是說。
意法半導體模擬、微電機產品部市場經理倪明
市面上有很多智能語音方案,背后的關鍵技術是硬件、算法以及云服務。
倪明介紹道:“意法半導體在硬件上有自己的特色,能夠提供市場上應用很普遍的STM32系列MCU作為主控,再加上2顆或4顆硅麥克風組成麥克風陣列;在聲學算法方面,意法半導體可提供Beam Forming (語音指向)、Sound Localization (聲源定位)、Echo Cancelation (回聲消除) 這些聲學前端算法,后端的聲學算法如本地、云端的語音識別,將由第三方合作伙伴 (如Sensory、科大訊飛等) 來提供。”
對于近場語音識別,比如智能穿戴、陪伴式機器人,上述意法半導體方案即可滿足需求;對于遠場的語音識別,比如智能音箱,意法半導體將負責語音前端處理,AP或DSP的第三方算法將負責后端處理,因此需要與高通等后端AP廠商配合實現。
倪明表示:各廠商的智能語音方案都獨具特色,現有的語音方案在功能上基本滿足了市場的需求,但可擴展性及性能仍有改進空間。比如使用者會經常遇到聽不到、聽不清的情況,語音產品易被干擾且存在功耗大等問題。解決這些問題需要系統各方面的共同改進。意法半導體本著開放的態度與行業各方合作共贏。
倪明指出理想的應用或產品應該是“按需分配”:即根據用戶或市場的需求,系統可以做出適當的取舍與調整。與此同時,倪明介紹了意法半導體在理想化產品道路上做出的努力:
作為系統基礎的硬件,硅麥克風至關重要。意法半導體在提高其本體性能方面,將SNR提高到65~67dB、 AOP提高到135dBSPL,以及在麥克風ASIC電路中加入抗干擾的設計等;
在意法半導體Beamforming算法庫中有4種針對不同應用場景的模式供選擇,既有適用于智能穿戴等語音方向較確定的場景下強指向模式 (Strong) ,也有適用于語音方向范圍較寬、環境噪聲較大場景下的消噪模式 (Cardioid denoise) ;
在功耗方面,意法半導體新發布的MP23DB01HP數字硅麥克風可以支持低功耗模式,該模式下麥克風的功耗還不到正常模式的一半,極大地提高了系統的持續工作時間。例如手機穿戴產品中需要集成度更高、更加低功耗的方案,意法半導體正在與合作伙伴研發將麥克風與DSP合二為一的芯片“Smart MIC”,該芯片將大大節約PCB布板空間及系統功耗。