語音信號噪音處理及濁音、清音的分辨對智能機(jī)器人人機(jī)語音交互系統(tǒng)是非常重要的。本文采用MATLAB軟件平臺(tái)設(shè)計(jì)了巴特沃斯FIR數(shù)字濾波器,進(jìn)行簡單的語音信號去噪音濾波處理。由于原始語音信號的時(shí)域波形圖與頻譜圖變化小,分析起來有一定的困難,為方便波形分析,需要對原始語音信號進(jìn)行4千赫茲和8千赫茲重抽樣調(diào)查,通過短時(shí)平均過零率與短時(shí)自相關(guān)函數(shù)法對語音信號進(jìn)行清、濁音的辨別和基音周期提取。通過分析結(jié)果顯示,基于切比雪夫窗函數(shù)設(shè)計(jì)的濾波器對語音信號過濾效果有非常大的幫助。
關(guān)鍵詞:濾波器,MATLAB,語音信號,重采樣
語言是人與人工智能進(jìn)行交流的基礎(chǔ)。為獲得清晰的語言信息,用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理非常重要。處理語音的基本理論以及處理算法研究主要在兩個(gè)方面:①從語音的產(chǎn)生和語音感知進(jìn)行研究;②為獲得有效的語音信號對語音進(jìn)行去噪聲處理[1-4]。
語音處理技術(shù)是多學(xué)科、多領(lǐng)域相結(jié)合的高新技術(shù),其中包括數(shù)字信號處理、語言學(xué)、語音學(xué)、模式識別等,現(xiàn)已成為人工智能實(shí)現(xiàn)人機(jī)對話的重要基礎(chǔ)[3-5]。
本文利用MATLAB設(shè)計(jì)了FIR數(shù)字濾波器進(jìn)行語音信號去噪處理,主要采用切比雪夫窗函數(shù)設(shè)計(jì)FIR數(shù)字濾波器。為便于分析,將原始語音信號進(jìn)行4千赫茲和8千赫茲重采樣,然后根據(jù)濾波的性能指標(biāo)對含有噪音的語音信號進(jìn)行濾波處理,最后將濾波前后的時(shí)域波形與頻譜波形進(jìn)行了比較。
1 數(shù)字濾波器設(shè)計(jì)
數(shù)字濾波器(DF,即Digital Filter)分為兩大類:經(jīng)典濾波器和現(xiàn)代濾波器,其中輸入端的信號中不僅有可用的頻率成分,還有無用的頻率成分,在經(jīng)典濾波器中占有不同的頻率寬帶,通過一個(gè)合適的選頻濾波器濾除干擾,就可得到純凈信號,達(dá)到濾波目的[6]。數(shù)字濾波器功能是指把一系列輸入信號通過一定的運(yùn)算變換成輸出信號。
在設(shè)計(jì)數(shù)字濾波器時(shí),采用的運(yùn)算處理方法不同,決定了運(yùn)用濾波器的結(jié)構(gòu)也不同。FIR數(shù)字濾波器基本網(wǎng)絡(luò)結(jié)構(gòu)主要有直接型、級聯(lián)型、線性型和頻率采樣型[7]幾種,本文簡要介紹前兩種結(jié)構(gòu)的系統(tǒng)函數(shù)及結(jié)構(gòu)。
2 語音信號處理方案
人在說話時(shí)與環(huán)境以及說話人的狀態(tài)有關(guān),人機(jī)交互更是如此,在相對安靜的環(huán)境里錄制一段時(shí)間為10秒的語音信號作為本文待處理信號,圖3為處理流程。
(1)利用GoldWave錄音軟件錄制,保存格式為.wav后綴,利用MATLAB軟件中的wavread()函數(shù)讀取錄制好的語音信號,并繪制出該語音信號的時(shí)域與頻譜波形圖[4]。
(2)MATLAB給信號加噪聲的方法很多,如可以添加白噪聲、隨機(jī)噪聲等。本文直接通過MATLAB軟件給原始信號疊加指定的噪音,該噪聲為幅值A(chǔ)z=0.02,噪聲頻率為ωz=10的正弦信號噪聲,即Z=0.02*sin(10*n)。模擬原始語音信號被噪聲干擾,然后繪制出疊加噪音后的時(shí)域與頻譜波形圖。
(3)濾波性能指標(biāo)為ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,MATLAB中濾波器設(shè)計(jì)采用切比雪夫窗函數(shù)。采用FIR數(shù)字濾波器,對疊加有噪音的語音信號進(jìn)行濾波處理,然后繪制出含有噪聲的語音信號頻譜。
(4)根據(jù)MATLAB所繪制的波形圖,分析語音信號濾波前后的變化。
3 實(shí)驗(yàn)結(jié)果與分析
(1)圖4為原始語音信號的時(shí)域、頻譜圖。由于原始信號的頻譜圖在0~0.2千赫茲和1.8~2千赫茲范圍內(nèi)波動(dòng)較小,為便于分析,將原始語音信號進(jìn)行4KHz和8KHz的重采樣處理,繪制出如圖5、圖6的時(shí)域波形圖與頻譜圖。
(2)圖7為噪音信號時(shí)域波形與頻譜圖,該噪音在頻率為8kHz和1.2kHz時(shí)的噪音最明顯。根據(jù)濾波性能指標(biāo)ωp=0.6*pi,ωs=0.75*pi,RP=1,As=30,T=1,巴特沃斯濾波器濾除含有加噪音的信號。圖8為加噪音濾波后時(shí)域與頻譜圖,從圖中可以看出,該濾波器將頻率為8kHz和1.2kHz時(shí)的噪音成功濾除了,這表明該濾波器滿足濾波性能要求。
(3)在進(jìn)行語音辨別時(shí),需要對清音、濁音及噪音進(jìn)行區(qū)別。由于語音屬于非平穩(wěn)的寬帶信號,利用短時(shí)平均過零率來辨別清音與濁音,根據(jù)過零次數(shù)的高低來辨別清、濁音,如圖9所示。過零次數(shù)最高的語音信號在幀數(shù)為1 480幀左右時(shí)達(dá)到最高,為清音。過零次數(shù)最高時(shí),對應(yīng)語音信號波形中幅度變化最劇烈處。
(4)為便于語音系統(tǒng)診斷與識別說話人,提取語音基音至關(guān)重要。語音基音檢測技術(shù)有時(shí)域自相關(guān)函數(shù)法、頻域倒譜法及將兩者相結(jié)合的小波變換分析法。考慮到濾波器的性能指標(biāo),在截取原始語音信號的基音周期時(shí)采用短時(shí)自相關(guān)函數(shù)法,該方法在檢測時(shí)域波形周期性與同步性上效果好且相對容易。
4 結(jié)語
本文設(shè)計(jì)的巴特沃斯FIR數(shù)字濾波器具有較好的濾除效果,在時(shí)域波形上,濾波后的波形與原始語音信號波形變化較小,從兩者的頻譜圖上可較明顯看出濾波去噪音前后的變化。通過短時(shí)過零率能分辨出清音、濁音。短時(shí)自相關(guān)函數(shù)可從信號本身檢測到基音周期。
參考文獻(xiàn):
[1] 趙力.語音信號處理[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 梁曉輝,周權(quán).語音信號處理方法的可靠性研究[J].電聲技術(shù),2010,34(4):58-62.
[3] 宋毅郡,朱艷萍,宋耀良.基于分?jǐn)?shù)階濾波器的ADPCM預(yù)測誤差信號處理[J].電聲技術(shù),2010,34(5):52-55.
[4] 付大麗,黨幼云.數(shù)字濾波器在語音信號處理中的應(yīng)用[J].電聲技術(shù),2012,36(8):62-72.
[5] 王淑嬌.數(shù)字濾波器的設(shè)計(jì)與參數(shù)的選擇[J].科技資訊,2011,35(12):32-33.
[6] 文德仲.淺析數(shù)字濾波器原理及其設(shè)計(jì)過程[J].技術(shù)與應(yīng)用,2016:161-162.
[7] 王兵鋒.FIR數(shù)字濾波器設(shè)計(jì)與仿真研究[D].哈爾濱:哈爾濱理工大學(xué),2009.
推薦閱讀:天津理工大學(xué)學(xué)報(bào)期刊論文投稿須知
《天津理工大學(xué)學(xué)報(bào)》(雙月刊)曾用刊名:天津理工學(xué)院學(xué)報(bào),1984年創(chuàng)刊,以追求科技創(chuàng)新、展示科技成果,促進(jìn)學(xué)術(shù)交流、推動(dòng)社會(huì)科技進(jìn)步,發(fā)現(xiàn)培養(yǎng)新人為宗旨。刊發(fā)有關(guān)自然科學(xué)與工程技術(shù)各學(xué)科領(lǐng)域、國家自然科學(xué)基金、國家863項(xiàng)目、國家973項(xiàng)目,省不及各類基金自主的科研項(xiàng)目、理論研究、應(yīng)用科技成果、實(shí)驗(yàn)研究的高水平科技論文。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >