《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 設計應用 > 基于生成對抗網絡合成噪聲的語音增強方法研究
基于生成對抗網絡合成噪聲的語音增強方法研究
2020年電子技術應用第11期
夏 鼎,徐文濤
南京航空航天大學 理學院,江蘇 南京211106
摘要: 在語音增強領域,深度神經網絡通過對大量含有不同噪聲的語音以監督學習方式進行訓練建模,從而提升網絡的語音增強能力。然而不同類型噪聲的獲取成本較大,噪聲類型難以全面采集,影響了模型的泛化能力。針對這個問題,提出一種基于生成對抗網絡(Generative Adversarial Networks,GAN)的噪聲數據樣本增強方法,該方法對真實噪聲數據進行學習,根據數據特征合成虛擬噪聲,以此擴充訓練集中噪聲數據的數量和類型。通過實驗驗證,所采用的噪聲合成方法能夠有效擴展訓練集中噪聲來源,增強模型的泛化能力,有效提高語音信號去噪處理后的信噪比和可理解性。
中圖分類號: TN912.3
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.200327
中文引用格式: 夏鼎,徐文濤. 基于生成對抗網絡合成噪聲的語音增強方法研究[J].電子技術應用,2020,46(11):56-59,64.
英文引用格式: Xia Ding,Xu Wentao. Research on speech enhancement method based on generating noise using GAN[J]. Application of Electronic Technique,2020,46(11):56-59,64.
Research on speech enhancement method based on generating noise using GAN
Xia Ding,Xu Wentao
School of Science,Nanjing University of Aeronautics and Astronautics,Nanjing 211106,China
Abstract: In the field of speech enhancement, deep neural network can improve the enhancement ability of the model by training and modeling a large number of data with different noises in the supervised learning way. However, the acquisition cost of different types of noise is large and the noise types are difficult to be comprehensive, which affects the generalization ability of the model. Aiming at this problem, this paper proposes a noise data augmentation method based on generative adversarial network(GAN), which learns from the real noise data and synthesizes virtual noises according to the data features, so as to expand the number and type of the noise data in the training set. Experimental results show that the method of noise synthesis adopted in this article can effectively expand the source of noise in the training set, enhance the generalization ability of the model, and effectively improve the signal-to-noise ratio and intelligibility of speech signal after denoising.
Key words : speech enhancement;generative adversarial network;data augmentation

0 引言

    在語音信號處理的過程中,背景噪聲和環境干擾嚴重影響了信號處理的可靠性,需要通過語音增強處理方法去除信號中的噪聲干擾,改善含噪語音的質量。因此,語音增強技術在語音識別、聽力輔助和語音通信等領域中具有非常重要的作用。

    傳統的語音增強方法有譜減法[1]、維納濾波[2-3]以及之后出現的基于統計模型的處理方法[4]等,這些方法都是基于已知噪聲的統計特性來進行建模,得到噪聲的功率譜信息,對含噪語音信號進行降噪處理,以估計純凈語音信號。這些傳統方法的準確性嚴重依賴數據特征工程處理方法和數據類型,對于未知的噪聲干擾,其適應能力較差[5]。隨著人工智能的發展,深度神經網絡被應用于語音增強領域[6]。利用深層神經網絡的特征學習,可以將含噪語音映射為純凈語音,達到去除噪聲的目的。為了提高深度神經網絡進行語音增強方法的泛化能力,最直接的手段是進行數據增強,包括增加數據的多樣性、擴大數據集等。實驗表明,在深度神經網絡訓練的過程中采用更多種類的噪聲數據,語音信噪比質量可以顯著提高[7-8]。但是,真實的噪聲數據獲取難度較大,成本較高,這限制了網絡去噪能力的適用性。針對這一問題,本文基于生成對抗網絡GAN設計了一種訓練數據集增強方法,通過生成虛擬噪聲,擴充訓練集中噪聲數據的類型和數量,提高模型的泛化能力。




本文詳細內容請下載:http://www.viuna.cn/resource/share/2000003050




作者信息:

夏  鼎,徐文濤

(南京航空航天大學 理學院,江蘇 南京211106)

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 成人在激情在线视频 | 两性仑乱肉麻小说 | 性大毛片视频 | 中文字幕一区二区三 | 在线观看亚洲免费视频 | 午夜国产福利 | 77788色淫网站免费观看 | 国产欧美精品国产国产专区 | 精品精品国产理论在线观看 | 欧美亚洲韩国 | 妞干网最新视频 | 亚洲日韩精品欧美一区二区一 | 色噜噜狠狠成人网 | 国产精品无卡无在线播放 | 欧美一区二区亚洲 | 天天干视频在线观看 | 又猛又黄又爽无遮挡的视频网站 | 中国女人三级在线播放 | 综合九九| 一个人看的免费视频www | 免费在线成人 | 污黄视频在线看 | 美国十次狠狠色综合 | 日日搞夜夜操 | 日韩一区二区三区视频在线观看 | 欧美精彩狠狠色丁香婷婷 | 日韩色影视 | 中文字幕亚洲综久久2021 | 成人午夜视频网站 | 日韩a在线 | 在线播放你懂的 | 涩涩漫画网 | 国产中文字幕久久 | 一级α片 | 最近最新中文字幕免费高清1 | 男女上下猛烈动态图午夜 | 午夜剧场在线免费观看 | 国产精品合集一区二区三区 | 日韩视频在线播放 | 成人免费视频软件网站 | 高清一区二区亚洲欧美日韩 |