文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211516
中文引用格式: 蔡靖,杜佳辰,王慶,等. 基于VGG16網絡的人臉情緒識別[J].電子技術應用,2022,48(1):67-70,75.
英文引用格式: Cai Jing,Du Jiachen,Wang Qing,et al. Facial emotion recognition based on VGG16 network[J]. Application of Electronic Technique,2022,48(1):67-70,75.
0 引言
Hinton等人在研究深度卷積神經網絡中通過引入ReLU函數以及采用多GPU訓練等方式加快了網絡的訓練速度并提高了網絡模型的準確率[1]。LeCun等人表明深度學習通過使用反向傳播算法來發現大型數據集中的復雜結構,以指示機器應如何更改用于從前一層的表示計算每一層的表示的內部參數。深度卷積網絡在處理圖像、視頻、語音和音頻方面取得了突破性進展,而遞歸網絡則為文本和語音等順序數據帶來了光明[2]。隨著科學技術,尤其是計算機技術方面的不斷進步,人們對卷積神經網絡的研究也不斷深入,面部表情識別技術也隨之得到了發展。同時,一些問題也隨之而來,例如:如何提高面部表情分類的準確率,如何能夠在保證準確率的前提下減少計算的參數量等。
Tang等人[3]提出將卷積神經網絡(Convolutional Neural Networks,CNN)中融入支持向量機(SVM),同時修改了全連接層中的計算損失值的方法,在表情數據集上的測試結果為71.2%,斬獲了當年Kaggle比賽的一等獎。崔鳳焦[4]將卷積神經網絡、Adaboost和支持向量機3種模型算法結構進行相互比較和設計優化,在Cohn-Kanade表情庫中實現了對人臉情緒的智能識別,平均識別率最高達到了74.92%。謝鑫等人[5]采用了耗時加長的杜鵑算法(CuckooSearch,CS)對ResNet50模型進行了變更改進,提高了準確率并使算法不會在調參時陷入梯度消失或爆炸的問題,準確率達到了74.3%。陳佳等人[6]提出一種基于卷積神經網絡集成的表情識別方法,子網結構在第一階段訓練3個子網絡,采用Batch Normalization方法和Dropout層來加速網絡的收斂。接著去掉3個子網絡的輸出層,使用SVM進行第二階段的訓練,完成最終表情的預測,其準確率達到了70.84%。
本文詳細內容請下載:http://www.viuna.cn/resource/share/2000003910。
作者信息:
蔡 靖,杜佳辰,王 慶,周泓任
(吉林大學 儀器科學與電氣工程學院,吉林 長春130026)