《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 設計應用 > 一種應用于機器學習的惡意網頁特征提取方法
一種應用于機器學習的惡意網頁特征提取方法
2022年電子技術應用第12期
張珂偉1,2,鄭世普1,2,程永靈1,2,王長帥1,2
1.中電(海南)聯合創新研究院有限公司,海南 澄邁571924; 2.海南省PK體系關鍵技術研究重點實驗室,海南 澄邁571924
摘要: 基于機器學習的惡意網頁檢測技術進行研究。目前流行的“特征碼”“白名單”等方式,僅能夠檢測已知的惡意網頁;機器學習方法,能夠檢測出未知的惡意網頁,但在處理網頁特征時要面臨數據量大、復雜和繁瑣的問題。提出一種哈希壓縮的方法,用于處理網頁的特征數據。該方法在保證檢測模型的漏報率和誤報率下可實現將150萬的特征映射在2萬的特征空間內,對提取出的特征數據運用K折交叉驗證法訓練多個傳統機器學習模型和集成學習模型。并通過評估模型的檢測效果,篩選出表現最好的分類檢測模型。
中圖分類號: TP181
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.222907
中文引用格式: 張珂偉,鄭世普,程永靈,等. 一種應用于機器學習的惡意網頁特征提取方法[J].電子技術應用,2022,48(12):122-127.
英文引用格式: Zhang Kewei,Zheng Shipu,Cheng Yongling,et al. A feature extraction method for malicious web pages applied on machine learning[J]. Application of Electronic Technique,2022,48(12):122-127.
A feature extraction method for malicious web pages applied on machine learning
Zhang Kewei1,2,Zheng Shipu1,2,Cheng Yongling1,2,Wang Changshuai1,2
1.CEC Joint Innovation Research Institute,Chengmai 571924,China; 2.Key Laboratory of PK System Technologies Research of Hainan Province,Chengmai 571924,China
Abstract: Applied on machine learning, malicious web page detection technology is studied in this paper. At present, popular methods of “feature code” or “whitelist” can only detect known malicious web pages. The method of machine learning can detect unknown malicious web pages, but it has to face the problem of that the data is large, complex and tedious when processing web page features. In this paper, a Hash compression method is proposed. The method can map 1.5 million features into 20,000 feature space, and train multiple traditional machine learning models and integrated learning models using k-fold cross-validation method for extracted feature data. The best classification detection model will be selected by evaluating the detection effect of the model.
Key words : machine learning;malicious web page detection;Hash compression method

0 引言

    PKS體系是中國電子在PK體系的基礎上,將“可信計算3.0”技術融入到CPU、操作系統和存儲控制器中,形成了“三位一體”的“PKS”主動免疫防護。PKS通過在核心層內生內置安全技術,最大限度地提升網絡安全防護效果。本文基于PKS“小核心大生態”理念,在基于PKS核心底座的基礎上,通過提出一種網頁特征提取方法,實現在增強層進一步提升系統安全的能力。

    隨著網絡的迅速發展,網絡攻擊已經成為一個嚴重的問題。當前一些網絡釣魚、垃圾郵件、木馬下載、惡意軟件執行等攻擊方式常常通過惡意網頁作為傳播中介。因此,檢測惡意網頁去阻止這些攻擊,對維護網絡安全具有非常重要的意義[1]

    當前惡意網頁的檢測方法主要包括靜態特征檢測和動態特征檢測,兩種檢測方法都需要對網頁特征進行提取。靜態特征的提取方法是首先需要建立一個惡意網頁特征庫,對網頁的源代碼或URL鏈接等屬性進行特征提取,將提取的特征在惡意網頁靜態特征庫中進行比對,最終判斷待檢測網頁是否為惡意網頁[2-4]。動態特征檢測方法是對惡意網頁在運行時數據的下載動作、插件處理、訪問網頁等動態特征進行提取,通過分析行為結果對待檢測網頁進行檢測[5-6]




本文詳細內容請下載:http://www.viuna.cn/resource/share/2000005053




作者信息:

張珂偉1,2,鄭世普1,2,程永靈1,2,王長帥1,2

(1.中電(海南)聯合創新研究院有限公司,海南 澄邁571924;

2.海南省PK體系關鍵技術研究重點實驗室,海南 澄邁571924)




wd.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 成人午夜性视频欧美成人 | 日韩在线三级视频 | 日韩精品午夜 | 老子影院午夜伦不卡不四虎卡 | jizzjizz日本护士水多 | 五月天婷婷免费观看视频在线 | 性猛交xxxxx按摩中国 | 欧美成人福利视频 | 44383亚洲大成网人网站 | 精品乱久久 | 我要看一级黄色毛片 | 男女羞羞视频 | 欧美日韩一区二区三在线 | 久久天天躁狠狠躁夜夜呲 | 亚洲国产成人va在线观看 | 玖玖精品 | 1024手机基地在线观看 | 国内不卡1区2区 | 天天摸日日 | 中国高清videossex免费 | 亚洲精品成人网久久久久久 | 天天做天天摸天天爽天天爱 | 九九九在线视频 | 亚洲人成网站色7799在线观看 | 亚洲综合香蕉 | 成人看片免费 | 精品国产一区二区三区www | 操美女免费 | 亚洲无线| 免费一级α片在线观看 | 在线视频欧美日韩 | 日韩 欧美 中文字幕 不卡 | 亚洲 欧美 日韩 在线 | 日本黄色三级网站 | 国产亚洲一区二区三区在线 | 看全色黄大色黄女片做 | 中国毛片基地 | 久久精品人人做人人爽97 | 午夜小视频在线观看 | 欧美日韩专区 | 天堂在线国产 |