智能運維在中國移動IT云中的應用與實踐
2021年電子技術應用第11期
劉 虹,滕 濱,張 琳,郭志斌
中國移動通信集團有限公司 信息技術中心,北京100032
摘要: 介紹了中國移動IT云針對IaaS層的智能運維場景體系規劃,選擇了數據基礎較好的兩個典型應用場景“智能化指標異常檢測”和“智能化告警關聯與溯源”進行了研究和論證,分別分析了兩個場景適用的算法和實現過程,論述了兩個場景實施后的效果評估方法,并經實際生產驗證了場景實施的效果。
中圖分類號: TN929.5;TP399
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211543
中文引用格式: 劉虹,滕濱,張琳,等. 智能運維在中國移動IT云中的應用與實踐[J].電子技術應用,2021,47(11):20-24.
英文引用格式: Liu Hong,Teng Bin,Zhang Lin,et al. Best practice of AIops in China Mobile private cloud[J]. Application of Electronic Technique,2021,47(11):20-24.
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211543
中文引用格式: 劉虹,滕濱,張琳,等. 智能運維在中國移動IT云中的應用與實踐[J].電子技術應用,2021,47(11):20-24.
英文引用格式: Liu Hong,Teng Bin,Zhang Lin,et al. Best practice of AIops in China Mobile private cloud[J]. Application of Electronic Technique,2021,47(11):20-24.
Best practice of AIops in China Mobile private cloud
Liu Hong,Teng Bin,Zhang Lin,Guo Zhibin
Information Technology Center,China Mobile Communications Group Co.,Ltd.,Beijing 100032,China
Abstract: The planning of infrastructure AIops scenario for China Mobile private cloud is described, and the two typical scenarios named "Intelligent Index Anomaly Detection" and "Intelligent Alarm Traceability" are researched. The algorithm and business processes of the two scenarios are introduced respectively.The effect evaluation method of the two scenarios is discussed,and the actual production verifies the implementation effect.
Key words : AIops;index anomaly detection;alarm traceability;machine learning
0 引言
隨著國內企業數智化轉型的深入推進,企業私有云的設備規模呈現持續增加的趨勢,作為中國移動內部支撐系統的云化基礎設施,一級云資源池的規模持續增加,運營和運維工作面臨著越來越大的壓力。從業界經驗來看,運維人員數量無法隨著設備數量線性增加,每萬臺服務器運維人員的數量持續下降,因此亟需引入智能化運維手段,解決人力不足的矛盾。同時,也需要借助智能化工具提高資源的可用性,提升租戶的使用體驗。為此,中國移動結合IT云自身特點,梳理了一級IT云的智能運維場景體系,并選取典型場景進行了應用與實踐。本文基于中國移動一級IT云運維團隊的切實需求,綜合評估業界關鍵技術成熟度和一級IT云的基礎運維數據質量,選擇以下兩個場景進行分析和研究:
本文詳細內容請下載:http://www.viuna.cn/resource/share/2000003819。
作者信息:
劉 虹,滕 濱,張 琳,郭志斌
(中國移動通信集團有限公司 信息技術中心,北京100032)
此內容為AET網站原創,未經授權禁止轉載。