作者:鮑勃·羅杰斯(Bob Rogers),英特爾首席數據科學家
數據對于現代企業的重要程度不言而喻,擁有卓越的數據分析能力可在市場上擁有更大的競爭優勢。然而企業用戶和一些決策者對于數據分析仍然有一些誤解和偏見。
比如
“我們企業并不需要機器學習這樣的高級分析工具。”
“我們有很多數據,但是分析沒啥用。”
“我們要進行數據分析就必須要聘請一批數據科學家!”
接下來我們一一揭開這些對于數據分析迷之誤解背后的真相。
1,“為了部署像機器學習(ML)這樣先進的分析技術,我們必須購入新硬件和大量投資專用基礎設施。”
真相:部署高級的數據分析其實沒你想象中那么遙遠。
許多公司已經擁有大量的高級分析基礎設施。例如,工廠車間通常有數千個傳感器,但通常不是所有的傳感器都被使用,因為它們產生的數據是紛雜的,那么能夠很好的管理,存儲和集成所有的數據就是一個很好的起點。
如果沒有可用于分析的大量現有硬件,也不用太擔心,許多云服務提供商 https://www.ferolabs.com/(CSP)就可以提供現成的高級分析功能。利用這些資源運行一些試驗項目,并由此制定有效的使用案例,然后可以制定一個長期投資路線圖,并清楚了解投入產出比。
如果選擇內部運行,則可以使用現有的基于英特爾技術的平臺來經濟高效地支持新項目。
2,“我們不需要像機器學習這樣的高級分析工具。”
真相:無論企業規模大小,每個企業都需要高級分析。
很多企業都在做數據分析,也不乏很多企業還在用excel或者簡單的在線系統報告來做“數據分析”。
真正的數據分析當然沒有那么簡單,不過分析數據的第一步是要知道手中到底掌握什么數據,在分析之前就要組織好。簡單的在線系統報告顯然已經過時了,拜托,現在可是在數據爆炸的時代。
要跟上競爭的步伐,了解數據的實時趨勢,使用當前的數據來預測和影響 <https://www.intel.com/content/www/us/en/analytics/you-dont-need-analytics-myth-video.html>明天會發生的事情,這一點很重要。運用先進的機器學習和其他人工智能技術,可以更快速地理解更多類型和更大量的數據。例如,人工智能技術可以幫助企業在業務流程中自動處理來自文本和圖像的信息,這有助于更高效的決策。隨著這些數據分析方式變得更加主流,那些不接受它們的人就肯定out啦。
3,“我們有很多數據,但分析不起作用。”
真相:分析數據當然是有用的,但是分析的必須是有效的數據。
在一個高級數據分析的項目中,經常會遇到這樣的抱怨“費功夫分析了這么大量的數據,最后得出的怎么還是錯誤的結果?
這與數據的質量有關。企業在分析數據之前需要有效的方式來收集數據,并進行去重和實時更新。AI(人工智能)和ML(機器學習)算法只能處理給定的數據,所以低質量的數據意味著低質量的結果。所以正確的使用數據管理策略,才會獲得真知灼見。
4,“要做數據分析,我們需要聘請一批數據科學家!”
真相:遠在天邊,近在眼前。
其實不是每個公司都需要一個常駐博士或者數據科學家。了解業務需求和掌握有效數據對決策者才是至關重要的。填補一個數據科學家的職位可能會非常棘手,特別是有特定產品或對專業知識要求極高的行業,并不一定有非常匹配的數據科學家可以有效地發揮作用。所以說借助一些數據分析工具或者開展一些專業培訓,在企業內部可能已經培養出了所需的專家。
另一種方法是讓運營業務人員直接運用數據分析工具。借助基于云的服務可以清理和處理企業的數據,并提供出展示洞察的算法,這可以使得企業的業務專家轉變為數據專家。
5,“要去分析每一個數據”
真相:分析每一個數據是不可能的,也是不必要的。衡量什么是戰略才是至關重要的。
當企業開始收集和整合數據時往往會遇到一個很大的誘惑--使用它的一切。但是這種方法可能會變得笨重和昂貴,而且大量不相關的信息會對結果產生不利影響。不斷自省正在分析哪個數據集是非常重要的。如果正在分析的這一部分數據是沒有商業需求的,那大可以去分析更重要的數據。
這里要強調的就是數據分析要基于業務需求。企業正在部署什么?企業一旦知道了這一點就可以設定可衡量的目標,基于這個目標去開展數據分析工作。
6,“高級數據分析意味著企業需要雇用額外的IT人員。”
真相:現有團隊其實足以迎接挑戰。
對于一個企業來說,如果有自己的IT團隊,那么數據分析方面是有基礎的,也可能已經取得一些進展。數據分析最初的工作更多的是充分利用現有的數據。在有基礎且有數據分析能力的情況下,企業就有機會吸引才華橫溢的IT專家,他們會津津樂道地組織分析創新領先的機會。
還有一種方法就是盤點公司內部已有的數據分析能力,并與外部顧問(如行業分析師或供應商)合作,獲取他們的建議并開展相關培訓。如企業選擇內部開發算法,可以通過FaaS模型(Function as a Service,功能即服務,是一種無服務器計算,是IaaS演進的下一個階段,它將底層基礎架構從開發人員中分離出來,基本上虛擬化了運行和運營管理,無服務器架構允許開發者執行給定的任務,而不必擔心服務器、虛擬機或底層計算資源,可極大地減少操作開銷和周期。)將其提供給組織內的其他人,以最大限度地減少開發時間。
所以無論企業規模大小,都應該開展數據分析,數據分析也并不是遙不可及,企業要激發自有IT團隊的能力,充分釋放數據潛力,讓企業增強市場競爭力。