在如今科技快速發展的時代,較之以往企業已經能夠以更快的速度和更低的成本來獲取和儲存大量的數據。有人甚至認為,科技很快就能讓itle="大數據" target="_blank">大數據分析變得“像使用Excel一樣容易”。在其他如潮水般涌起的革命性數據科學當中,最令人感到興奮的莫過于能夠實時掌握消費者和物聯網的動態,但是,這恐怕容易使得企業陷于另一種困境
日本信息通信技術(ICT)企業美國公司首席信息官尼爾·賈維斯(Neil Jarvis)表示:“企業已經知道他們能夠越來越容易地獲取和儲存大量自身業務和世界范圍內產生的數據。而所謂公司的麻煩是指,該如何正確利用這些數據 ——判斷出哪些才是相關的、有用的,哪些是需要過濾掉的。最重要的是,哪些才是有助于推動業務發展的。”
因此,思想轉變的第一步應是觀察數據的方式。如今數據不再是一種靜態的可支配資源,其意義不再像以往那樣局限于一種單一的目的,而是或許已經成為延伸至多種功能用途的數據處理了。作為 一種可再生資源,其價值的衡量不應是視其底線而定,而是應該將其視為一種不僅能帶來價值增長,而且能夠提供價值增長的機會的資產。數據作為商業的一種原材 料也和其他生產的原材料一樣,正是它能夠被應用于各種各樣的領域而使得其價值超越了作為原始產品本身。
以IBM近期對從美國本田汽車公司和太平洋電力公司收集而來的數據的應用為例,最初,太平洋煤氣電力公司收集數據是為了管理其服務的穩定性,而本田收集電動汽車的數據是為了提高經營效 率,但是,IBM則能夠將兩者建成數據集并整合成一個數據系統,通過這個系統,本田的車主能夠從中掌握何時何地需要為汽車充電的節奏,能源供應商則能夠對 電力負荷進行相應的調整。
云計算公司Replicon聯合創始人兼CEO Raj Narayanaswamy指出:
“今天,每一個行業和企業都面臨著將數據轉化為明確的成果的艱巨任務。數據的指數級增長意味著,每一個組織都極其有必要去建立合適的體系結構來使得數據 的利用達到最大化。獲得成功的關鍵是建立一個全面的數據產業價值鏈,包括數據發掘、集成和評估,而不是按照傳統的做法部署以應用程序為中心的模式。”
對于一個企業來說,理解數據集成的重要性是創造新的價值的前提。假若對數據的理解仍然維持在單一和特定用途的層面,那么在數據開發過程中容易出現缺乏靈 活性、信息不全面的情況,在利用數據開發未來機遇方面,組織或將會陷于被動的境地。而成功的例子的則要數亞馬遜和Salesforce了,這兩家公司借助 策略性的數據管理方式而在短期內獲得了規模式的增長。
數據應用的周期或許可以劃分為七個步驟:發現、獲取、加工、帥選、集成、分析和揭 露。其中每一個步驟都至關重要,每一個有效用的策略也許都是建立在由上述七個步驟組成的數據體系之上的。云計算公司LiasonTechnologies 的首席執行官Bob Renner對此作出了總結性分析:
“人們大部分的注意力(市場價值觀)都放在了分析和結果量化的最后階段——蘊 藏著商務決策的階段。這也確實是數據分析在歷經萬難之后最終的價值所在。但是,沒有了前面的準備步驟,我們也不可能一步登天地就能在最后一步獲得想要的結 果。事實上,在開始使用分析算法來對數據進行解讀之前,數據科學家都要花費大量的時間進行數據清理,以保證數據的質量。”
良好的數據科學離不開高質量的數據資料和管控數據質量的必要步驟,尤其是往往遭到忽視的數據集成。通常來說,有價值的大數據都是在這一個步驟里發現的。如果組織在一開始就以另一種心態(非如今固化的理念)來著手數據管理,他們就能夠在控制成本和效用上掌握主動權。
大數據需 要一個獨特的基礎,正如數據分析公司Green House Data的首席技術官科特妮·湯普森(Cortney Thompson)所言:“大數據可能意味著你需要大幅修正自家的IT基礎設施,傳統IT的配置并不能支持大數據。”據悉,有些公司會為了實現質的飛躍而 新任命一名數字業務總監。而一個優秀的數字業務經理需要知道如何確保將那些非結構化的數據轉化為可操作的信息材料。
那么,我們將如何可以從當前宣傳大于實用的狀況中獲得突破呢?首先,如前文所述,充分理解大數據應用完整的操作周期,做到不忽視任何一個步驟的重要性,然后從傳統的以應用為 中心的傳統思想中解放出來,建立靈活的、可持續利用的數據分析框架。“數據驅動的發現從根本上改變了我們工作和生活的方式,而那些掌握了大數據應用的人可 以說是掌握了一項和同齡人競爭的優勢。”
那些在大數據技術迸發時期就獲得了巨大利益價值的組織,他們不僅關注那些外界一直在炒作的功 能,而且對想要實現的營收、利潤以及其他業務成果都投入了認真的思考。盡管周圍對大數據的好處仍然描繪得多么天花亂墜,但不得不說,當前指導數據架構的理念體系其實已經過時了。如今大數據的情形已在近期發生了極大的改變。