如果你的網站擁有數以千萬計的活躍用戶,如果網站上擁有數以百計的產品服務,如果這些服務以多媒體的形式在多個網絡終端上運行,如果正在或者打算嘗試走向云計算和WEB2.0架構,那就恭喜你了,因為你已經不知不覺地成為大數據時代的先行者或受害者。
按照維基百科上的定義,所謂“大數據”(big data)在當今的互聯網業指的是這樣一種現象:一個網絡公司日常運營所生成和積累用戶網絡行為數據“增長如此之快,以至于難以使用現有的數據庫管理工具來駕馭,困難存在于數據的獲取,存儲,搜索,共享,分析和可視化等方面。”這些數據量是如此之大,已經不是以我們所熟知的多少G和多少T為單位來衡量,而是以P(1000個T),E(一百萬個T)或Z(10億個T)為計量單位,所以稱之為大數據。
大數據現象在物理學,生物學,環境生態學,自動控制等科學領域和軍事,通訊,金融等行業已經存在有些時日了,在互聯網業出現卻是近年來才逐漸引人注目的。這可以歸結為三個基本原因。第一,網絡用戶的高速增長和用戶平均網絡使用時間的不斷延長,這使得用戶網絡行為數據大增;第二,網絡服務從單一的文字形式走向圖片,語音和影像等多媒體形式,導致數據量大增;第三,網絡終端由過去的單一臺式機變為臺式機,平板電腦,書刊閱讀器,手機和電視等多終端,大大擴充了網絡服務的內容與范圍,大大提高了用戶對互聯網的依賴度,也就大大增加了數據量。
大數據的出現既為網絡業帶來了機遇也帶來了挑戰。從潛在的機會看,數據量的增加為網絡公司提供了精確把握用戶群體和個體網絡行為模式的基礎,如果能夠充分利用,就可以探索個人化,個性化,精確化和智能化地進行廣告推送和服務推廣服務,創立比現有廣告和產品推廣形式性價比高數倍甚至數十倍的全新商業模式。同時,網絡公司也可以通過對大數據的把握,尋找更多更好地增加用戶粘性,開發新產品和新服務,降低運營成本的方法和途徑。從現實的挑戰看,主要集中在以下三個方面。
首先,大數據挑戰著網絡公司的戰略決策能力。數據量的急劇增長不僅要求在帶寬和存儲設備等基礎設施方面要增加大量投入,而且使網絡公司處于進退兩難的境地。如果采取無所作為,固守原狀的鴕鳥政策,那就可能失去未來發展的機會,失去業內競爭的本錢,早晚會被產業淘汰或者居于下游;如果與時俱進,轉型適應大數據時代的到來,那就需要對公司的現有產品和運營體系進行全面的改造,例如網站架構的重建;產品的通用化,標準化,模塊化;商業模式的創新;等等。這對絕大多數網絡公司而言,既要維持現有業務,保持業績的穩定和增長,又要加大投入,迅速轉型,是個進退維谷的兩難處境。
其次,大數據挑戰著網絡公司的技術開發和數據處理能力。大數據的出現以及潛在的商業價值不僅要求網絡公司使用專門的數據庫技術和專用的數據存儲設備,而且更要求專門的數據分析方法和使用體系。目前業內流行的一般數據挖掘方法和通用商業數據庫無法滿足大數據時代的挑戰。而且,網絡公司需要大量高端專業人才,這不僅指一般的程序員和數據庫工程師,而且指天體物理學家,生態學家,數學和統計學家,社會網絡學家,社會行為心理學家,等等。對海量數據的分析不能僅僅局限在一般數據規律和模型的把握水平上,而且要有理論思維和全面把握的綜合深入能力。
第三,大數據挑戰著網絡公司的組織和運營能力。一般中小網絡公司都沒有專門的數據管理和分析專家,即使是大型網絡公司中,數據管理和分析部門也處于分散,被動,輔助的地位,是公司的龍尾而不是龍頭。大數據時代的數據分析基本單位是個人用戶,尋找的是個人的全面,完整,動態,實時的網絡行為模式以及在此基礎上歸納出來的群體行為模式,而不是過去那種基于單個產品,服務,頻道的碎片式靜態統計分析。所以,對大數據的整體把握是網絡公司產品開發,運營設置,商業模式的基礎和出發點,是龍頭而不是龍尾。這就需要對現有公司架構,組織體系,資源配置和權力結構進行重組,讓數據管理與分析部門處于公司整體的上游位置。重組成功的標志之一就是公司設立首席數據官(Chief Data Officer, CDO)的職位,與CEO, COO, CFO, CTO等一道組成公司核心決策層。
大數據是整個WEB2.0革命的重要組成部分,世界網絡業的領軍公司,例如GOOGLE,FACEBOOK,蘋果和亞馬遜已經處于先發的位置上。中國網絡業中哪家公司能急起直追,誰就是先行者,否則,只能扮演受害者的角色。
.