大數據概念及應用_奇酷大數據培訓
來源:
奇酷教育 發表于:
麥肯錫是最早提出大數據時代已經到來:各個行業和領域都已經被數據給滲透了,目前數據已成為非常重要的生產因素了。對于大數據的處理和
麥肯錫是最早提出
大數據時代已經到來:“各個行業和領域都已經被數據給滲透了,目前數據已成為非常重要的生產因素了。對于大數據的處理和挖掘將意味著新一波的生產率不斷增長和消費者盈余浪潮的到來。”
大數據概念最早是IBM定義的,將大數據的特征歸納為4個“V”(量Volume,多樣Variety,價值Value,速Velocity),或者說特點有四個層面:第一,數據體量巨大。大數據的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T);第二,數據類型繁多。比如,網絡日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業價值高。第四,處理速度快。最后這一點也是和傳統的數據挖掘技術有著本質的不同。
有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據并不在“大”,而在于“有用”。價值含量、挖掘成本比數量更為重要。
哪些傳統企業最需要大數據服務呢?拋磚引玉,先舉幾個例子:1)對大量消費者提供產品或服務的企業(精準營銷);2) 做小而美模式的中長尾企業(服務轉型);3) 面臨互聯網壓力之下必須轉型的傳統企業(生死存亡)。
對于企業的大數據,還有一種預測:隨著數據逐漸成為企業的一種資產,數據產業會向傳統企業的供應鏈模式發展,最終形成“數據供應鏈”。這里尤其有兩個明顯的現象:1) 外部數據的重要性日益超過內部數據。在互聯互通的互聯網時代,單一企業的內部數據與整個互聯網數據比較起來只是滄海一粟;2)能提供包括數據供應、數據整合與加工、數據應用等多環節服務的公司會有明顯的綜合競爭優勢。