大數(shù)據(jù)、數(shù)據(jù)分析和數(shù)據(jù)挖掘在處理數(shù)據(jù)的方式和目標(biāo)上存在明顯的區(qū)別。
1、大數(shù)據(jù)
大數(shù)據(jù)通常指的是在現(xiàn)有技術(shù)條件下無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合。它具有規(guī)模大、種類雜、快速化、價值密度低等特點,需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力。大數(shù)據(jù)的“大”是一個相對概念,沒有具體標(biāo)準(zhǔn),如果一定要給一個標(biāo)準(zhǔn),那么10-100TB通常稱為大數(shù)據(jù)的門檻。
2、數(shù)據(jù)分析
數(shù)據(jù)分析是一個大的概念,指通過數(shù)學(xué)與計算機科學(xué)相結(jié)合的方法對數(shù)據(jù)進行處理,以得出有意義的結(jié)論。數(shù)據(jù)分析可以包括數(shù)據(jù)統(tǒng)計、OLAP、數(shù)據(jù)挖掘等多種層次。
3、數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從海量數(shù)據(jù)中找到人們未知的、可能有用的、隱藏的規(guī)則,可以通過關(guān)聯(lián)分析、聚類分析、時序分析等各種算法發(fā)現(xiàn)一些無法通過觀察圖表得出的深層次原因。
總之,大數(shù)據(jù)是一個比較寬泛的概念,它涵蓋了很多不同的技術(shù)和方法,包括數(shù)據(jù)分析、數(shù)據(jù)挖掘等。而數(shù)據(jù)分析和數(shù)據(jù)挖掘則是處理和分析大數(shù)據(jù)的兩種重要手段,它們在處理數(shù)據(jù)的方式和目標(biāo)上有所不同。