隨著云時(shí)代的到來,大數(shù)據(jù)也越來越受到關(guān)注。那么什么是大數(shù)據(jù)?大數(shù)據(jù)通常用于描述公司創(chuàng)建的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),當(dāng)下載到關(guān)系數(shù)據(jù)庫(kù)進(jìn)行分析時(shí),這將花費(fèi)大量時(shí)間和金錢。大數(shù)據(jù)分析通常與云計(jì)算相關(guān)聯(lián),因?yàn)閷?duì)大數(shù)據(jù)集的實(shí)時(shí)分析需要MapReduce之類的框架才能將工作分配給數(shù)十臺(tái),數(shù)百臺(tái)甚至數(shù)千臺(tái)計(jì)算機(jī)。那么大數(shù)據(jù)與云計(jì)算應(yīng)用之間的關(guān)系是什么?在回答這個(gè)問題之前,首先讓我來看看究竟什么是大數(shù)據(jù)。
什么是大數(shù)據(jù)?
大數(shù)據(jù)顧名思義,大數(shù)據(jù)分析從字面意義上可以解釋為:對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析。
大數(shù)據(jù)可以概括為4個(gè)V, 數(shù)據(jù)量大(Volume)、速度快(Velocit)、類型多(Variety)、價(jià)值(Value)。
大量的數(shù)據(jù)本身并非就是大數(shù)據(jù):只有當(dāng)這些數(shù)據(jù)能夠按照一定的格式保存,并能有效的被查詢、進(jìn)行綜合分析后可以獲取某種新的相互關(guān)系,并從中得到更有用的信息時(shí),這樣的‘大量數(shù)據(jù)’才能被稱之為大數(shù)據(jù)。
能夠使人易于理解的大數(shù)據(jù)實(shí)際上都是經(jīng)由實(shí)驗(yàn)得到的,猶如亂麻般的大量過程、結(jié)果數(shù)據(jù)。過去,雖然已經(jīng)進(jìn)行了測(cè)試,但得到的這些所謂的源數(shù)據(jù)卻不能被有效的利用起來。此時(shí),非常簡(jiǎn)單的大數(shù)據(jù)應(yīng)用就能讓您節(jié)約時(shí)間、金錢和資源。
成熟的高通量和高內(nèi)涵分析方法,都會(huì)融入互聯(lián)網(wǎng)技術(shù)加以使用。加上和研究機(jī)構(gòu)、藥品生產(chǎn)企業(yè)以及小型實(shí)驗(yàn)室之間越來越多的合作都使得數(shù)據(jù)量大幅增加。不斷增長(zhǎng)的數(shù)據(jù)量不僅僅對(duì)實(shí)驗(yàn)室的IT系統(tǒng)提出了挑戰(zhàn),而且也給數(shù)據(jù)的處理分析,提供了更多的新可能性,以及與此有關(guān)的價(jià)值增值過程,這些都可以概括到大數(shù)據(jù)這一概念中去。
要把積累的大量數(shù)據(jù)到變成大數(shù)據(jù)還有很多工作要做。許多實(shí)驗(yàn)室數(shù)據(jù)和信息都被存儲(chǔ)在本地的數(shù)據(jù)庫(kù)中,更多的是記錄在紙張報(bào)告、記錄表中,被分散在一個(gè)個(gè)文件夾中,這都使得它們不能用于大數(shù)據(jù)分析。
大數(shù)據(jù)作為時(shí)下最火熱的IT行業(yè)的詞匯,隨之而來的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價(jià)值的利用逐漸成為行業(yè)人士爭(zhēng)相追捧的利潤(rùn)焦點(diǎn)。隨著大數(shù)據(jù)時(shí)代的來臨,大數(shù)據(jù)分析也應(yīng)運(yùn)而生。
云計(jì)算與大數(shù)據(jù)應(yīng)用關(guān)系是怎么樣的?
云計(jì)算更多的是引用底層的基礎(chǔ)設(shè)施—基礎(chǔ)云,使得云計(jì)算更接底層。
大數(shù)據(jù)一定是分布式框架,分布式一定是多臺(tái)機(jī)器去處理同一件事情,所以它的技術(shù)一定是有基礎(chǔ)設(shè)施的。云應(yīng)用主要集中在云存儲(chǔ)和大家使用的云盤。云計(jì)算提供 了三層的服務(wù):
第一層是IaaS網(wǎng)絡(luò)級(jí)服務(wù);
第二層是PaaS平臺(tái)級(jí)服務(wù);
第三層是SaaS軟件級(jí)服務(wù)。
一般來說,云要有底層的基礎(chǔ)設(shè)施,它與網(wǎng)絡(luò)是有一 定關(guān)系的,還與虛擬化及云存儲(chǔ)有關(guān)系,所云計(jì)算更偏向與IaaS層面。例如我們使用的云盤,它就是一個(gè)云存儲(chǔ),大家使用它的時(shí)候,直接通過一個(gè)Web端訪 問存儲(chǔ)文件系統(tǒng)或分布式存儲(chǔ)文件系統(tǒng)。但是,如果要在云盤上做秩序的話,會(huì)發(fā)展到PaaS層或更高的一層。
上述就是關(guān)于什么是大數(shù)據(jù),以及大數(shù)據(jù)與云計(jì)算應(yīng)用關(guān)系是怎么樣的全部?jī)?nèi)容,想了解更多關(guān)于大數(shù)據(jù)的信息,請(qǐng)繼續(xù)關(guān)注中培偉業(yè)。