大數(shù)據(jù)是什么意思?
2021-12-27 22:27:29高三網(wǎng)
大數(shù)據(jù)是巨量數(shù)據(jù)集合,指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
1什么是大數(shù)據(jù)
對于“大數(shù)據(jù)”(Big data)研究機構Gartner給出了這樣的定義。“大數(shù)據(jù)”是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產(chǎn)。
麥肯錫全球研究所給出的定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。
大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),那么這種產(chǎn)業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
從技術上看,大數(shù)據(jù)與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術。
2大數(shù)據(jù)學習一般都學什么
大數(shù)據(jù)技術的學習內容有很多,包括:
基礎階段:Linux、Docker、KVM、MySQL基礎、Oracle基礎、MongoDB、redis。
hadoop mapreduce hdfs yarn:hadoop:Hadoop 概念、版本、歷史,HDFS工作原理,YARN介紹及組件介紹。
大數(shù)據(jù)存儲階段:hbase、hive、sqoop。
大數(shù)據(jù)架構設計階段:Flume分布式、Zookeeper、Kafka。
大數(shù)據(jù)實時計算階段:Mahout、Spark、storm。
大數(shù)據(jù)數(shù)據(jù)采集階段:Python、Scala。
大數(shù)據(jù)商業(yè)實戰(zhàn)階段:實操企業(yè)大數(shù)據(jù)處理業(yè)務場景,分析需求、解決方案實施,綜合技術實戰(zhàn)應用。
相關推薦:
最新高考資訊、高考政策、考前準備、志愿填報、錄取分數(shù)線等
高考時間線的全部重要節(jié)點
盡在"高考網(wǎng)"微信公眾號