大數(shù)據(jù)是什么
精選回答
大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取,、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)有五大特點,,即大量,、高速、多樣,、低價值密度,、真實性。它并沒有統(tǒng)計學的抽樣方法,,只是觀察和追蹤發(fā)生的事情,。大數(shù)據(jù)的用法傾向于預(yù)測分析、用戶行為分析或某些其他高級數(shù)據(jù)分析方法的使用,。
大數(shù)據(jù)的特征
1.數(shù)據(jù)量大(Volume):大數(shù)據(jù)的起始計量單位是PB(1024TB),、EB(1024PB,約100萬TB)或ZB(1024EB,,約10億TB),,未來甚至會達到Y(jié)B(1024ZB)或BB(1024YB),。
2.數(shù)據(jù)多樣性(Variety):大數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志,、音頻,、視頻、圖片,、地理位置等各種結(jié)構(gòu)化,、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指存儲在數(shù)據(jù)庫里,,可以用二維表結(jié)構(gòu)實現(xiàn)表達的數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)是指數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,,沒有預(yù)定義的數(shù)據(jù),,包括所有格式的辦公文檔、文本、圖片、報表、圖像,、音頻信息,、視頻信息等;半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全非結(jié)構(gòu)化數(shù)據(jù)之間的數(shù)據(jù),具有一定的結(jié)構(gòu)性,,例如員工簡歷,,有的簡歷只有教育情況,,有的簡歷包括教育、婚姻,、戶籍,、出入境等很多信息,。
3.價值密度低(Value):大數(shù)據(jù)價值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,,在連續(xù)不間斷的監(jiān)控中,,有用數(shù)據(jù)可能僅有一兩秒,。原始零散、復(fù)雜多樣,,甚至可能有數(shù)據(jù)噪聲和污染的數(shù)據(jù)需要經(jīng)歷價值“提純”才能得出信息,、獲取知識。
4.數(shù)據(jù)的產(chǎn)生和處理速度快(Velocity):大數(shù)據(jù)的智能化和實時性要求越來越高,,對處理速度也有極嚴格的要求,,一般要在秒級時間范圍內(nèi)給出分析結(jié)果,超出這個時間數(shù)據(jù)就可能失去價值,,即大數(shù)據(jù)的處理要符合“1秒定律”。
更多相關(guān)知識請點擊:
了解更多會計考試資訊,,可以點擊查看東奧cma頻道,。
免費試聽 全部>>
-
CMA
現(xiàn)金管理
2023《P2》基礎(chǔ)班
免費
已有2711人學習 -
CMA
債券
2023《P2》基礎(chǔ)班
免費
已有2729人學習 -
CMA
責任中心
2023《P1》基礎(chǔ)班
免費
已有2581人學習