數(shù)據(jù)挖掘的主要任務(wù)
精選回答
相關(guān)剖析
兩個或兩個以上變量的取值之間存在某種規(guī)律性,,就稱為相關(guān),。數(shù)據(jù)相關(guān)是數(shù)據(jù)庫中存在的一類重要的、可被發(fā)現(xiàn)的常識,。相關(guān)分為簡略相關(guān),、時序相關(guān)和因果相關(guān)。相關(guān)剖析的目的是找出數(shù)據(jù)庫中隱藏的相關(guān)網(wǎng),。
聚類剖析
聚類是把數(shù)據(jù)依照類似性歸納成若干類別,,同一類中的數(shù)據(jù)互相類似,不同類中的數(shù)據(jù)相異,。聚類剖析能夠樹立宏觀的概念,,發(fā)現(xiàn)數(shù)據(jù)的散布形式,以及可能的數(shù)據(jù)特點(diǎn)之間的相互聯(lián)系,。
分類
分類便是找出一個類別的概念描繪,,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描繪,,并用這種描繪來結(jié)構(gòu)模型,,一般用規(guī)矩或決策樹形式表明。分類是使用訓(xùn)練數(shù)據(jù)集經(jīng)過必定的算法而求得分類規(guī)矩,。分類可被用于規(guī)矩描繪和猜測,。
猜測
猜測是使用歷史數(shù)據(jù)找出變化規(guī)律,樹立模型,,并由此模型對未來數(shù)據(jù)的種類及特征進(jìn)行猜測,。猜測關(guān)懷的是精度和不確定性,通常用猜測方差來衡量,。
時序形式
時序形式是指經(jīng)過時刻序列搜索出的重復(fù)發(fā)生概率較高的形式,。與回歸一樣,,它也是用己知的數(shù)據(jù)猜測未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時刻的不同,。
誤差剖析
在誤差中包括很多有用的常識,,數(shù)據(jù)庫中的數(shù)據(jù)存在很多異常情況,發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)存在的異常情況是非常重要的,。誤差查驗(yàn)的根本方法便是尋覓觀察結(jié)果與參照之間的不同,。
數(shù)據(jù)挖掘和數(shù)據(jù)分析的區(qū)別
數(shù)據(jù)分析更多采用統(tǒng)計學(xué)的知識,對源數(shù)據(jù)進(jìn)行描述性和探索性分析,,從結(jié)果中發(fā)現(xiàn)價值信息來評估和修正現(xiàn)狀,。數(shù)據(jù)挖掘不僅僅用到統(tǒng)計學(xué)的知識,還要用到機(jī)器學(xué)習(xí)的知識,,這里會涉及到模型的概念,。數(shù)據(jù)挖掘具有更深的層次,來發(fā)現(xiàn)未知的規(guī)律和價值,。
更多相關(guān)知識請點(diǎn)擊:
了解更多會計考試資訊,,可以點(diǎn)擊查看東奧cma頻道。
免費(fèi)試聽 全部>>
-
CMA
現(xiàn)金管理
2023《P2》基礎(chǔ)班
免費(fèi)
已有2711人學(xué)習(xí) -
CMA
債券
2023《P2》基礎(chǔ)班
免費(fèi)
已有2729人學(xué)習(xí) -
CMA
責(zé)任中心
2023《P1》基礎(chǔ)班
免費(fèi)
已有2581人學(xué)習(xí)