數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)中發(fā)現(xiàn)隱含的、有意義的知識(shí)。
1. 概念描述
概念描述就是對(duì)某類對(duì)象的內(nèi)涵進(jìn)行描述,并概括這類對(duì)象的有關(guān)特征。
l特征性描述:用于描述某類對(duì)象的共同特征。
l區(qū)別性描述:用于描述不同類對(duì)象之間的區(qū)別。電腦入門
2. 關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)中存在的一類重要的可發(fā)現(xiàn)的知識(shí),若兩個(gè)或多個(gè)變量之間存在著某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)分析的目的就是找出數(shù)據(jù)中隱藏的關(guān)聯(lián)網(wǎng)。
3. 分類和預(yù)測
l分類:就是依照所分析對(duì)象的屬性分門別類、加以定義、建立類組。關(guān)鍵是確定對(duì)數(shù)據(jù)按照什么標(biāo)準(zhǔn)或規(guī)則進(jìn)行分類。
l預(yù)測:利用歷史數(shù)據(jù)建立模型,再運(yùn)用最新數(shù)據(jù)作為輸入值,獲得未來變化的趨勢(shì)或評(píng)估給定樣本可能具有的屬性值或值的范圍。計(jì)算機(jī)基礎(chǔ)知識(shí)
4. 聚類分析
聚類分析又稱無指導(dǎo)學(xué)習(xí),其目的在于客觀地按被處理對(duì)象的特征分類,將有相同特征的對(duì)象歸為一類。
聚類不同與分類,分類規(guī)則需要預(yù)先定義類別和訓(xùn)練樣本,而聚類分析直接面向原數(shù)據(jù),沒有預(yù)先定義好的類別和訓(xùn)練樣本,所有記錄都根據(jù)彼此相似程度來加以歸類。計(jì)算機(jī)
5. 趨勢(shì)分析
又稱時(shí)間序列分析,它是從相當(dāng)長的時(shí)間的發(fā)展中發(fā)現(xiàn)規(guī)律和趨勢(shì)。趨勢(shì)分析和關(guān)聯(lián)分析相似,都是為了挖掘出數(shù)據(jù)之間的聯(lián)系,但趨勢(shì)分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前因后果關(guān)系。計(jì)算機(jī)
6. 孤立點(diǎn)分析
孤立點(diǎn)是指數(shù)據(jù)庫中包含的一些與數(shù)據(jù)的一般行為或模型不一致的數(shù)據(jù)。
大部分的數(shù)據(jù)挖掘方法將孤立點(diǎn)是為噪聲或異常丟棄,而對(duì)于某些應(yīng)用,如欺騙檢測,孤立點(diǎn)數(shù)據(jù)可能更有價(jià)值。
7. 偏差分析
偏差分析又稱比較分析,它是對(duì)差異和極端特例的描述,用于揭示事物偏離常規(guī)的異常現(xiàn)象。
偏差檢測的基本方法是:尋找觀測結(jié)果與參照值之間有意義的差別。