中文在线中文a_麻豆乱码国产一区二区三区_精品人妻大屁股白浆无码_久久久国产一区二区三区_国内精品乱码卡一卡2卡三卡

億信華辰

連續(xù)3年穩(wěn)坐商務(wù)智能應(yīng)用榜首
與此同時,億信華辰在數(shù)據(jù)治理領(lǐng)域榮登五強(qiáng)
首頁行業(yè)資訊數(shù)據(jù)分析

數(shù)據(jù)挖掘技術(shù)具有哪些特點(diǎn)?

時間:2020-06-29來源:lk瀏覽數(shù):239

數(shù)據(jù)挖掘源自《從數(shù)據(jù)庫中發(fā)現(xiàn)知識》(縮寫為KDD)。它首次出現(xiàn)在1989年8月在底特律舉行的第十一屆國際聯(lián)合人工智能會議上。為了統(tǒng)一理解,F(xiàn)ayyad,Piatetsky-Shapiro和Smyth在權(quán)威文章集《知識發(fā)現(xiàn)與數(shù)據(jù)進(jìn)展》中給出了KDD和數(shù)據(jù)挖掘的最新定義。從中總結(jié)了1996年該領(lǐng)域的進(jìn)展,并予以區(qū)分:

KDD的定義是:KDD是從數(shù)據(jù)中識別有效,新穎,潛在有用且最終可以理解的模式的過程。

數(shù)據(jù)挖掘的定義是:數(shù)據(jù)挖掘是KDD中的一步,它使用特定算法在可接受的計算效率限制內(nèi)生成特定模式。

數(shù)據(jù)挖掘技術(shù)的特點(diǎn)

1.基于大量數(shù)據(jù):不是說無法挖掘小數(shù)據(jù)量。實際上,大多數(shù)數(shù)據(jù)挖掘算法都可以在較小的數(shù)據(jù)量上運(yùn)行并獲得結(jié)果。但是,一方面,過小的數(shù)據(jù)量可以通過手動分析來總結(jié),另一方面,小數(shù)據(jù)量通常不能反映現(xiàn)實世界的一般特征。

2.非平凡性:所謂非平凡的意思是指所挖掘的知識是不簡單的。一定不能與著名體育評論員所說的相似:“經(jīng)過我的計算,直到比賽結(jié)束我才發(fā)現(xiàn)了一個有趣的現(xiàn)象。本屆世界杯的進(jìn)球數(shù)和失球數(shù)都是相同的。非常巧合!”這種知識。這似乎沒有必要,但是許多不了解業(yè)務(wù)知識的數(shù)據(jù)挖掘新手經(jīng)常會犯此錯誤。

3.隱含性:數(shù)據(jù)挖掘是發(fā)現(xiàn)數(shù)據(jù)深處的知識,而不是直接出現(xiàn)在數(shù)據(jù)表面的信息。常用的BI工具(例如億信BI和豌豆BI)完全可以讓用戶找到此信息。

4.新奇性:挖掘的知識以前應(yīng)該是未知的,否則僅是為了驗證業(yè)務(wù)專家的經(jīng)驗。只有新知識才能幫助公司獲得進(jìn)一步的洞察力。

5.價值性:挖掘的結(jié)果必須為企業(yè)帶來直接或間接的利益。有人說數(shù)據(jù)挖掘只是“殺龍技術(shù)”。它看起來牛氣哄哄,但沒有用。這只是一個錯誤的想法。不可否認(rèn)的是,在某些數(shù)據(jù)挖掘項目中,由于缺乏明確的業(yè)務(wù)目標(biāo),或者由于數(shù)據(jù)質(zhì)量不足,或者由于人們抵制不斷變化的業(yè)務(wù)流程,又或者由于挖掘人員缺乏經(jīng)驗,都會導(dǎo)致結(jié)果不佳甚至根本沒有效果。但是,大量成功的案例也證明了數(shù)據(jù)挖掘確實可以成為提高效率的武器。

(部分內(nèi)容來源網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系刪除)
立即免費(fèi)申請產(chǎn)品試用 免費(fèi)試用
相關(guān)文章推薦
相關(guān)主題

人工
客服

立即掃碼
享受一對一服務(wù)
億信微信二維碼

預(yù)約
演示

您好,商務(wù)咨詢請聯(lián)系

400咨詢:4000011866
咨詢熱線:137-0121-6791