大數(shù)據(jù)挖掘與分析培訓(xùn)綱要
大數(shù)據(jù)挖掘與分析培訓(xùn)
內(nèi)容概要:?
1.介紹SPSS Modeler數(shù)據(jù)挖掘軟件的功能和基本操作;
2.學(xué)習(xí)如何使用SPSS Modeler完成數(shù)據(jù)挖掘過程;
3.學(xué)習(xí)機(jī)器學(xué)習(xí)的常見技術(shù),例如神經(jīng)網(wǎng)絡(luò)、決策樹、聚類、關(guān)聯(lián)分析、回歸分析和社會網(wǎng)絡(luò)用戶情感分析等,并學(xué)習(xí)如何將它們應(yīng)用到業(yè)務(wù)數(shù)據(jù)。
4.結(jié)合實際案例以及上機(jī)操作講解
培訓(xùn)內(nèi)容:?
1.數(shù)據(jù)挖掘簡介
數(shù)據(jù)挖掘的概念
CRISP-DM方法論
SPSS Modeler 18簡介
2.數(shù)據(jù)理解
數(shù)據(jù)理解
缺失值定義
數(shù)據(jù)審核節(jié)點介紹
分布圖節(jié)點----初步理解字符型字段的分
直方圖/統(tǒng)計節(jié)點----初步理解數(shù)值型字段的分布
常用數(shù)據(jù)分析圖畫法
3.SPSS Modeler分類技術(shù)
決策樹技術(shù)
Logistics回歸
神經(jīng)網(wǎng)絡(luò)
貝葉斯分類器
4.SPSS Modeler細(xì)分技術(shù)
Kohonen網(wǎng)絡(luò)/兩步聚類/K-means
5.SPSS Modeler關(guān)聯(lián)分析技術(shù)
常見的回歸分析Carma/Apriori
序列節(jié)點
6.SPSS Modeler自動建模技術(shù)
自動聚類節(jié)點
自動分類節(jié)點
自動數(shù)值節(jié)點
7.SPSS Modeler其他技術(shù)
線性回歸
特征選擇
支持向量機(jī)(SVM)
主成分/因子分析
8.SPSS Modeler模型評估技術(shù)
評估圖
分析節(jié)點
案例1:銀行客戶數(shù)據(jù)分析?
以客戶信用記錄、消費(fèi)歷史記錄數(shù)據(jù)為基礎(chǔ),使用IBM SPSS Modeler,分析決定用戶信用等級的主要因素是什么?并給與解釋。信用額度和信用評分有何關(guān)系?給出欺詐的判斷模型。分析客戶人口屬性對銀行信貸和信用評分有無影響。分析逾期還款的客戶有什么特征?根據(jù)消費(fèi)歷史分析各類客戶的特征。
案例2:大眾點評網(wǎng)的用戶偏好分析
到大眾點評網(wǎng)抓取多家火鍋店的店名、位置、點評條數(shù)、人均消費(fèi)額、口味評分(均分)、環(huán)境評分(均分)、服務(wù)評分(均分)、點評的均分、有無團(tuán)購、有無送外賣、有無訂座等數(shù)據(jù)(還可以采集標(biāo)簽等數(shù)據(jù)),對火鍋店進(jìn)行分類、找出每類火鍋店的特征,并分析點評均分與其他變量之間的關(guān)系。為新開設(shè)火鍋店選址提供指導(dǎo);為用戶推薦火鍋店。
案例3:制造企業(yè)質(zhì)量數(shù)據(jù)挖掘?
本項目在中天耐熱導(dǎo)線工廠最近2年的質(zhì)量管理數(shù)據(jù)的基礎(chǔ)上,分析了這些數(shù)據(jù)存在的問題,進(jìn)行了大量的預(yù)處理,利用統(tǒng)計學(xué)、多維度分析、數(shù)據(jù)挖掘以及可視化等多種數(shù)據(jù)分析方法,以優(yōu)化耐熱導(dǎo)線的制造過程。
案例4:電商客戶情感分析?
通過抓取對典型電商客戶的評論,分析客戶對于某個商品多個維度的態(tài)度和情感傾向,以及客戶注重商品屬性所在,商品的賣點、不足以及同類商品競爭力對比。
大數(shù)據(jù)挖掘與分析培訓(xùn)