數據分析
2025-07-07 06:22:41
講師: 瀏覽次數:2935
課程描述INTRODUCTION
數據分析公開課
日程安排SCHEDULE
課程大綱Syllabus
數據分析公開課
課程大綱:
第一部分、數據分析
商業(yè)數據分析
數據挖掘Road Maps
R、python簡單介紹
數據探索
數據預處理
構建新的變量
異常值處理
數據可視化
數據分析應用流程
第二部分、分類方法
回歸分析
相關性
線性回歸與擬合
最小二乘法的幾何解釋
線性回歸中的變量選擇
回歸算法的評估與選擇
KNN 分類器
確定相鄰的樣本數據
分類規(guī)則
參數K的選擇
算法優(yōu)缺點
案例分析:如何選擇相似用戶?
邏輯回歸
邏輯回歸模型
分類算法的評估
案例分析:用戶借貸能力判定
決策樹
迭代分割
純度的計算
決策樹的使用效果
如何避免過擬合
剪枝與終止條件
案例分析:如何利用決策樹的提取出業(yè)務規(guī)則?
(補充)樹模型應用——隨機森林
案例分析:如何幫助業(yè)務方篩選出重要的業(yè)務變量?
第三部分、聚類算法
聚類問題介紹
兩條數據之間的距離
歐式距離
數值型數據處理與距離函數
類別型數據的距離計算
混合類型數據的距離計算
兩個類別之間的距離
*距離、最小聚類、中心距離
K-means
如何選擇參數K
層次聚類
案例分析:如何選擇相似用戶?
第四部分、異常檢測
異常值檢測
異常團體識別
案例分析:無監(jiān)督反欺詐方案應用
業(yè)務思考:如何構建一個反欺詐系統(tǒng)?
第五部分、時間序列預測
時間序列回歸模型
預測變量篩選
回歸預測
非線性回歸
相關、因果和預測
時間序列分解
時間序列成分
移動平均
經典時間序列分解
ST分解法
趨勢性、季節(jié)性判定
業(yè)務思考:如何對時間序列進行聚類?
分解法預測
時間序列類異常值檢測
業(yè)務思考:如何評估促銷活動效果?
ARIMA模型
平穩(wěn)性和差分
延遲算子
自回歸與移動平均
非季節(jié)性arima
參數估計與選擇
季節(jié)性arima
高級預測方法
復雜的季節(jié)性
向量自回歸
神經網絡
實際預測問題
周數據、天粒度數據以及小時數據預測
預測組合
長序列與短序列預測
訓練集與測試集
缺失值與異常值
案例分享:共享單車Daiy天粒度需求預測
數據分析公開課
轉載:http://www.caprane.cn/gkk_detail/229458.html
已開課時間Have start time
大數據課程內訓
- 數字技術與數字工具應用 王文琭
- 大數據應用現狀與未來發(fā)展重 胡國慶
- 醫(yī)療行業(yè)數字化營銷趨勢及實 王文琭
- 數字經濟時代銀行開展數字化 李勇
- 數字時代下的營銷趨勢 韓天成
- 《數據資源入表與數據治理》 鐘凱
- 《銀行數據驅動經營方法論與 宗錦(
- 《跨境電商全鏈路AI賦能轉 黃光偉
- 數智化領域新技術與典型應用 胡國慶
- 以需求為導向的大數據精準營 張世民
- 數字經濟與數據技術應用與變 王文琭
- 政府數字化轉型實務 焦波