Python信用評分模型及模型優(yōu)化實戰(zhàn)
2025-07-04 22:29:49
講師:傅一航 瀏覽次數(shù):2939
課程描述INTRODUCTION
日程安排SCHEDULE
課程大綱Syllabus
Python信用課程
【課程目標】
本課程專注于金融行業(yè)的數(shù)據(jù)建模,包括客戶行為預測模型、風控識別與風控預測模型、信用評分模型等,面向數(shù)據(jù)分析部等專門負責數(shù)據(jù)分析與建模的人士。
本課程的主要目的是,培養(yǎng)學員的大數(shù)據(jù)意識和大數(shù)據(jù)思維,掌握常用的數(shù)據(jù)分析方法和數(shù)據(jù)分析模型,并能夠用于對客戶行為作分析和預測,提升學員的數(shù)據(jù)分析綜合能力。
通過本課程的學習,達到如下目的:
1、 掌握數(shù)據(jù)分析和數(shù)據(jù)建模的基本過程和步驟
2、 掌握數(shù)據(jù)分析框架的搭建,及常用分析方法
3、 掌握業(yè)務的影響因素分析常用的方法
4、 掌握常用客戶行為預測模型,包括邏輯回歸、決策樹、神經(jīng)網(wǎng)絡等等
5、 掌握模型優(yōu)化的思路及措施,包括特征優(yōu)化、超參優(yōu)化、集成優(yōu)化等
6、 掌握金融行業(yè)信用評分卡模型,構建信用評分模型
本課程突出數(shù)據(jù)挖掘的實際應用,結合行業(yè)的典型應用特點,從實際問題入手,引出相關知識,進行大數(shù)據(jù)的收集與處理;探索數(shù)據(jù)之間的規(guī)律及關聯(lián)性,幫助學員掌握系統(tǒng)的數(shù)據(jù)預處理方法;介紹常用的模型,訓練模型,并優(yōu)化模型,以達到最優(yōu)分析結果。
【授課對象】
風險控制部、金融科技部、IT系統(tǒng)部、數(shù)據(jù)分析部等對數(shù)據(jù)建模有較高要求的相關領域人員。
【課程大綱】
第一部分: 數(shù)據(jù)分析基礎
目的:掌握數(shù)據(jù)分析基本步驟和過程,學會如何構造數(shù)據(jù)分析框架
1、 數(shù)據(jù)決策的三個關鍵環(huán)節(jié)
業(yè)務數(shù)據(jù)化:將業(yè)務問題轉化為數(shù)據(jù)問題
數(shù)據(jù)信息化:提取數(shù)據(jù)中的業(yè)務規(guī)律信息
信息策略化:基于規(guī)律形成業(yè)務應對策略
2、 數(shù)據(jù)分析的六步曲
步驟1:明確目的--理清思路
步驟2:數(shù)據(jù)收集—理清思路
步驟3:數(shù)據(jù)預處理—尋找答案
步驟4:數(shù)據(jù)分析--尋找答案
步驟5:數(shù)據(jù)展示--觀點表達
步驟6:報表撰寫--觀點表達
第二部分: 搭建業(yè)務分析框架
1、 數(shù)據(jù)分析思路來源于業(yè)務模型
2、 分析框架來源于業(yè)務模型
商業(yè)目標(粗粒度)
分析維度/關鍵步驟
業(yè)務問題(細粒度)
涉及數(shù)據(jù)/關鍵指標
案例:搭建精準營銷的分析框架(6R)
如何尋找目標客戶群
如何匹配合適的產(chǎn)品
如何確定推薦的*時機
如何判斷合理的價格
案例:搭建用戶購買行為分析框架(5W2H)
3、 信用評估需要采集的數(shù)據(jù)
身份信息、認證數(shù)據(jù)、
消費數(shù)據(jù)、行為數(shù)據(jù)、
社交數(shù)據(jù)、設備數(shù)據(jù)、
金融數(shù)據(jù)、
第三部分: 數(shù)據(jù)建模步驟
1、 預測建模六步法
2、 選擇模型
基于業(yè)務選擇恰當?shù)臄?shù)據(jù)模型
常見模型簡介
3、 特征工程
選擇對目標變量有顯著影響的屬性來建模
降維的兩種方式:特征選擇、因子合并
4、 訓練模型
采用合適的算法對模型進行訓練,尋找到最優(yōu)參數(shù)
常用模型原理
5、 評估模型
進行評估模型的質量,判斷模型是否可用
評估指標、評估方法
6、 優(yōu)化模型
如果評估結果不理想,則需要對模型進行優(yōu)化
7、 應用模型
如果評估結果滿足要求,則可應用模型于業(yè)務場景
第四部分: 銀行客戶信用卡模型
1、 信用評分卡模型簡介
2、 評分卡的關鍵問題
3、 信用評分卡建立過程
篩選重要屬性
數(shù)據(jù)集轉化
建立分類模型
計算屬性分值
確定審批閾值
4、 篩選重要屬性
屬性分段
基本概念:WOE、IV
屬性重要性評估
5、 數(shù)據(jù)集轉化
連續(xù)屬性最優(yōu)分段
計算屬性取值的WOE
6、 建立分類模型
訓練邏輯回歸模型
評估模型
得到字段系數(shù)
7、 計算屬性分值
計算補償與刻度值
計算各字段得分
生成評分卡
8、 確定審批閾值
畫K-S曲線
計算K-S值
獲取最優(yōu)閾值
案例:構建銀行小額貸款的用戶信用模型
9、 信用評分卡的優(yōu)化方向
改變屬性重要性評估方法
采用其他更精準的模型,如決策樹、神經(jīng)網(wǎng)絡、集成模型等
第五部分: 其他分類預測模型
問題:如何評估客戶購買產(chǎn)品的可能性?如何預測客戶的購買行為?如何提取某類客戶的典型特征?如何向客戶精準推薦產(chǎn)品或業(yè)務?
1、 分類模型概述及其應用場景
2、 常見分類預測模型
3、 邏輯回歸(LR)
邏輯回歸的適用場景
邏輯回歸的模型原理
邏輯回歸分類的幾何意義
邏輯回歸的種類:二項、多項
如何解讀邏輯回歸方程
邏輯回歸算法的實現(xiàn)及優(yōu)化
迭代樣本的隨機選擇
變化的學習率
邏輯回歸+正則項
求解算法與懲罰項的互斥有關系
帶分類自變量的邏輯回歸分析
多項邏輯回歸/多分類邏輯回歸
ovo, ovr
案例:用sklearn庫實現(xiàn)銀行貸款違約預測
案例:訂閱者用戶的典型特征(二元邏輯回歸)
案例:通信套餐的用戶畫像(多元邏輯回歸)
4、 分類決策樹(DT)
問題:如何預測客戶行為?如何識別潛在客戶?
風控:如何識別欠貸者的特征,以及預測欠貸概率?
客戶保有:如何識別流失客戶特征,以及預測客戶流失概率?
決策樹分類簡介
演練:識別銀行欠貨風險,提取欠貸者的特征
決策樹分類的幾何意義
決策樹算法(三個關鍵問題)
如何選擇*屬性來構建節(jié)點:熵/基尼系數(shù)、信息增益
如何分裂變量:多元/二元劃分、最優(yōu)切割點
修剪決策樹:剪枝原則、預剪枝與后剪枝
決策樹的解讀
決策樹的超參優(yōu)化
案例:商場用戶的典型特征提取
案例:客戶流失預警與客戶挽留
案例:識別拖欠銀行貨款者的特征,避免不良貨款
多分類決策樹
案例:識別不同理財客戶的典型特征,實現(xiàn)精準推薦
5、 人工神經(jīng)網(wǎng)絡(ANN)
神經(jīng)網(wǎng)絡的結構
神經(jīng)網(wǎng)絡基本原理
加法器,激活函數(shù)
神經(jīng)網(wǎng)絡分類的幾何意義
神經(jīng)網(wǎng)絡的結構
隱藏層數(shù)量
神經(jīng)元個數(shù)
神經(jīng)網(wǎng)絡實現(xiàn)算法
案例:評估銀行用戶拖欠貨款的概率
第六部分: 模型超參優(yōu)化
1、 模型優(yōu)化的三大方向
超參優(yōu)化
特征工程
集成優(yōu)化
2、 超參優(yōu)化的方法比較
交叉驗證類(RidgeCV/LassoCV/LogisticRegressionCV/…)
網(wǎng)格搜索GridSearchCV
隨機搜索RandomizedSearchCV
貝葉斯搜索BayesSearchCV
3、 超參調(diào)優(yōu)策略
第七部分: 特征工程優(yōu)化
1、 數(shù)據(jù)清洗技巧
異常數(shù)據(jù)的處理方式
缺失值的填充方式
不同填充方式對模型效果的影響
2、 降維的兩大方式:特征選擇和因子合并
3、 特征選擇的模式
基于變量本身的重要性篩選
Filter式(特征選擇與模型分離)
Wrapper式(利用模型結果進行特征選擇)
embedded式(模型自帶特征重要性評估)
確定特征選擇的變量個數(shù)
案例:客戶流失預測的特征選擇
4、 因子合并(將多數(shù)變量合并成少數(shù)幾個因子)
因子分析(FactorAnalysis):原理、適用場景、載荷矩陣
主成份分析PCA:原理、幾何含義、擴展KernelCA/ICA/…
案例:汽車油效預測
5、 變量變換
為何需要變量變換
因變量變換對模型質量的影響
特征標準化:作用、不同模型對標準化的要求、不同標準化對模型的影響
其它變換:正態(tài)化、正則化等
6、 變量派生:基于業(yè)務經(jīng)驗的派生、多項式派生
7、 特征工程的管道實現(xiàn)
管道類Pipeline
列轉換類ColumnTransformer
特征合并類FeatureUnion
第八部分: 集成算法優(yōu)化
1、 模型的優(yōu)化思路
2、 集成算法基本原理
單獨構建多個弱分類器
多個弱分類器組合投票,決定預測結果
3、 集成方法的種類:Bagging、Boosting、Stacking
4、 Bagging集成:隨機森林RF
數(shù)據(jù)/屬性重抽樣
決策依據(jù):少數(shù)服從多數(shù)
5、 Boosting集成:AdaBoost模型
基于誤分數(shù)據(jù)建模
樣本選擇權重更新公式
決策依據(jù):加權投票
6、 高級模型介紹與實現(xiàn)
GBDT梯度提升決策樹
XGBoost
LightGBM
結束:課程總結與問題答疑。
Python信用課程
轉載:http://www.caprane.cn/gkk_detail/317089.html
已開課時間Have start time
- 傅一航
[僅限會員]