Python數(shù)據(jù)分析與數(shù)據(jù)挖掘
2025-08-16 02:37:56
講師:張曉如 瀏覽次數(shù):25
課程描述INTRODUCTION



日程安排SCHEDULE
課程大綱Syllabus
一、 課程背景
互聯(lián)網(wǎng)的飛速發(fā)展伴隨著海量信息的產(chǎn)生,而海量信息的背后對應(yīng)的則是海量數(shù)據(jù)如何從這些海量數(shù)據(jù)中獲取有價(jià)值的信息來供人們學(xué)習(xí)和工作使用,這就不得不用到大數(shù)據(jù)挖掘和分析技術(shù)。數(shù)據(jù)分析作為大數(shù)據(jù)技術(shù)的核心一環(huán),其重要性不言而喻。
在數(shù)據(jù)分析領(lǐng)域,Python語言以其簡單易用,并提供了優(yōu)秀、好用的第三方庫和數(shù)據(jù)分析的完整框架而深受數(shù)據(jù)分析人員的青睞??梢哉f,Python 已經(jīng)當(dāng)仁不讓地成為了數(shù)據(jù)分析人員的一把“利器”。程序員想要進(jìn)入數(shù)據(jù)分析行業(yè),首先要掌握 Python 數(shù)據(jù)分析技術(shù),只有這樣才能在嚴(yán)峻的就業(yè)市場中具有較強(qiáng)的競爭力。
二、 課程收益
通過本課程學(xué)習(xí),達(dá)到如下目的:
² 了解Python使用場景,能夠搭建自己的編程開發(fā)環(huán)境。
² 掌握Python編程的基礎(chǔ)語法知識、精髓及編程思想。
² 掌握常用的第三方擴(kuò)展庫的使用,特別是文件夾處理、word excel ppt文件處理;
² 學(xué)會使用Python提升職場常見辦公場景的工作效率,如郵件自動化、網(wǎng)絡(luò)爬蟲。
² 了解Numpy庫多維數(shù)組的創(chuàng)建、切片和索引方法,以及數(shù)組的運(yùn)算和存取。
² 學(xué)會使用Pandas庫完成數(shù)據(jù)的導(dǎo)入導(dǎo)出、數(shù)據(jù)整理和數(shù)據(jù)多角度分析的方法。
² 學(xué)習(xí)正則表達(dá)式及如何爬取網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。
² 學(xué)會使用Matplotlib模塊繪制常用圖表和高大上圖表,以及如何與EXCEL聯(lián)動;
² 了解機(jī)器學(xué)習(xí)概念,會使用Sklearn模塊進(jìn)行線性回歸、邏輯回歸的分析方法。
能結(jié)合課程學(xué)習(xí)到的方法和工具對本職工作中遇到的場景進(jìn)行針對性分析。
三、 培訓(xùn)對象
本課程適用于職場從事數(shù)據(jù)分析或和數(shù)據(jù)分析工作相關(guān)的職場人士。
四、 授課講師
張曉如 老師(微軟OFFICE大師級認(rèn)證)
五、 授課時(shí)間
4天(6小時(shí)/天)。
六、 課程大綱
PartⅠ、數(shù)據(jù)分析理念
*了解數(shù)據(jù)分析的方法、工具和流程。
1、 什么是數(shù)據(jù)分析?
² 概念與目的
發(fā)現(xiàn)數(shù)據(jù)規(guī)律--找到可行方案--指導(dǎo)管理決策。
² 數(shù)據(jù)分析三階段
描述性分析,發(fā)生了何事
診斷性分析,為何發(fā)生
預(yù)測性分析,將發(fā)生何事
2、 數(shù)據(jù)分析方法
² 對比分析
² 同比分析
² 環(huán)比分析
² 回歸分析
² 聚類分析
² 時(shí)間序列分析
3、 數(shù)據(jù)分析的工具
² 常規(guī)工具VS高大上工具
4、 數(shù)據(jù)分析流程
1) 步驟1:明確目的
² 確定分析目的:要解決什么樣的業(yè)務(wù)問題
² 確定分析思路:分解業(yè)務(wù)問題,構(gòu)建分析框架
2) 步驟2:數(shù)據(jù)收集
² 明確收集數(shù)據(jù)范圍
² 確定收集來源
² 確定收集方法
3) 步驟3:數(shù)據(jù)預(yù)處理
² 數(shù)據(jù)質(zhì)量評估
² 數(shù)據(jù)清洗、數(shù)據(jù)處理和變量處理
4) 步驟4:數(shù)據(jù)分析
² 選擇合適的分析方法
² 構(gòu)建合適的分析模型
² 選擇合適的分析工具
5) 步驟5:數(shù)據(jù)展示
² 選擇恰當(dāng)?shù)膱D表
² 選擇合適的可視化工具
6) 步驟6:報(bào)表撰寫
² 選擇報(bào)告種類
² 完整的報(bào)告結(jié)構(gòu)
Part2、Python環(huán)境搭建
*搭建自己的Python編程開發(fā)環(huán)境。
1、 認(rèn)識Python與環(huán)境搭建
1) What--什么是Python
2) Anaconda如何下載、安裝與配置
3) IDLE VS Jupyter Notebook VS Spyder
2、 Python初體驗(yàn)--十秒鐘快速創(chuàng)建100個(gè)Excel工作薄并統(tǒng)一命名
1) Spyder界面介紹
2) Python文件的打開、編輯與保存
3) 案例:認(rèn)識一下Python代碼的整體構(gòu)成
3、 模塊的類別、安裝、導(dǎo)入
² 內(nèi)置模塊
² 第三方模塊
² 用PIP命令安裝、卸載、升級模塊
² Import語句導(dǎo)入模塊
² From語句導(dǎo)入模塊
實(shí)戰(zhàn):搭建并配置自己的Python運(yùn)行環(huán)境。
Part3、Python編程基礎(chǔ)
*掌握Python編程思想、編程語句、數(shù)據(jù)結(jié)構(gòu)。
1、 語法特點(diǎn)
² 縮進(jìn)
² 注釋
² PEP8編寫規(guī)范
2、 變量
² 變量的賦值
² 變量命名規(guī)則
3、 數(shù)據(jù)類型
² 數(shù)值型:整型與浮點(diǎn)型
² 字符型:字符型的定義
² 邏輯型:1和0,或TRUE和FALSE
² 數(shù)據(jù)類型的查詢:TYPE函數(shù)
² 數(shù)據(jù)類型的運(yùn)算:數(shù)值型/字符型/邏輯型如何運(yùn)算
² 數(shù)據(jù)類型的轉(zhuǎn)換:Str()函數(shù)、int()函數(shù)、float()函數(shù)
4、 數(shù)據(jù)結(jié)構(gòu)
² 列表(LIST):如何定義/訪問/增加/修改/刪除
² 字典(DICTIONARY):如何定義/訪問/增加/修改/刪除
² 元組:如何定義/訪問
² 集合:如何定義/訪問
5、 流程控制語句
² If語句--選擇結(jié)構(gòu)
² For語句--循環(huán)結(jié)構(gòu)
² While語句--循環(huán)結(jié)構(gòu)
² 循環(huán)結(jié)構(gòu)中的break語句和continue語句
² 控制語句的嵌套
6、 函數(shù)
² 常用內(nèi)置函數(shù):print()input()replace()/strip()/split()open()……
² 如何自定義函數(shù):def語句
7、 編程中的異常處理
練習(xí):基本Python編程語句實(shí)戰(zhàn)操作。
Part4、NumPy入門與實(shí)戰(zhàn)
*學(xué)習(xí)NumPy庫對多維數(shù)組的創(chuàng)建、切片和索引方法,以及數(shù)組的運(yùn)算和存取。
1、 ndarray多維數(shù)組
² 創(chuàng)建ndarray多維數(shù)組
² Ndarray的對象屬性、數(shù)據(jù)類型及變換
2、 數(shù)組的索引和切片
² 數(shù)組索引方法
² 數(shù)組切片方法
3、 數(shù)組的運(yùn)
² 數(shù)組和標(biāo)量間的運(yùn)算
² 數(shù)組的條件邏輯運(yùn)算
² 統(tǒng)計(jì)運(yùn)算
² 數(shù)組內(nèi)如何排序
Part5、數(shù)據(jù)預(yù)處理
*學(xué)習(xí)Pandas庫和xlwing庫對文件的讀寫操作、數(shù)據(jù)整理的方法。
1、 pandas數(shù)據(jù)結(jié)構(gòu)
² Series對象:如何定義/訪問/增加/修改/刪除
² DataFrame對象:如何定義/訪問/增加/修改/刪除
2、 讀、寫數(shù)據(jù)
² 讀、寫文本文件
² 讀、寫Excel文件
² 讀、寫數(shù)據(jù)庫數(shù)據(jù)
² 讀、寫網(wǎng)頁
3、 數(shù)據(jù)操作
² 數(shù)據(jù)的增、刪、改、查
² NaN數(shù)據(jù)處理
² 時(shí)間數(shù)據(jù)的處理
² 數(shù)據(jù)的抽取:字段拆分、記錄抽取、隨機(jī)抽樣
4、 數(shù)據(jù)的預(yù)處理
² 處理缺失值
² 去除重復(fù)數(shù)據(jù)
² 處理異常值
² 合并數(shù)據(jù):追加合并、匹配合并
² 數(shù)據(jù)標(biāo)準(zhǔn)化:0-1標(biāo)準(zhǔn)化
5、 數(shù)據(jù)的分組與聚合
² 數(shù)據(jù)分組
² 數(shù)據(jù)聚合
6、 使用xlwing庫批量處理工作薄/工作表/行/列(EXCEL)
² 批量新建、保存、關(guān)閉工作薄
² 批量打開一個(gè)文件夾下的所有工作薄
² 批量重命名一個(gè)工作薄中的工作表名稱
² 批量打印工作薄中的指定工作表/指定頁
² 按條件將EXCEL中的多個(gè)工作表合并為一個(gè)工作表
² 按條件將EXCEL中的一個(gè)工作表拆分為多個(gè)工作薄
案例實(shí)操:超市交易數(shù)據(jù)清洗、查看員工業(yè)績波動、分析員工業(yè)績。
Part6、Pandas模塊數(shù)據(jù)分析
*學(xué)習(xí)Pandas中常用的數(shù)據(jù)分析方法。
1、 基礎(chǔ)數(shù)據(jù)分析方法
² 批量升序/降序排序一個(gè)工作薄中的所有工作表
² 使用描述統(tǒng)計(jì)呈現(xiàn)數(shù)據(jù)的相關(guān)指標(biāo)(如平均值、極值、%分位值、峰度系數(shù)、偏度系數(shù)等)
2、 進(jìn)階數(shù)據(jù)分析方法
² 制作數(shù)據(jù)透視表進(jìn)行交叉分析
² 分組對比分析(定性分組與定量分組)
² 使用相關(guān)系數(shù)判斷數(shù)據(jù)的相關(guān)性
² 數(shù)據(jù)建?;貧w分析
3、 時(shí)間序列分析
² Datetime模塊的時(shí)間數(shù)據(jù)類型
² 如何把字符型轉(zhuǎn)為時(shí)間型數(shù)據(jù)
² 時(shí)間序列如何索引和切片數(shù)據(jù)
² 如何創(chuàng)建介于某時(shí)間區(qū)間的時(shí)間數(shù)據(jù)(天/月/固定天數(shù))
案例實(shí)操:超市交易數(shù)據(jù)清洗、查看員工業(yè)績波動、分析員工業(yè)績。
Part7、爬取網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析
*學(xué)習(xí)正則表達(dá)式及如何爬取網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行數(shù)據(jù)分析。
1、 認(rèn)識網(wǎng)頁結(jié)構(gòu)和網(wǎng)頁源代碼
² 查看源代碼
² 查看網(wǎng)頁結(jié)構(gòu)(區(qū)塊/列表/標(biāo)題/鏈接/元素)
2、 正則表達(dá)式
² 認(rèn)識普通字符和元字符
² 使用正則表達(dá)式提取數(shù)據(jù)
3、 Request模塊獲取網(wǎng)頁源代碼
4、 Selenium模塊獲取網(wǎng)頁源代碼
5、 Selenium模塊模擬鼠標(biāo)和鍵盤操作
6、 爬蟲實(shí)戰(zhàn):
² 爬取某網(wǎng)站圖書銷量排行榜數(shù)據(jù)并分析
² 爬取某網(wǎng)站關(guān)于某關(guān)鍵詞的實(shí)時(shí)新聞數(shù)據(jù)
² 爬取新聞熱點(diǎn)排行榜
Part8、Sklearn機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘
*了解機(jī)器學(xué)習(xí)概念,掌握線性回歸、邏輯回歸的分析方法。
1、 機(jī)器學(xué)習(xí)基本概念
2、 機(jī)器學(xué)習(xí)庫sklearn簡介.
² 擴(kuò)展庫sklearn常用模塊與對象.
² 選擇合適的模型和算法
3、 線性回歸算法的原理與應(yīng)用
² 線性回歸模型的原理.
² sklearn中線性回歸模型的簡單應(yīng)用+
² 嶺回歸的基本原理與sklearn實(shí)現(xiàn)
² 使用線性回歸模型預(yù)測兒童身高
4、 邏輯回歸算法的原理與應(yīng)用
² ..邏輯回歸算法的原理與應(yīng)用sklear實(shí)現(xiàn)
² 使用邏輯回歸算法預(yù)測.考試能否及格
5、 樸素貝葉斯算法的原理與應(yīng)用
² 基本概念..
² 樸素貝葉斯算法分類的原理與sklearn實(shí)現(xiàn)
² 使用樸素貝葉斯算法對中文郵件進(jìn)行分類...
6、 案例:
使用線性回歸分析對銷售收入進(jìn)行分析和預(yù)測
7、 案例:
使用Pandas、sklearn模塊對客戶價(jià)值進(jìn)行分析
七、 特別注意
學(xué)員自備電腦(建議一人一臺),老師講解示范后學(xué)員操作練習(xí);
本課程內(nèi)容及順序可能根據(jù)學(xué)員需求及難度而調(diào)整。
轉(zhuǎn)載:http://www.caprane.cn/gkk_detail/324506.html
已開課時(shí)間Have start time
- 張曉如
[僅限會員]
預(yù)約1小時(shí)微咨詢式培訓(xùn)
辦公軟件內(nèi)訓(xùn)
- WPS三劍客在企業(yè)管理中高 張曉如
- AI+辦公增效與場景應(yīng)用實(shí) 柯雨金
- 《AI助力Excel數(shù)據(jù)分 趙明哲
- DeepSeek+PPT— 劉燕彬
- 《AI 與PPT:3小時(shí)速 張毓嵐
- Python基礎(chǔ)應(yīng)用 張曉如
- 運(yùn)用DeepSeek與 A 張曉如
- Power BI在財(cái)務(wù)經(jīng)營 張曉如
- 當(dāng)業(yè)財(cái)融合遇上EXCEL— 張曉如
- DeepSeek賦能銀行: 柯雨金
- 從思維到制作|內(nèi)訓(xùn)師PPT 張曉如
- Python數(shù)據(jù)分析與數(shù)據(jù) 張曉如