Python數據挖掘培訓課程介紹:
本課程介紹了數據挖掘的基本原理,從數據挖掘基礎知識開始,講解數據挖掘建模工具和使用Python語言進使用工具;學習數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用算法與原理。
Python數據分析培訓課程目標:
? 了解一個完整的數據分析過程,從數據采集到挖掘,清洗,分析和輸出的整個過程。。
? 學習Python數據分析方法和工具的使用
? 學習各種數據分析的算法和框架。
? 學習各種建模方式和工具的使用
? 基于案例學習客戶價值分析等數據挖掘應用場景
Python數據挖掘和分析培訓課程大綱:
|
模塊名稱
|
課程內容
|
|
Python基礎和數據科學基礎
|
1. Python語言和開發環境簡介
2. 數據科學概述
3. 數據分析流程和步驟
4. 數據獲取路徑
5. 法律法規
6. Python語言和數據科學
7. 理解基本的字符串函數
8. 選擇合適的數據結構
9. 通過列表推導式理解列表
10. 使用計數器,使用文件和網絡
11. 使用正則表達式實現模式匹配
12. globbing文件名與其他字符串
13. Pickling和Unpickling數據
14. 文本數據的處理
15. 數據庫數據的處理
16. 通用函數和各類聚合函數
|
|
Python數據分析基礎
|
1. 搭建Python開發平臺
2. 所要考慮的問題
3. 基礎平臺的搭建
4. Python使用入門
5. 運行方式
6. 基本命令
7. 數據結構
8. 庫的導入與添加
9. Python數據分析工具
10. Numpy
11. Scipy
12. Matplotlib
13. Pandas
14. StatsModels
15. Scikit-Learn
16. Keras
17. Gensim
|
|
數據探索
|
1. 數據質量分析
2. 缺失值分析
3. 異常值分析
4. 一致性分析
5. 數據特征分析
6. 分布分析
7. 對比分析
8. 統計量分析
9. 周期性分析
10. 貢獻度分析
11. 相關性分析
12. Python主要數據探索函數
13. 基本統計特征函數
14. 拓展統計特征函數
15. 統計作圖函數
|
|
數據預處理
|
1. 數據清洗60
2. 缺失值處理60
3. 異常值處理64
4. 數據集成64
5. 實體識別64
6. 冗余屬性識別65
7. 數據變換65
8. 簡單函數變換65
9. 規范化66
10. 連續屬性離散化68
11. 屬性構造70
12. 小波變換71
13. 數據規約74
14. 屬性規約74
15. 數值規約77
16. Python主要數據預處理函數80
|
|
數據挖掘建模
|
1. 分類與預測83
2. 實現過程83
3. 常用的分類與預測算法84
4. 回歸分析85
5. 決策樹89
6. 人工神經網絡95
7. 5.1.6 分類與預測算法評價100
8. 5.1.7 Python分類預測模型特點103
9. 5.2 聚類分析104
10. 5.2.1 常用聚類分析算法104
11. 5.2.2 K-Means聚類算法105
12. 5.2.3 聚類分析算法評價111
13. 5.2.4 Python主要聚類分析算法111
14. 5.3 關聯規則113
15. 5.3.1 常用關聯規則算法114
16. 5.3.2 Apriori算法114
17. 5.4 時序模式119
18. 5.4.1 時間序列算法120
19. 5.4.2 時間序列的預處理120
20. 5.4.3 平穩時間序列分析122
21. 5.4.4 非平穩時間序列分析124
22. 5.4.5 Python主要時序模式算法132
23. 5.5 離群點檢測134
24. 5.5.1 離群點檢測方法135
25. 5.5.2 基于模型的離群點檢測方法136
26. 5.5.3 基于聚類的離群點檢測方法138
|
|
數據挖掘實戰項目一—客戶價值分析
|
1. 背景與挖掘目標164
2. 7.2 分析方法與過程166
3. 7.2.1 數據抽取168
4. 7.2.2 數據探索分析168
5. 7.2.3 數據預處理169
6. 7.2.4 模型構建173
|
|
數據挖掘實戰項目二--電子商務網站用戶行為分析及服務推薦
|
1. 背景與挖掘目標238
2. 12.2 分析方法與過程240
3. 12.2.1 數據抽取242
4. 12.2.2 數據探索分析244
5. 12.2.3 數據預處理251
6. 12.2.4 模型構建256
|
|
協議分析
|
1. Web端協議分析
2. 網頁登錄POST分析
3. 隱藏表單分析
4. 加密數據分析
5. 驗證碼問題
6. IP代理
7. Cookie登錄
8. 傳統驗證碼識別
9. 人工打碼
10. 滑動驗證碼
11. PC客戶端抓包分析
12. HTTP Analyzer簡介
13. 蝦米音樂PC端API實戰分析
14. App抓包分析
15. Wireshark簡介
16. 酷我聽書App端API實戰分析
17. API爬蟲:爬取mp3資源信息
|
|
Scrapy爬蟲框架
|
1. Scrapy爬蟲架構
2. 安裝Scrapy
3. 創建cnblogs項目
4. 創建爬蟲模塊
5. 定義Item
6. 翻頁功能
7. 構建Item Pipeline
8. 內置數據存儲
9. 啟動爬蟲
10. 強化爬蟲
11. 調試方法
12. 異常
13. 控制運行狀態
14. Item Loader
15. Item與Item Loader
16. 輸入與輸出處理器
17. Item Loader Context
18. 請求與響應
19. 下載器中間件
20. Spider中間件
21. 擴展
22. 突破反爬蟲
|
|
增量式與分布式爬蟲
|
1. 去重方案
2. BloomFilter算法
3. BloomFilter原理
4. Python實現BloomFilter
5. Scrapy和BloomFilter
6. Redis基礎
7. Redis的安裝和配置
8. Redis數據類型與操作
9. Python和Redis
10. Python操作Redis
11. Scrapy集成Redis
12. MongoDB集群
|
|
PySpider爬蟲框架
|
1. PySpider與Scrapy
2. 選擇器
3. PyQuery的用法
4. 解析數據
5. Ajax和HTTP請求
6. Ajax爬取
7. HTTP請求實現
8. PySpider和PhantomJS
9. 使用PhantomJS
10. 運行JavaScript
11. 數據存儲
12. PySpider爬蟲架構
|
如果您想學習本課程,請
預約報名
如果沒找到合適的課程或有特殊培訓需求,請
訂制培訓
除培訓外,同時提供相關技術咨詢與技術支持服務,有需求請發需求表到郵箱soft@w908.cn,或致電4007991916
技術服務需求表點擊在線申請
服務特點:
海量專家資源,精準匹配相關行業,相關項目專家,針對實際需求,顧問式咨詢,互動式授課,案例教學,小班授課,實際項目演示,快捷高效,省時省力省錢。
專家力量:
中國科學院軟件研究所,計算研究所高級研究人員
oracle,微軟,vmware,MSC,Ansys,candence,Altium,達索等大型公司高級工程師,項目經理,技術支持專家
中科信軟培訓中心,資深專家或講師
大多名牌大學,碩士以上學歷,相關技術專業,理論素養豐富
多年實際項目經歷,大型項目實戰案例,熱情,樂于技術分享
針對客戶實際需求,案例教學,互動式溝通,學有所獲