大數據價值與數據挖掘課程培訓大綱
課程簡介:
????????本次課程將介紹數據挖掘與大數據技術的基本理論和體系架構,通過大型數據挖掘和大數據處理項目案例闡述數據挖掘和大數據項目的實施過程和方法。通過實際應用案例講解數據清洗、數據預處理、數據挖掘算法等重要概念。詳細講解構建數據挖掘體系的核心方法和技術,并結合實際項目搭建數據挖掘環境。熟悉主流數據挖掘廠商及相關軟件產品的操作和使用。
課程特點:
???????? 1、 培訓過程中將以大型項目案例為背景,逐步講解整個數據挖掘的設計過程和實施方法
???????? 2、 課程將以深入淺出的案例讓學員輕松掌握數據挖掘相關概念和技術
???????? 3、 課程的重點是項目實施,將深入探討數據挖掘項目的實施問題,逐一解決項目實施過程中所遇到的問題和處理技巧
???????? 4、 結合動手實驗和小而精的例子,使學員充分理解數據挖掘架構設計和相關實施工具的使用
課程大綱:
專題一:數據挖掘基礎知識?
內容一:數據挖掘基本概念
1、 數據挖掘的來源
2、 數據挖掘的定義
3、 數據挖掘的應用領域
4、 數據挖掘的行業背景
內容二:BI的架構
1、BI體系介紹
2、數據倉庫介紹
3、ETL介紹
4、多維數據庫介紹
5、前端展現介紹
6、數據挖掘模型介紹
內容三、數據挖掘在行業中的應用
1、現代企業數據挖掘需求概述
2、電信行業案例分析
3、金融行業案例研究
4、銷售行業案例分析
5、BI系統數據更新與維護
介紹數據挖掘基本概念,BI體系架構, 數據挖掘工具介紹及其應用,針對電信等行業提供行業解決方案和案例分析。
專題二:數據挖掘架構設計與完整流程詳解?
內容一:九種數據挖掘算法
1、 九種挖掘算法應用的背景
2、 決策樹算法與模型設計
3、 聚類算法與模型設計
4、 關聯規則算法與模型設計
5、 貝葉斯算法與模型設計
6、 時間序列算法與模型設計
7、 其他挖掘算法與模型設計
內容二:常用挖掘模型詳解
1、決策樹算法詳解及工具實現
2、聚類算法詳解及工具實現
3、關聯規則算法詳解及工具實現
4、貝葉斯算法詳解及工具實現
5、時間序列算法詳解及工具實現
6、數據挖掘模型評估
內容三:數據挖掘的流程
1、數據清洗準備
2、數據預處理
3、選擇數據挖掘模型
4、數據挖掘模型訓練
5、更新算法模型
6、模型評估
7、部署與應用
內容四:DMX語言
1、DMX語法結構
2、使用DMX創建挖掘模型
3、使用DMX將挖掘結果導出
4、使用DMX進行挖掘模型參數設置
九種數據挖掘算法與模型詳解,數據挖掘的設計與實施流程,數據挖掘查詢語言的使用等,重點對決策樹算法、關聯規則算法、聚類算法等給出詳細設計和處理流程。
專題三:大數據處理優化部分?
內容一:大數據的特點
1、什么是大數據
2、大數據的特點
3、大數據在行業中的應用
內容二:大數據優化方法詳解
1、大數據分區處理
2、使用中間表和臨時表
3、分批次處理與并行計算
4、建立廣泛的索引
5、建立緩存機制
6、使用文本和二進制格式進行處理
7、定制強大的清洗規則和出錯處理機制
8、建立視圖或者物化視圖
9、其他優化方法總結
內容三:數據倉庫中大數據的處理方式
1、數據倉庫中的大數據特點
2、數據倉庫中的大數據的處理方式
3、分布式數據倉庫的特點及應用
內容四:大數據高級應用
1、大型項目中大數據的優化案例分析
2、使用大數據優化工具
3、數據倉庫中的大數據性能調優技巧
4、未來大數據的發展方向
大數據的概念、特點以及大數據的優化方法,數據倉庫項目中大數據的處理方式以及大數據的高級應用等,針對大型數據倉庫項目提供了完備的大數據優化解決方案。
專題四:數據挖掘與大數據項目案例分析?
內容一:中國電信數據挖掘項目
1、項目介紹
2、復雜多系統多數據源的特點
3、ODS的使用
4、整體項目架構設計
5、數據挖掘算法選取
6、數據挖掘模型設計
7、數據挖掘處理流程
8、數據抽取策略的制定
8、挖掘模型的更新技巧
內容二:Search Funnel數據挖掘項目
1、項目介紹
2、項目中的海量數據
3、數據挖掘算法
4、數據挖掘模型構建
5、數據的預處理技術
6、對挖掘模型進行訓練
7、展示數據挖掘模型結果
8、數據挖掘模型評估
內容三:MSN大數據處理項目
1、項目介紹
2、項目中的超海量數據
3、大數據處理所遇到的問題
4、使用并行處理和計算
5、大數據項目中的數據挖掘模型處理
6、項目中的報表展現
7、大數據處理思路總結
內容四:AdventureWorks整體項目案例
1、案例介紹
2、ETL流程詳解
3、OLAP流程詳解
4、前端報表流程詳解
5、數據挖掘流程詳解
總結
大型數據倉庫與數據挖掘項目設計和實施,重點對項目架構設計和數據完整處理流程做重點分析和詳細介紹,針對大型數據挖掘項目,提供了完備的解決方案,給出完整設計思路和數據處理技術應用。
- 上一個:大數據分析挖掘與互聯網和工業4.0
- 下一個:大數據討論課