随着计算方法和信息技术的不断发展,大量数据的产生和收集导致信息爆炸,而信息可以产生价值,因而需要我们对这些数据进行实时和深层次的分析。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。本课程将介绍这三方面技术背景,并通过一系列实验综合运用这些技术。学生只需要有基本的数据库知识,不需要掌握编程语言,通过课程学习引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,对较为成熟的技术和方法具有相应的分析应用能力。并为以后深入学习打下基础。
本课程内容共11周,分为两部分:概念和实践。概念4周,实践7周。具体内容如下:
第一部分,共4周:讲解课程涉及的基本概念,包括:导论、数据挖掘定义、数据挖掘分类、判断挖掘问题类型、基本数据挖掘技术、数据仓库原理、数据预处理。
第二部分,共7周 :其中5周讲解经典数据挖掘算法应用案例。算法包括:决策树、贝叶斯、聚类、关联规则、神经网络、逻辑回归、时间序列、序列聚类。另外2周讲解OLAP应用,涉及多维数据集的创建和维护方法,最后使用它进行多维数据分析。
本课程实验环境使用SQLServer Analysis Services。
通过该课程的学习,使学生对数据仓库、数据挖掘、多维分析的相关基础知识有一定的了解,并对较为成熟的技术和方法具有相应的应用分析能力。引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,并为以后深入学习相关理论及应用打下的基础。
第一周 第1章 导论&第2章 数据挖掘简介
1-1 商业智能
1-2 数据仓库
1-3 数据挖掘
2-1 数据挖掘是怎样工作的
2-2 数据挖掘还是数据查询
2-3 数据挖掘的功能
第一周 基本概念小测
第2周 第3章 数据挖掘的主要方法
3-1 决策树
3-2 关联规则
3-3 K-平均值算法
3-4 遗传学习
3-5 神经网络
第二周小测
第3周 第4章 数据仓库
4-1 数据仓库的定义
4-2 数据仓库的结构
4-3 数据仓库系统的设计
第4周 数据挖掘实战(1)
DM-1 基于SQLServer的数据分析环境
DM-2 决策树算法应用场景
DM-3 决策树算法应用示例
决策树算法应用上机实践
第5周 数据挖掘实战(2)
DM-4 贝叶斯算法应用场景与示例
DM-5 神经网络算法应用场景与示例
DM-6 逻辑回归算法应用场景与示例
第5周小测
第6周 数据挖掘实战(3)
DM-7 聚类算法应用场景与示例
DM-8 关联规则算法应用场景
DM-9 关联规则算法应用示例
第7周 数据挖掘实战(4)
DM-10 顺序分析和聚类分析算法应用场景
DM-11 顺序分析和聚类分析算法应用示例
第8周 数据挖掘实战(5)
DM-12 时序算法应用场景
DM-13 时序算法应用示例
第9周 OLAP实战(1)
OLAP-1 多维数据分析简介
OLAP-2 数据源视图和多维数据集的创建
OLAP-3 多维数据集的部署和浏览
OLAP-4修改度量值、属性和层次结构
第9周小测
第10周 OLAP实战(2)
OLAP-5 定义高级属性和维度属性
OLAP-6 定义计算、维度和度量值组之间的关系
OLAP-7定义钻取操作、透视、翻译
第11周 数据预处理
数据预处理的必要性
数据清洗
数据集成
数据转换等
数据预处理
掌握数据库的基本概念,掌握数据库中表的基本操作。
《数据仓库与数据挖掘应用教程》 李春葆等 清华大学出版社
《数据挖掘教程》 翁敬农 等译 清华大学出版社
《数据挖掘概念与技术》 Jiawei Han 机械工业出版社
《SQL Server数据挖掘与商业智能基础及案例实战》 谢邦昌 中国水利水电出版
Q : 课程需要编程基础吗?
A : 实验环境使用微软的分析服务平台,无需编程基础,即可实现数据挖掘和多维分析服务。
Q : 课程偏原理还是应用?
A : 偏应用,涉及原理的部分,都用通俗易懂的示例进行讲解。
Q : 课程适合哪些学生学习?
A : 想了解数据挖掘分析方法,又不想陷入高数和编程困境的相关学生,尤其适合作为商业智能或数据仓库与数据挖掘的入门课程或者作为数据分析类课程学习
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/notes/313716.html