《Python数据挖掘算法与应用课程教学大纲.docx》由会员分享,可在线阅读,更多相关《Python数据挖掘算法与应用课程教学大纲.docx(10页珍藏版)》请在第壹文秘上搜索。
1、据挖掘_课程教学大纲系、部:XXXX系数据挖掘课程教学大纲课程名称:数据挖掘学分:4总学时:64理论学时:先修课程:数据库技术、高级程序设计、数据结构适用专业:计算机科学与技术、数据科学与达数据、数据工程、管理信息系统等专业。开课学期:第六学期。一、课程性质、定位和教学目标课程性质:创业创新教育课(专业核心课)。课程定位:本课程把培养数据挖掘概念及应用作为培养目标,比较系统、完整地讲述数据挖掘的基本原理、基本概念和基本技术,适当介绍当今数据挖掘的新技术和新应用,使学生掌握有关在大量信息中提取隐含在这些数据中的、人们事先未知的、且具有潜在价值的信息和知识的过程,提取出来的信息和知识能够指导人们的
2、生产和实践。了解数据挖掘技术是所有数据挖掘方法的集合,可以根据数据挖掘任务的类型,可以将数据挖掘技术简单分为有监督学习(例如,分类问题)和无监督学习(例如,聚类问题)两个类别;理解根据方法的特征,可以将数据挖掘技术简单分为统计学习(例如,回归估计)和机器学习(例如,神经网络)两类。最终掌握解决实际问题的设计思想,具备用数据挖掘的知识解决简单实际问题的思想和能力。教学目标:通过本课程的学习,了解与掌握数据挖掘技术发展的过程,数据挖掘的基本概念。了解数据仓库与数据挖掘的基本概念、基本原理和最新发展;熟悉数据仓库设计的基本方法与工具;熟悉数据挖掘的基本方法与工具;对数据挖掘的关联规则、分类方法、聚类
3、、分类方法有深入的了解,并能够在软件开发与系统设计的过程中熟悉这些方法加以应用。二、教学内容与要求第1章数据挖掘概述【教学目的与要求】理解和掌握数据挖掘的基本概念、数据挖掘的过程以及数据挖掘的功能;了解数据挖掘的应用和面临的问题;对数据挖掘能够解决的问题和解决问题的思路有清晰地认识。【教学内容】1.什么是数据挖掘;2 .数据挖掘的基本步骤及方法;3 .数据挖掘与统计学的关系;4 .数据挖掘与机器学习的关系;5 .数据挖掘十大经典算法;6 .数据挖掘的典型应用。【教学重点与难点】重点:数据挖掘与统计学、机器学习的关系,数据挖掘十大经典算法。难点:数据挖掘的典型应用。【教学手段】使用多媒体教室、投
4、影仪,使用幻灯片课件,边讲解边演示。【课后作业】习题1第2章Python数据分析基础【教学目的与要求】熟练掌握Python基本数据类型、字符串、组合数据类型、程序控制流程及用户定义函数的概念和应用。理解和掌握正则表达式及文件的读写操作。【教学内容】1 .Python程序概述;2 .Python常用的内置数据结构;3 .正则表达式;4 .文件操作。【教学重点与难点】重点:程序流程控制、内置数据结构。难点:正则表达式。【教学手段】使用多媒体教室、投影仪,使用幻灯片课件,边讲解边演示。【课后作业】习题2第3章PythOn数据挖掘中的常用模块【教学目的与要求】熟练掌握Python的NUmPy模块、Pa
5、ndaS模块的数据结构、对象的创建及相关运算。掌握Matplotlib图表绘制基础只是和简单的基本绘图函数的运用。掌握Scikit-Iearn的主要功能及自带的小数据集。了解股票数据简单分析的案例。【教学内容】1. NumPy模块;2. Pandas模块;3. Matplotlib图表绘制基础;4. Scikit-Iearn;5. 股票数据简单分析。【教学重点与难点】重点:NUmPy模块、PandaS模块、MatPlOtlib图表绘制基础。难点:Scikit-Iearn应用。【教学手段】使用多媒体教室、投影仪,使用幻灯片课件,边讲解边演示。【课后作业】习题3第4章数据的描述与可视化【教学目的与
6、要求】了解数据描述和可视化的意义,掌握数据对象与属性类型的确定,掌握属性与属性类型相关信息的度量,熟练掌握数据对象的重要属性的相似性度量。了解数据可视化的意义及相关技术,掌握文本词云图生成函数的应用。【教学内容】1 .数据的描述与可视化概念;2 .数据对象与属性类型;3 .属性与属性类型;4 .数据对象的相似性度量;5 .数据可视化。【教学重点与难点】重点:数据对象、属性与属性类型的关系及数据对象的相似性度量。难点:数据可视化。【教学手段】使用多媒体教室、投影仪,使用幻灯片课件,边讲解边演示。【课后作业】习题4第5章数据采集和预处理【教学目的与要求】了解大数据采集的方法及数据预处理的目的和意义
7、;掌握如何读取不同数据源的数据;如何对数据进行清清洗、标准化;掌握如何对不同数据源的数据进行合并;掌握如何对数据进行变换和离散化,使之适合建模的需要;掌握如何对数据进行归约,使得在归约后的数据集上挖掘更有效。【教学内容】1 .数据采集和预处理概述;2 .数据清洗;3 .数据集成;4 .数据标准化;5 .数据归约;6 .数据变换与数据离散化。【教学重点与难点】重点:数据集成和变换。难点:数据归约和离散化。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题5第6章分类模型【教学目的与要求】了解分类及预测的基本思想、概念和意义;掌握常用分类及预测的算法(或模型)
8、;了解分类及预测挖掘的研究动态。【教学内容】1 .分类模型的概念;2 .KNN分类模型;3 .RoCChiO分类器模型;4 .决策树模型;5 .贝叶斯分类模型;6 .支持向量机;7 .分类模型的评估与选择。【教学重点与难点】重点:KNN分类、决策树、贝叶斯分类模型、支持向量机及分类模型的评估与选择。难点:支持向量机及分类模型的评估与选择。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题6第7章聚类分析【教学目的与要求】了解如何计算由各种属性和不同的类型来表示的对象之间的相异度;了解几种聚类技术,如划分方法、层次方法,基于密度的方法,基于网络的方法和基于模
9、型的方法。【教学内容】1 .聚类分析中概述;2 .基于划分的聚类方法;3 .基于层次的聚类方法;4 .基于密度的聚类方法;5 .基于网格的聚类方法;6 .基于模型的聚类方法;7 .聚类评估。【教学重点与难点】重点:划分方法、层次方法、基于密度的方法。难点:基于模型的聚类方法和聚类评估。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题7第8章关联规则分析【教学目的与要求】了解关联规则的基本思想、概念和意义;了解关联规则挖掘的应用背景;掌握常用的关联规则算法Apriori算法和FP-Growth算法;了解关联规则分析如何通过数据挖掘软件的实现;了解其它方法的
10、内容及关联规则挖掘的研究动态。【教学内容】1. 关联规则相关概念;2. Apriori算法;3. FP-Growth算法;4. Eclat算法5. 关联规则典型应用场景。【教学重点与难点】重点:Apriori算法和FP-Growth算法。难点:由关联规则到相关分析。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题8第9章预测模型【教学目的与要求】了解预测模型的基本思想、概念和意义;掌握一元线性回归预测模型的应用;了解一些比较简单的趋势外推法预测模型,如指数曲线、修正指数曲线、Logistic曲线、Compertz曲线等。了解时间序列预测法常用预测模型,如
11、移动平均数法、趋势预测法、指数平滑法等。【教学内容】1 .预测方法的分类和一般步骤;2 .回归分析预测模型;3 .趋势外推法预测模型;4 .时间序列预测法模型。【教学重点与难点】重点:回归分析预测模型。难点:由趋势外推、时间序列预测法模型。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题9第10章深度学习简介【教学目的与要求】了解深度学习的概念概念和意义;了解人工智能、机器学习和深度学习的关系;了解感知机的原理;掌握前馈神经网络的原理及算法;了解反向传播算法、卷积神经网络、循环神经网络及生成对抗网络的概念。【教学内容】1 .深度学习概述;2 .感知机;3
12、 .前馈神经网络;4 .反向传播算法;5 .卷积神经网络;6 .循环神经网络;7 .生成对抗网络。【教学重点与难点】重点:感知机和前馈神经网络。难点:循环神经网络及生成对抗网络。【教学手段】使用多媒体教室、投影仪,使用自制的幻灯片课件,边讲解边演示。【课后作业】习题10三、学时分配课程内容学时分配小计讲课习题课讨论课实验其他第1章数据挖掘概述1.1-1.622第2章Python数据分析基础426第3章Python数据挖掘中的常用模块6410第4章数据的描述与可视化426第5章数据采集和预处理44第6章分类模型6410第7章聚类分析628第8章关联规则分析66第9章预测模型628第10章深度学习简介44合计481664四、考核方式与评分标准考试;平时(30%).期末(70%)。五、主要参考书目1 .刘金岭,马甲林.Python数据挖掘算法与应用,清华大学出版社,2024年3月。2 .魏伟一,张国治.Python数据挖掘与机器学习,清华大学出版社,2021年4月。3 .刘金岭,张gg.Python数据挖掘算法与应用实验及实训指导,清华大学出版社,欲出版。撰写人:审定人:撰写时间: