本资源只供给5页预览,悉数文档请下载后检查!喜爱就下载吧,查找运用更便利
《数据发掘教学纲要》由会员共享,可在线阅览,更多相关《数据发掘教学纲要(6页珍藏版)》请在人人文库网上查找。
1、数据发掘教学纲要1. 纲要文本一. 课程内容数据发掘是从数据会集辨认出有用的、新颖的、潜在有用的,以及终究可理解 的方式的非普通进程。常识发现将信息变为常识,从数据矿山中找到蕴藏的常识金 块,将为常识立异和常识经济的开展作出奉献。本课程全面而又体系地介绍了常识发现的办法和技能,反映了当时常识发现研讨的最新效果。二. 课外作业以教材中每章所附的习题为主三. 试验试验一 相关规矩算法(Apriori算法)内容:运用相关规矩算法,发掘相关常识。意图:了解相关规矩、频频集、置信度、支撑度的概念。试验二 分类算法(C4.5算法、ID3算法)内容:程序完结C4.5或ID3算法意图:了解信息痼的概念,把握算
2、法的根本规划结构。试验三聚类(K-means)内容:程序完结K-means算法。意图:了解间隔、类似度等概念,把握聚类算法的运用试验四神经网络分类(感知器算法)内容:运用MatLab完结多分类意图: 把握神经网络的根本原理,了解神经网络的运用试验五遗传算法的优化(SGA算法)内容:运用计遗传算法处理杂乱函数的最优解问题。意图:开始把握遗传算法的概念试验要求:以上试验,依据状况尽可能多的完结,至少挑选23个试验完结。四. 首要参考书史忠植著,常识发现清华大学出版社2002.1各个学术刊物上的最新论文。2. 纲要阐明一.课程的意图和使命面临日益巨大的数据资源,人们迫切需求强有力的东西
3、来“发掘”其间的有用 信息,数据发掘便是针对这一需求而开展起来的一门聚集计算学、机器学习、数据 库、人工智能等学科内容的新式的交叉学科,本课程深入探讨数据发掘原理,把信 息科学、核算科学和计算学对数据发掘的奉献交融在一起,培育核算机专业高年级本科学生具有开始的科研才能和发明才能。二. 本课程的要求经过本课程的学习,要求学生开始把握数据发掘的重要概念和使命、数据发掘 中的常用算法(决议计划树、相关规矩、典范推理、含糊聚类法、粗糙集、贝叶斯网络、 支撑向量机、隐马尔科夫模型、进化和遗传算法、 神经网络),以及数据发掘当时的研讨意向。三. 本课程与其它课程的联络本课程的是核算机专业的一门专业课程。学生在
4、学习本课程之前应当具有高等数学、线性代数、概率计算、程序规划言语、数据库原理等方面的预 备常识。四. 各章首要解说内容第1章序言1.1常识1.2常识发现1.3常识发现的使命1.4常识发现的办法1.5常识发现的目标1.5.1数据库1.6常识发现与立异第2章决议计划树2.1概括学习2.2决议计划树学习2.3 CLS学习算法2.4 ID3学习算法2.5决议计划树的改善算法2.6决议计划树的点评2.7简化决议计划树2.8接连型特点离散化2.9根据偏置改换的决议计划树学习算法BSDT2.10概括学习中的问题第3章相关规矩3.1相关规矩发掘概述3.2广义含糊相关规矩的发掘3.3发掘相关规矩的数组办法3.4恣意多表间相关规矩的并行
5、发掘3.5根据分布式体系的相关规矩发掘算法3.6词性标示规矩的发掘算法与运用第4章根据典范的推理4.1概述4.2进程模型4.3典范的表明4.4典范的索引4.5典范的检索4.6类似性联络4.7典范的复用4.8典范的保存4.9根据例示的学习4.10典范工程4.11典范约简算法第5章含糊聚类5.1概述5.2传递闭包法5.3 FCMBP聚类法5.4体系聚类法5.5 C均值聚类法5.6聚类有用性5.7聚类办法的比较第6章粗糙集6.1概述6.2常识的约简6.3决议计划逻辑6.4决议计划表的约简6.5粗糙集的扩展模型6.6粗糙集的试验体系6.7粗糙集的展望第7章贝叶斯网络7.1概述7.2贝叶斯概率根底7.3贝叶斯学
6、习理论7.4简略贝叶斯学习模型7.5贝叶斯网络的制作7.6贝叶斯潜在语义模型7.7半监督文本发掘算法第8章支撑向量机8.1计算学习问题8.2学习进程的一致性8.3结构危险最小概括原理8.4支撑向量机8.5核函数8.6根据分类超曲面的海量数据分类办法第9章隐马尔科夫模型9.1马尔科夫进程9.2隐马尔科夫模型9.3似然概率和前反向算法9.4学习算法9.5根据状况驻留时刻的分段概率模型第10章神经网络10.1概述10.2人工神经元及感知机模型10.3前向神经网络10.4径向基函数神经网络10.5反应神经网络10.6随机神经网络10.7自组织特征映射神经网络第11章进化和遗传算法11.1概述11.2基
7、本遗传算法11.3遗传算法的数学理论11.4遗传算法的根本完结技能11.5遗传算法的高档完结技能11.6并行遗传算法11.7遗传算法运用第12章常识发现渠道MSMiner12.1概述12.2数据仓库12.3 MSMiner的体系结构12.4元数据办理12.5数据仓库办理器12.6算法库办理12.7数据发掘使命规划12.8联络数据库常识发现查询言语KDSQI第13章Web常识发现13.1概述13.2 Web常识发现的使命13.3 Web常识发现办法13.4模型质量点评13.5文本剖析功用13.6文本特征的提取13.7根据文本发掘的汉语词性主动标示研讨13.8文本分类13.9文本聚类13.10文本
8、摘要13.11用户爱好发掘第14章生物信息常识发现14.1概述14.2基因的根本结构14.3生物信息数据库与查询14.4序列比对14.5核酸与蛋白质结构和功用的猜测剖析14.6基因组序列信息剖析14.7功用基因组相关信息剖析14.8 Internet资源和公共数据库五. 试验要求认真完结每个试验,并写出试验报告六. 学时分配表本课程纲要适用于核算机科学与技能专业,总学时为48学时第1章序言2学时第2章决议计划树4学时第3章相关规矩4学时第4章根据典范的推理4学时第5章含糊聚类4学时第6章粗糙集2学时第7章贝叶斯网络4学时第8章支撑向量机2学时第9章隐马尔科夫模型2学时第10章神经网络4学时第11章进化和遗传算法4学时第12章常识发现渠道 MSMiner2学时第13章Web常识发现2学时第14章生物信息常识发现2学时试验课6学时
2: 本站的文档不包括任何第三方供给的附件图纸等,假如需求附件,请联络上传者。文件的一切权益归上传用户一切。
3.本站RAR压缩包中若带图纸,网页内容里边会有图纸预览,若没有图纸预览就没有图纸。
5. 人人文库网仅供给信息存储空间,仅对用户上传内容的表现方式做维护处理,对用户上传共享的文档内容自身不做任何修正或修改,并不能对任何下载内容担任。
7. 本站不确保下载资源的准确性、安全性和完整性, 一起也不承当用户因运用这些下载资源对自己和他人形成任何方式的损伤或丢失。