数据发掘是概括了机器学习、核算和数据库的一门现代核算机技能,旨在发现海量数据中的模型与形式,具有巨大的使用远景。在许多重要的范畴,数据发掘都发挥着活跃的效果。因而这门课程是核算机专业及相关专业的重要课程之一。
《数据发掘》课程是计科专业与软工专业的专业任选课程,经过本课程的学习使学生把握数据发掘的基本概念,了解数据发掘的界说和功用以及完成数据发掘的首要进程和详细完成办法,开始把握数据发掘的算法。使同学们在学习本课程后,能完成简略的数据发掘算法编程,了解完成数据发掘的详细操作。
教育意图:把握数据发掘的基本概念、了解数据发掘的构成与开展进程、了解数据发掘的数据目标、了解数据发掘所具有的功用。
教育意图:了解数据仓库的概念,了解数据仓库的多维数据模型,了解数据仓库的体系结构,把握数据立方体的有用核算。
教育意图:了解数据立方体核算的有用办法,了解数据立方体和OLAP技能的进一步开展,了解面向特点概括的办法。
教育意图:了解相关规矩的相关概念,把握频频项集发掘的办法,了解相关发掘的相关性剖析。
教育意图:把握分类和猜测的基本概念和问题,把握决策树分类的办法,了解根据规矩分类的办法,了解贝叶斯分类和后向传达分类办法,把握猜测的办法。
教育意图:把握聚类剖析的基本概念和数据类型,了解聚类办法中的典型区分办法:k均值和k中心点,并了解多种其他的聚类办法,了解离群点的检测办法。
因为该课程触及的技能都是现在比较抢手的技能,内容杂乱,难度较大,且具有很强的理论性和实践性,所以要学好本课程,有必要做到理论与实践紧密结合,才干到达较好的学习效果。要求学生多参看相关书本和材料,多上机试验,把握数据发掘的基本功用、首要算法及其完成进程。
成果鉴定办法:本课程的查核是平时成果和期终考试成果相结合,理论成果与试验成果相结合。详细份额为:上课出勤、作业占10%,试验占20%,期末考察成果占70%。
其中期未考试总分100分,根底题占50%,中等难度题占40%,较难题占10%。考试题型首要有:选择题、填空题、判断题、简答题、核算题、论述题、概括使用题等。
教材:《数据发掘:概念与技能》(原书第2版),Jiawei Han, Micheline Kamber著,范明,孟小峰译,机械工业出版社,2011年
[1]《数据仓库与数据发掘》安淑芝等编著,清华大学出版社,2005年8月