指从事务视点来了解项目方针和要求,接着把这些了解常识转化成数据发掘问题的界说和实现方针的开端规划。
指从数据搜集开端,然后接着是一系列活动,这些活动的意图是:了解数据,鉴别数据质量问题、发现对数据的真知灼见、或许探究出令人感兴趣的数据子集并形成对躲藏信息的假定。
指从开端原始数据构建终究建模数据的悉数活动。数据预备很可能被执行屡次而且不以任何既定的次序进行。包含为建模作业预备数据的挑选、转化、清洗、结构、整合及格式化等多种数据预处理作业。
指挑选和运用各种建模技能,并对其参数进行调优。一般地,相同数据发掘问题类型会有几种技能手段。某些技能关于数据方式有特别规则,这一般需求从头返回到数据预备阶段。
指在此阶段,需求从技能层面判别模型作用以及从事务层面判别模型在实践商业环境傍边的实用性。
指即将其发现的成果以及进程安排成为可读文本方式或将模型进行工程化封装满意事务体系运用需求。