本专业以核算机科学技能与数理计算为根底,以大数据运用为中心,培育具有大数据收集、存储、处理、剖析、可视化、架构建立及运维技能;具有体系的数据思维和必定的数据科学研讨才能;具有运用软件设计和开发才能;结业后能从事大数据剖析、处理、开发与办理保护等作业,亦可从事大数据研讨、咨询、教育练习等作业的宽口径人才。
《大数据导论》:本门课程首要介绍了大数据开展进程、根本概念、首要影响、运用范畴、关键技能、核算形式和工业开展,并论述了云核算、物联网的概念及其与大数据之间的严密联系。经过该课程的学习,学生了解大数据架构的根本概念Hadoop分布式文件、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、流核算、图核算等等根本概念和常用技能,为后续学习奠定杰出根底。
《数据收集与预处理》:本门课程从实际问题动身,面临各式各样的数据,首先能经过必定的技能获取有研讨价值的数据;其次,对获取到的数据进行清洗和安排,包含ETL根本原理、 pandas 数据的读写、分组变形、缺失值异常值处理、时序数据处理、Kafka数据订阅与分发等等。经过该课程的学习,为后续的数据剖析、可视化等课程奠定杰出的根底。
《大数据技能原理与运用》:本课程要点学习 MapReduce 核算模型与Spark结构,分布式文件体系 HDFS,分布式并行核算等的根本原理, 怎么装置与布置 Hadoop与Spark,怎么进行MapReduce 开发等等。经过该课程的学习,把握分布式并行程序的根本架构和根本开发办法。
《数据可视化技能》:本课程介绍数据可视化的根底理论和概念,针对实际运用中遇到的不同类型的数据介绍相应的可视化办法,介绍可视化归纳运用及有用体系,对培育学生的信息处理才能、信息剖析与运用才能、信息表达才能具有重要的效果。经过本课程的教育,使学生把握数据可视化的一般原理和处理办法,能运用Echarts等数据可视化东西对数据进行可视化处理。
《数据发掘与机器学习》:该课程介绍关于数据发掘技能与机器学习的根本知识和技能。从技能、办法、事例和实践4个模块学习数据发掘技能。技能模块首要解说数据发掘的原理、进程、东西;办法模块首要解说相关规矩办法、回归办法、分类办法、聚类办法、猜测办法、确诊办法等6种数据发掘主体办法;事例模块再现来自银行、稳妥、医学、交通等范畴的经典事例;实践模块从运用实际上总结数据发掘中确认发掘、运用技能的艺术以及怎么平衡的艺术。要点培育数据发掘的办法和实战才能,有较强的体系性和有用性。
可从事大数据体系研制、大数据运用开发、大数据剖析等作业,详细可在政府机构、企事业单位、金融公司、医药制作、交通检测等部分从事大数据办理、运用、剖析与研讨等作业;也能够从事大数据研讨、咨询、教育练习作业;也考取本专业及核算机科学与技能、运用计算、智能科学与技能等专业的研讨生或出国深造等。
跟着年代的开展,被誉为“未来最具开展潜力的工作”的各类、各层次数据剖析人才需求出现很多缺口。本专业重视本专业理论及其相关的抢手学科理论的教育,高度重视实践教育以及对学生实践运用才能的培育,学生在大学学习期间能够经过数据收集、数据清洗、数据处理、数据剖析、数据可视化、大数据处理的根本练习、学习大数据体系建立与环境布置等运用性很强的课程;此外,还能够参与各种特征的课外科技活动,如全国大学生数学建模比赛、挑战杯等各种比赛,专业重视对学生归纳本质的培育,能够为大数据工业及相关范畴培育能从事大数据剖析、大数据运营办理与大数据环境布置等运用型人才。