数据发掘(Data Mining)便是从很多的、不完全的、有噪声的、含糊的、随机的实践使用数据中,提取隐含在其间的、人们事前不知道的、但又是潜在有用的信息和常识的进程。
数据发掘不仅仅是数据的安排或许出现,也不仅是数据剖析和计算建模,而是一个从了解事务需求、寻求处理方案到承受实践查验的完好进程。整体而言数据发掘分红六个阶段:商业了解(Business Understanding),数据了解(Data Understanding),数据预备(Data Preparation),建模(Modeling),点评(Evaluation)和发布(Deployment)。
我国已有10多个城市具有共30多条城市轨迹交通运营线路,运营路程到达近千公里,年客运总量达20多。一起,北京、上海等15个城市共有约50条,1154公里轨迹交通线个城市正在准备建造城市轨迹交通。估计至2015年前后,北京、上海、广州等22个城市将建造79条轨迹交通线亿元。由此能够看出国内城市轨迹交通建造出现反常“火爆”的局势。
开展城市轨迹交通关于处理大都市交通问题是很好的处理方案,在有用缓解城市交通的一起,也会对城市形态的开展也起到了活跃的引导效果。在现在局势下,开展城市轨迹交通还能够在短时间内拉动固定资产出资,促进经济平稳较快开展。但开展城市轨迹交通出资巨大,建造一公里的地铁线亿元人民币,因而被称为“天价工程”,其盈利模式也是世界性难题,因而对在哪些城市建造轨迹交通、建造的规划有多大等重大问题,一直没有公认的断定规范。一般以为城市轨迹交通建造只要与城市的开展和谐同步才干获得杰出的社会、经济效益,但怎么界定轨迹交通与城市开展的和谐程度需求有科学的点评办法,根据此种考虑,本文提出城市轨迹交通与城市开展和谐度的概念,对轨迹交通与城市和谐性进行定性剖析,为城市轨迹交通建造规划、建造机遇供给决议计划支撑。
轨迹交通和城市开展和谐性点评涉及到社会、人口、经济、城市归纳交通等各方面包含很多因子,按照科学性、客观性、可比性和动态性准则,一起考虑各方面要素和材料占有的或许选取目标。
表明城市轨迹交通网开展规划和开展水平的目标A1,包含两个子目标:轨迹交通网线,公里)和投入的运营车辆数量(X2,节);
表明城市轨迹交通体系运营情况的的目标A2,包含两个子目标:轨迹交通体系客运总量(X3,万人)和运营车辆行进总路程(X4,公里节);
表明城市轨迹交通体系运营管理情况的目标A3,包含两个子目标:轨迹交通体系赢利(X5,万元)和轨迹交通体系从业人数(X6,人次)
人口子体系的总量及结构(B1),包含3个目标:城市人口总量(Y1,万人),非农业人口总量(Y2,万人)和从业人口总量(Y3,万人);
经济子体系的总量及结构(B2),包含5个目标:国民出产总值(Y4,亿元),第一产业出产总量(Y5,亿元),第二产业出产总量(Y6,亿元),第三产业出产总量(Y7,亿元),城市财政收入(Y8,亿元);
城市居民生活情况(B3):包含5个目标:城市消费价格指数(Y9),城镇居民人均住所面积(Y10,平方米),城镇居民人均可支配收入(Y11,元),失业率(Y12,%),城市市政建造投入(Y13,亿元);
城市公共交通情况(B4):包含5个目标:城市交通投入(Y14,亿元),城市人均路途长度(Y15,公里/人),城市人均路途面积(Y16,平方公里/人),居民万人公交车具有量(17,辆/万人),公交客运总量(Y18,万人次)。
所选点评目标的各个目标数值来源于19962007 年的《我国城市计算年鉴》、《xx市计算年鉴》,因篇幅所限,在此纷歧一列出原始数据。
主成分剖析法 ( Principal Component Analysis) 简称PCA法是使用线性代数有关理论,将本来很多目标转化为少量几个相互独立,并由本来各单项目标的线性组合来表明的归纳目标。其杰出长处在于比较客观,提高了点评成果的可靠性和准确性。为了消除量纲不同所形成的影响,需进行规范化处理。
规范化处理后的数据进行主成分剖析,得到相关矩阵的特征根、各目标的贡献率、累计贡献率等。选取累计贡献率大于85%的前K个目标作为主成分,求得各主成分得分:
和谐是两个或两个以上体系之间的一种良性的开展联系。和谐度则是对其和谐情况好坏程度进行衡量的定量目标,可采用含糊数学中从属度概念对其进行描绘,从属度改变规则能够经过从属度函数来反映,树立和谐度函数:
实践值越接近于和谐值状况和谐度 越大,阐明体系的和谐开展程度越高。经过状况和谐度 能够对体系间和谐开展程度进行点评:
使用SPSS13.0软件分别对城市轨迹交通体系和城市开展进行主成分剖析。
电商职业在曩昔十年阅历了高速的开展,2013年“双十一”网购狂欢节这天,付出……