SPSS Modeler用K-means(K-均值)聚类、CHAID、CART决策树分析31省市土地利用情况和G
全文链接:http://tecdat.cn/?p=32840
原文出处:拓端数据部落公众号
随着经济的快速发展和城市化进程的不断推进,土地资源的利用和管理成为了一项极为重要的任务。而对于全国各省市而言,如何合理利用土地资源,通过科学的方法进行规划和管理,是提高土地利用效率的关键。
(资料图片)
本文旨在应用SPSS Modeler,帮助客户采用K-means(K-均值)聚类、CHAID、CART决策树等方法,对31个省市的土地利用情况数据进行分析和建模,以期提供科学有效的土地利用规划和管理策略。
31省市土地利用情况数据
数据流
本文使用的数据来自于国家统计局发布的31省市土地利用情况数据,选取31个省市作为研究对象,并选取了包括草地、耕地、园地、林地、水域和建设用地等7种土地类型的利用情况数据。然后,使用SPSS Modeler进行数据清洗、聚类、决策树等步骤,最终得到模型结果。
K-means(K-均值)聚类
在对完整的数据集进行初步分析后,本文采用K-means聚类算法对数据集进行聚类分析。在聚类过程中,我们首先需要确定聚类的个数k。根据肘部法则和轮廓系数法则,我们得出最终选择k=5为较为合适的聚类数目。通过SPSS Modeler的K-means节点进行计算,得到了以下聚类概况、聚类类别和散点图结果。
聚类概况
聚类类别
通过分类结果我们不难看出,同类省份基本上是相邻省份,或是区域类型(沿海、内陆)相似的省份,对于同类省份,我们可以采取相似的管理制度,使同等级省份得到更好的发展,也可以利用政策方式让高等级省份带动低等级省份发展。
CHAID决策树
在进行完K-means聚类分析后,为了更好地了解各个类别的特征和关系,本文使用CHAID决策树算法对数据集GDP的影响因素进行进一步的分析。首先使用SPSS Modeler的CHAID节点进行计算,得到以下变量重要性和决策树结果。
变量重要性
在CHAID决策树算法中,我们使用卡方值(χ2)来表征每个变量的重要性。具体而言,卡方值越大,则该变量在分类中起到的作用越大。在本文的分析中,最具有代表性的变量是园地、农用地和交通用地比重。
决策树结果
通过CHAID决策树算法,我们得到了以下的决策树模型。其中每个叶子节点代表一类,而每个内部节点包含了一个决策规则,用于判断不同属性值的记录应该属于哪一个分支。在决策树中房地产用地比重、建设用地比重和城市扩张程度等变量对分类结果有较大的影响。
模型误差
为了检验CHAID决策树模型的性能,我们采用随机抽样的方法将数据集分为训练集和测试集,然后利用训练集来训练模型,并使用测试集来验证模型的预测精度。
CART决策树:
除了使用CHAID决策树算法外,本文还采用了CART决策树算法对数据进行建模。通过SPSS Modeler的C&RT节点进行计算,得到以下变量重要性和决策树结构。
变量重要性
在CART决策树算法中,我们使用基尼指数(Gini Index)来衡量每个变量的重要性。具体而言,基尼指数越小,则该变量在分类中起到的作用越大。在本文的分析中,最具有代表性的变量是交通、建筑和工矿用地面积。
决策树结构
通过CART决策树算法,我们得到了以下的决策树模型。在该模型中,每个内部节点代表一个判断规则,而每个叶子节点代表一个分类。最终的分类结果与CHAID决策树模型比较相似,也可提供对土地利用管理的一些启示。
模型误差结果:
同样采用随机抽样的方法将数据集分为训练集和测试集,使用训练集训练模型,并使用测试集验证模型预测的准确性。
结论:
最终我们得到了以下结果文件:
本文旨在应用SPSS Modeler,采用K-means(K-均值)聚类、CHAID、CART决策树等方法,对31个省市的土地利用情况数据进行分析和建模,并为科学有效的土地利用规划和管理策略提供参考。通过聚类和决策树分析,我们得出以下结论:
1.不同省市的土地利用存在显著差异,按主要利用类型可分为5类;
2.交通、建筑用地面积比重是主要影响土地利用的因素;
3.通过CHAID和CART决策树算法,我们可以较精确地对不同地区的土地利用进行分类,并提出相应的管理建议。
本文的研究结论对于全国土地资源的利用和管理具有一定的参考价值,其方法也可以在其他领域中得到应用和推广。
最受欢迎的见解
1.R语言k-Shape算法股票价格时间序列聚类
2.R语言基于温度对城市层次聚类、kmean聚类、主成分分析和Voronoi图
3.R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
4.r语言鸢尾花iris数据集的层次聚类
5.Python Monte Carlo K-Means聚类实战
6.用R进行网站评论文本挖掘聚类
7.R语言KMEANS均值聚类和层次聚类:亚洲国家地区生活幸福质量异同可视化
8.PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯模型和KMEANS聚类用户画像
9.R语言基于Keras的小数据集深度学习图像分类
关键词:
相关阅读
-
SPSS Modeler用K-means(K-均值)聚类...
全文链接:http: tecdat cn ?p=32840原文出处:拓端数据部落公众号随 -
中方在世贸组织提交贸易与环境政策相关提案
新华社日内瓦6月19日电(记者陈斌杰)世界贸易组织秘书处19日在日内瓦 -
分享com 超值分享汇
1、网站好像没有。2、新浪微博有好多分享的,,比较像你说的网站,,有 -
全球快播:创新型药物行业股票有哪些?...
创新型药物行业股票有哪些?(2023 6 22),以下是南方财富网为您整理的 -
全球短讯!黑括号怎么打手机 黑括号怎么打
1、按住shift键的同时。2、按键盘上方的数字键9和0。3、就能对应打出括 -
我的勇者游侠武器选择_热门看点
在游戏我的勇者中,不同的职业有些需要使用不一样的武器。在这里面的职 -
全球观速讯丨【世界说】美媒:每一次大...
中国日报网6月20日电 在刚刚过去的周末,美国再次经历“血腥假期”... -
鬼迷心窍简谱教唱视频_鬼迷心窍简谱
1、鬼迷心窍是李宗盛在1991年《凡人歌》专辑出版时里面的一首歌。本文 -
黄道周作《途中见怀诗》楷书全文,量才...
途中见怀诗黄道周 侧岸危途见白日,断帆吾道正中流。何能睨柱还双 -
环球视点!二婚最肉麻对联 二婚对联大...
春节大家伙都爱贴上新地对联,这是传统的文化传承,用以祝福来年的 -
鲜媚_关于鲜媚简述
小伙伴们,你们好,今天小夏来聊聊一篇关于鲜媚,关于鲜媚简述的文章, -
高新区枫杨办事处公园道社区举办 “颜...
中原网讯为树立辖区女性良好形象,提升女性对美的认知和追求。6月21日 -
计算机病毒有哪些危害a破坏计算机系统的...
1、攻击文件病毒文件攻击式主要:删除、改名、替换内容、丢失部程序代码 -
汛前黄河调水调沙启动 世界动态
本报北京6月21日电(记者王浩、朱佩娴)黄河主汛期临近,结合黄河中游 -
环球热议:NFT大盗竟大多是高中生:全拿...
只要是网络上的信息,都免不了遭受盗取,区块链NFT和虚拟货币也不例外 -
2023年食用菌概念龙头股名单(6/22) 世界要闻
2023年食用菌概念龙头股名单(6 22),食用菌概念龙头股有:雪榕生物300 -
世界新消息丨2023全球数字经济大会7月举...
大会将设置“1+6+6+N”活动框架,推出六大高峰论坛,配套六大特色活... -
6月21日新股上市:威士顿(301315)
6月21日新股上市:威士顿(301315),6月21日威士顿新股上市,公司发行 -
文明之火长燃不熄
“一方水土养一方人,这片土地将我们养育成了怎样的人?”带着这样... -
太平岁寿年丰终身寿险好不好?通过分析...
太平岁寿年丰终身寿险好不好?涵盖了基础的身故 全残保障,并且设置了