请关注微信公众号:生态遥感笔记,获取更多干货!
1
提取用地扩张
第一期的时候提到,这个模块是提取两期土地利用变化间各类用地扩张的部分。并从增加部分中采样,采用随机森林算法逐一对各类土地利用扩张和驱动力的因素进行挖掘。获取各类用地的发展概率,及驱动因素对该时段各类用地扩张的贡献。使用的PLUS模型,一定要去看一下梁迅老师的论文并进行引用!
提取两期土地利用变化间各类用地扩张的部分:
我们使用的土地数据是上一期讲过的需要进行格式转化后的数据,就是有“_uc”后缀的那个。在PLUS模型中,选择PLUS-Extract Land Expansion
在其中输入两期土地利用数据,出现Finish才算运行结束!!!!:
2
发展概率及其贡献值
获取各类用地的发展概率及其贡献值:
利用提取的部分和影响因素一起采样,采用随机森林算法逐一对各类土地利用扩张和驱动力的因素进行挖掘。获取各类用地的发展概率,及驱动因素对该时段各类用地扩张的贡献。请一定要等Finish出来后再进行下一步操作!!
决策树的数目:经验定,所以默认20也行。为什么我这儿设置为50,因为梁迅老师的文章中设置的是50哈哈哈哈,我抄了一下。
采样率:采样越多当然你就越精确一些,但是就会很慢很慢。但实际上采样的话只要样本量足够,那其实影响不大。(那什么是足够呢??哈哈哈哈哈哈,经验经验设置)
Thread:决定了运行的速度!1是最慢的,一般的电脑可以开到16!所以可以设置大一些。
(1) 驱动因素是否应该归一化处理?
不需要,因为PLUS模型自动归一化。
(2) 发现自己的概率图层中有噪点怎么办?
首先检查自己的数据是否符合模型要求,主要原因就是个别驱动因子的坐标系不识别,把投影坐标换位WGS84的。当然最简单的解决办法就是Thread设置为1。
什么是噪点?就是有Nodata:
类似出现这种白色的小点。
(3) 这里就会出现老生常谈的问题,怎样的设置参数才能更加准确呢?
我们判断模拟精度的方式有很多,一般你最终土地利用模拟结果精度越高,说明这些参数也就越准确。但是这些都是经验参数,很难去一个个的调试。很多时候是有所取舍的,不同的参数组合之间,有的时候牺牲速度,有的时候牺牲一点精度。
3
结果展示
(1) 各驱动因素对各类用地的驱动力
结果保存在“Parameterfile”文件夹下,可以看到随机森林训练精度(accuracy_record_rf),不同驱动因素对用地的贡献(Contribution),以及采样数据(TrainData),在这几个文件中,土地利用类型从0开始。
现在我们来对结果进行解读一下。
首先是随机森林训练精度:
RMSE(均方根误差),OOB RMSE(袋外数据的均方根误差),对于误差而言,当然是其值越低表明模型效果越好,但是这个一般参考一下就行,没有绝对的标准。
其次是驱动因素对用地的贡献:
我们以人造地表而言进行分析:可见GDP、坡度和人口密度对于人造地表的影响较大。之后就可以顺着分析2010~2020年人造地表怎么变,GDP、坡度和人口密度怎么影响这个用地。不过社会经济的发展决定了对城镇用地的需求,作为高原城市的昆明地处云南最大的坝区上,因此GDP、坡度和人口密度对其影响很大。
解释影响因素一定是需要从实际出发,影响因素大小一定结合实际情况进行参考和解释。
以下是自己的一些反思(如果有错误麻烦大家批评指正,我也不是很专业):
衡量土地利用的影响因素的常见方法还有哪些?
二元Logistic回归方法(CLUE-S模型是基于这个回归方法)、将土地利用数据赋值后用地理探测器方法(比如将其算为土地利用强度)、将土地利用数据按比值(各网格中地类占比)计算后用各种回归方法等等等。各方法都有自己的优势和劣势,比如回归方法可以从整体看出是正相关和负相关关系;地理探测器方法又是比一般统计量有更强的势,更加确信,因为两个变量在二维空间分布一致比两个变量的一维曲线的一致要难得多;利用PLUS模型的方法则是更考虑土地利用类型转变过程中,不同驱动因素对其做的贡献。
此外,在讨论影响因素的同时,是否应该进一步考虑变量的空间滞后问题。一般而言土地利用和驱动因素往往不独立,而是存在空间依赖关系。在欧定华老师《景观生态安全格局规划理论、方法与应用》中则考虑了空间依赖关系。
(这一部分相关参考文献就非常非常非常多了,我这儿就随意给大家推荐几篇文章吧)
① PLUS模型探讨土地影响因素:
罗芳,潘安,陈忠升,王佑汉.四川省宜宾市耕地时空格局变化及驱动力分析[J/OL].水土保持通报:1-9
② 二元Logistic回归方法:
李琛,赵筱青.滇南开远市中心城镇土地利用演变及其影响因素[J].亚热带资源与环境学报,2021,16(03):53-62.
③ 地理探测器方法:
李丹,周嘉,战大庆.黑龙江省耕地时空变化及驱动因素分析[J].地理科学,2021,41(07):1266-1275.
④ 回归分析方法:
付建新,曹广超,郭文炯.1980—2018年祁连山南坡土地利用变化及其驱动力[J].应用生态学报,2020,31(08):2699-2709.
(2) 各类用地的发展概率
让我们回忆一下,为啥要计算各类用地发展概率?(请看看第一期的内容,可能是有些久远了哈哈
PLUS模型是CA模型,CA最核心的部分就是定义转换规则,即土地发展的总概率。一般来说,总概率最高的主导土地利用类型会被栅格单元优先分配,然后不同土地利用类型在数量的约束下,分配在其总概率高的空间位置上。在总概率(Overall probability)的基础上运用赌盘选择(Roulette selection)确定下一次迭代过程中土地利用状态。
PLUS的总概率=各类用地的发展概率(The growth probability for each land use type)×领域效应(neighborhood effects)×自适应惯性系数(self- adaptive driving coefficient)
所以确定了各类用地的发展概率:
(3) 其他的一些小问题:
比如模型出不来啊,出现错误啊之类的。检查数据,按照第二期所说的去查一查!