在知识传播途中，向涉及到的相关著作权人谨致谢意！
南师国家精品课程《地理信息系统》——主讲人：韦玉春老师

文章目录

1 空间统计描述
2 空间自相关分析

【描述性统计】有一个群体，用均值、方差、标准差、众数，这叫描述性统计
【推断性统计】有一个大的区域，在这区域里采了几个样，对这几个样本用描述性统计。然后用这个数据推断这个区域的数据。推断性统计基于概率论
【怎么往外推断呢？】数学分布（正态、二项分布），这个数服从什么分布，在某个概率下，这个分布是成立的–>进行向外推断

1 空间统计描述

1.1 描述性统计

【描述性统计】

对空间对象分布状况的统计
对具有空间坐标的属性的统计

【举例】有多少

长三角地区城市分布具有聚集性？
江苏省人均GDP是多少？

【基本统计量】
在这里插入图片描述

【正态分布】统计学中所有的东西，在大量的情况下，假设的都是正态分布
【规则！】如果你的数据不是正态分布，那么你的数据描述就要用另外一套指标
【举例】平均成绩是80分，你默认的假设是全班成绩是服从正态分布的–>如果全部成绩放在一起的分布不是正态的，那么这个平均成绩就是有偏差的，不合适的

1.2 探索性数据分析

【探索性数据分析】首先是寻找数据的模式和特点，再根据数据特点选择合适的模型。揭示数据中存在的模式
是空间推断性统计，探究“怎么分布的？”的问题
【解释】拿到数据后，要想清楚，你要做什么，你要怎么做，为什么而做？探索性数据分析：天天看数据，找数据的规律，找想法，找个研究方向

【探索性数据分析的重要性】Tukey认为，“在认识到你看来多好的测量了它以前，重要的是理解你能做什么”
【动手前的三个问题】

科学问题是怎么产生的：你拿到数据后要干嘛呢？解决的是什么问题？问题不一样，统计方法不一样。
如何引导产生新的调查设计方案：你这个调查方案是怎么产生的，调查方案怎么选择
如何继续进行分析：做完之后，将来怎么做呢？

【步骤】数据->数据的数学分布->概率论->推断

1.2.1 直方图

【直方图】

对样本数据按一定的分级方案（等间隔分级、标准差等）进行分级，统计记录落入各个级别中的个数或占总样本数的百分比，然后用条带图或柱状图表现出来。
直方图可以直观反映采样数据分布特征、总体规律，可以用来检验数据分布和寻找数据离群值

【特点】

适用于空间对象为点和面的属性数据
简单易用
缺乏空间信息

1.2.2 Q-Q图

【Q-Q图】用来辅助判断样本数据是否服从正态分布
【做法】做数据的四分位数（四分之一划分）：25%、50%、75%，即是Q-Q图
【解释】数据上怎么分布的？Q是quarter的首字母，表示四分位数图
【拓展】假如数据不是正态分布的

平均数：那么平均数去失去了作用
中位数：这时候，中位数就能更好的描述数据
四分位数：25%、50%（中位数）、75%

在这里插入图片描述

2 空间自相关分析

【空间自相关】空间中相近的样点具有某种相似性，相距较远的样点往往不相似
【作用】解释和寻找存在的空间聚集性或“焦点”
【举例】把小偷的点标在地图上，用空间自相关来分析，找哪里是贼窝
【举例】叶子的分布：没有风吹，距离越近，叶子是越厚的。风一吹，越远叶子越薄
在这里插入图片描述
【变异】越近空间越相似–>反过来说：越近空间变异越少，越远空间的变异越大