地理数据与数据仓库

在使用Google Earth的时候,感觉很神奇,因为这个服务让我们拥有了“千里眼”,可以洞察万物。Google Earth诞生之后,产生了很大的影响。从此,地图服务成为了互联网的基础服务之一。
在看BigTable的论文时,里面谈到Google Earth中的地图数据存储其中。Google Earth也算是典型的大数据应用了。
本身学习了GIS,后来工作涉及了数据仓库,就在想,如果想要实现Google Earth,大概的流程是怎样的呢?

数据源

Google Earth的数据来源有一些遥感卫星和高分辨率卫星。
遥感卫星有美国的Landsta,比如Landsta7,其覆盖周期为16天,不同的传感器分辨率有些差别,普遍在30m以上,会采集一些不可见光的遥测图像,红外波段等。中国也有类似的卫星,2015年11月27日发射了遥感卫星二十九号。
高分辨率卫星来自于DigitalGlobe,该公司旗下有QuickBird、WorldView等系列的卫星。WorldView4,其覆盖周期为3天,最高分辨率可以达到0.31m。中国在2016年08月10日发射了高分三号卫星。

收集

这些卫星,会将收集的遥测数据发送到地面站,由地面站传输到不同的地方。可以根据需要,从不同的公司或者机构获取数据。

ODS层

数据可以考虑存放在 hbase中,因为图片一般挺大的,hbase的value最大值能有多大,这个需要调整。

DM层

有了基础的数据之后,就可以做一些应用。比如,统计城市的扩张速度、农田的侵占情况等。


总结

有了地理数据之后,可以做的事情就比较多了。

比如,可以将全球史以Google Earth的形式展现,这样,对国内历史的认识会更加容易和深刻。

比如,在地理数据之上,附加各个城市的统计数据,这样就能直观展现不同城市的权力到底有多大。

上一篇:从DML角度看ADS和ORACLE的区别


下一篇:python subprocess使用