前一段介绍过利用Windows系统的Ubuntu子系统搭建数据科学平台,此番来介绍下除了jupyter之外的另外一个数据科学神器:RStudio Server。同时基于Ubuntu和RStudio Server搭建一个R语言的云平台,用于数据分析。
1 RStudio Server简介
RStudio Server 是 RStudio 公司打造的一款基于 Web 的开源编辑器。在实际的工程中,我们的服务器大多是基于Linux的,比如常见的 ubuntu、centos 等。这些操作系统有时并不提供图形化界面,这时候RStudio的服务器版本就派上用场了。启动RStudio Server后,进入在浏览器中进入某一个页面后就可以像桌面版一样使用RStudio编辑器。当R的代码在服务器上出现bug了,线上的hotfix是在所难免的,这时候就需要用到 RStudio Server。--百度百科。
事实上就是一个Web版的RStudio。
2 R语言云平台搭建
闲话少说,就来搭建平台吧。首先,这次我是在我自己的办公室的工作站上搭建,因此受到局域网限制,我主要是方便于使用办公室的工作站,某种意义上是个伪云平台。如果真的想搭建一个网络访问式的,必须购买服务器。阿里云等都是可以的。其次除了搭建平台外,由于平常主要在做一些空间分析类的处理,因此搭建完成后还会有一个小的样例代码就当是hello world。
事实上平时使用工作站时,通常就是利用笔记本和XShell连接,然后就开始像六指琴魔一样疯狂敲击键盘,尤其是vim之类的编辑器。
当然有些时候我们需要所见即所得的分析。因此搭建一个平台的需求就出来了。现在Xshell搭建平台。第一步是事实上是安装基础的R语言。这一步我们之前的博客已经介绍过了,不了解的同学可以看一下这篇博客。
接着就安装gdebi-core。在Xshell里输入如下代码。
sudo apt-get install gdebi-core
接着下载RStudio Server的deb文件。
wget https://download2.rstudio.org/rstudio-server-1.1.447-amd64.deb
下载完毕后,用gdebi安装并运行即可。
sudo gdebi rstudio-server-1.1.447-amd64.deb
可以输入命令查看后台RStudio Server运行情况。
ps -fel | grep rstudio-server
这里不建议用root账户来使用RStudio,类似之前搭建WSL里的数据科学环境,这里添加一个普通用户来使用。
sudo adduser rstudio
接着就需要输入密码,根据自己需求输入密码,这就是等等页面里需要输入的用户和密码。这一步结束之后,可以直接打开对应的IP地址加上8787,RStudio默认在8787端口运行。
登陆即可。
3 Hello World
当然需求展示一下一个栅格数据。基于raster包,R语言里的神包。因此需要先安装raster,而此包又依赖于rgdal,而rgdal则要求必须安装GDAL。GDAL版本也有要求,因此这一块配置也是个需要花费一些功夫的地方。当然GDAL本身就是一个很棒的开源GIS库。这里就列一下资源。关于GDAL安装配置等以后找个时间专门讲。
library(raster)
filerall <- raster("/home/Workspace/python/Xiamenair/data/pm25halfyear.tif")
spplot(filerall)
参考资料:
Configure Rstudio Server on Ubuntu 16.04
Urban Data Science — Ex 1: Tools
python GDAL 2.1 installation on Ubuntu 16.04
python GDAL 2.1 installation on Ubuntu 16.04