本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.3节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
2.3 读取和写入CSV文件
在之前的教程中,我们从雅虎财经下载了标普500历史价格数据。现在我们可以读取数据,并加载到R进程中,以备后续查看和操作。在本教程中,我们会介绍如何使用R函数读取文件。
准备工作
在本教程中,你需要完成之前的教程,并把标普500历史价格文本文件下载到当前目录。
实现步骤
执行下列步骤,从CSV文件中读取文本数据。
1.首先,使用getwd确定当前目录,使用list.files查看文件的位置:
运行原理
通过之前教程的学习,你应该已经把雅虎财经数据下载到当前目录了。因为下载的数据以表的形式组织,你可以使用函数read.table来读取文件中的数据,并加载到R的数据框中。
由于下载的数据使用逗号分隔并包含列名,你可以在函数参数中设定header等于TRUE,“,”为分隔符。读取snp500.csv到stock_data数据框后,你可以选取数据的前6行,并使用函数head进一步查看。
与函数read.table类似,你也可以使用read.csv读取文本文件。read.table和read.csv的唯一不同是,read.csv使用逗号作为默认分隔符来读取文件,而read.table使用空格作为默认分隔符。你可以使用函数head查看加载的数据框。
更多技能
在刚才的介绍中,我们介绍了如何使用RCurl获取纽约市公开数据网站的Wi-Fi热点数据。由于下载的数据是字符向量,我们可以在函数参数中设定text等于字符向量rows,使用read.csv读取文件到R进程中: