本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.2节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.2 重命名数据变量
数据框允许用户根据行名和列名选取和过滤数据。由于并不是所有的数据集都包含行名和列名,因此我们需要使用内置的命名函数重命名数据集。
准备工作
在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。
实现步骤
执行下列步骤,重命名数据。
1.首先,从GitHub链接地址https://github.com/ywchiu/rcookbook/raw/master/chapter3/employees.csv 下载employees.csv:
2.从GitHub链接地址https://github.com/ywchiu/rcookbook/raw/master/chapter3/salaries.csv 下载salaries.csv:
3.然后,使用函数read.csv读取文件给R进程:
4.使用函数names查看数据集的列名:
5.接着,使用给定的名称向量重命名列:
6.除了使用函数names,还可以使用函数colnames重命名列:
7.除了改变列名,我们也可以使用函数rownames改变行名:
运行原理
在本教程中,我们介绍了如何使用函数names重命名数据集。首先,使用函数download.file从GitHub下载salaries.csv和employees.csv,然后使用函数names查看两个数据集的列名。要修改这两个数据集的列名,只需要把字符向量指派给数据集的名称。我们也可以使用函数colnames修改列名。最后,我们可以使用函数rownames把数据集的行名修改为emp_no。
更多技能
为了避免使用colnames和rownames两个函数确定行名和列名,我们也可以使用函数dimnames在一次操作中同时修改行名和列名:
在这组代码中,list的第一个输入向量代表行名,第二个输入向量代表列名。