《数据科学:R语言实现》——3.2 重命名数据变量

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.2节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.2 重命名数据变量

数据框允许用户根据行名和列名选取和过滤数据。由于并不是所有的数据集都包含行名和列名,因此我们需要使用内置的命名函数重命名数据集。

准备工作

在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。

实现步骤

执行下列步骤,重命名数据。

1.首先,从GitHub链接地址https://github.com/ywchiu/rcookbook/raw/master/chapter3/employees.csv 下载employees.csv:
《数据科学:R语言实现》——3.2 重命名数据变量

2.从GitHub链接地址https://github.com/ywchiu/rcookbook/raw/master/chapter3/salaries.csv 下载salaries.csv:
《数据科学:R语言实现》——3.2 重命名数据变量

3.然后,使用函数read.csv读取文件给R进程:
《数据科学:R语言实现》——3.2 重命名数据变量

4.使用函数names查看数据集的列名:
《数据科学:R语言实现》——3.2 重命名数据变量

5.接着,使用给定的名称向量重命名列:
《数据科学:R语言实现》——3.2 重命名数据变量

6.除了使用函数names,还可以使用函数colnames重命名列:
《数据科学:R语言实现》——3.2 重命名数据变量

7.除了改变列名,我们也可以使用函数rownames改变行名:
《数据科学:R语言实现》——3.2 重命名数据变量

运行原理

在本教程中,我们介绍了如何使用函数names重命名数据集。首先,使用函数download.file从GitHub下载salaries.csv和employees.csv,然后使用函数names查看两个数据集的列名。要修改这两个数据集的列名,只需要把字符向量指派给数据集的名称。我们也可以使用函数colnames修改列名。最后,我们可以使用函数rownames把数据集的行名修改为emp_no。

更多技能

为了避免使用colnames和rownames两个函数确定行名和列名,我们也可以使用函数dimnames在一次操作中同时修改行名和列名:
《数据科学:R语言实现》——3.2 重命名数据变量

在这组代码中,list的第一个输入向量代表行名,第二个输入向量代表列名。

上一篇:Spark源码分析 – Checkpoint


下一篇:《数据科学:R语言实现》——3.2 重命名数据变量