R语言—数据的调整与处理

作为一名R语言新手,第一步是要学会对数据进行一个调整与处理。现介绍几种常见对数据框架处理的函数:

使用R语言自带的heightweight数据集:

library(gcookbook)
heightweight

R语言—数据的调整与处理

 可以看到五列代表每个人的身体信息,这个时候我们可以用str()来查看数据集的结构。

str(heightweight)

R语言—数据的调整与处理

这里面可以看到sex为factor因子变量;ageYear,heightIn,weightLb为数值型向量;ageMonth为整型向量;同时还会有character字符型向量。(在画图中,经常要将factor和character相互转化)

调整一:选择需要的变量列(使用函数select())

heightweight%>%select(sex,heightIn)

R语言—数据的调整与处理

调整二:对某一变量数据进行排序(arrange())

heightweight%>%arrange(heightIn)    #(数据heightIn从原始状态变为从小到大排序)
heightweight%>%arrange(desc(heightIn))  #(从大到小排序)

从小到大                                                               从大到小         

 R语言—数据的调整与处理                                        R语言—数据的调整与处理

可以几个变量一起调整

heightweight%>%arrange(desc(heightIn,heightLb)) 

 调整三:筛选掉某变量中的值(filter())

heightweight%>%filter(heightIn>60)  #(筛选出heightIn>60的值)

R语言—数据的调整与处理

 heightweight%>%filter(heightIn>60,weightLb>110) #(筛选出heightIn大于60,“且”weightLb大于110的值)

 调整四:添加变化的变量到原始数据中(mutate())

For example:计算weightLb与heightIn的比值,并且将比值数据添加为原始数据的第一列

heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(w_h,everything())

R语言—数据的调整与处理

如果你想把比值放在第四列

heightweight%>%mutate(w_h=weightLb/heightIn)%>%
+ select(sex,ageYear,ageMonth,w_h,everything())

 R语言—数据的调整与处理

数据基本调整函数就这些,关于数据转化,计算,请关注下一次内容。

如果这些内容对你有帮助,请点个赞啦!

上一篇:如何选出最适合的C++ STL容器


下一篇:携程笔试1-排列问题