34数据转换

------------恢复内容开始------------

(一)1.读取Excel文件

mtcars存在Excel文件,

library(xlsx)载入

cars32<-read.xlsx("mtcars.xlsx",sheetIndex=1,header=T)#Header=T第一行作为题目

2.判断数据框的类型

is.data.frame()

3.矩阵转化为数据框

as.data.frame(state.x77)

x<-as.data.frame(state.x77)

(二)

1.利用索引提取数据框内容

who<-read.csv("WHO.csv",header=T)

who1<-who[c(1:50),c(1:10)]

who2<-who[c(1,3,5,7),c(2,14,16,18)]

who3<-who[which$continent==7]

who4<-who[which(who$countryID>50&who$countryID<=1)]

2.随机取样

x<-1:100

sample(x,60,replace=T)#有放回的取样

排序:sort()

3.删除行

①负索引

mtcars[-1]

②赋值为-NULL

mtcars$mpg<--NULL

4.合并

cbind(x,y)合并列rbind(x,y)合并行,需要相同的列数

取重复部分:data4[duplicated(data4),]

取非重复部分:data4[!duplicated(data4),]

取非重复部分:uniqe(data4)

(三)

1.行和列的转置

mtcars<-t(mtcars)

2.翻转

rev(letters)

3.改变值

transform(women,height*2.54)

4.排序

sort(向量)

order(向量)显示对应向量所在的位置,即索引

(四)

1.求和和平均数

矩阵变数据框

worldphones<-as.data.frame(worldphones)

rs<-rowsums(worldphones)

cm<-colmeans(worldphones)

总和添加一列:total<-cbind(worldphones,total=rs)

添加最后一行:rbind(total,cm)

2.apply

apply(worldphone,MARGIN=1,FUN=sum)#MARGIN=1行,MARGIN=2列,FUN=调用其他函数

3.数据的中心化:x-mean(x)

数据的标准化(x-mean(x))/sd(x)

函数:scale(x,center=T,scale=T)

 

 

 

 

 

------------恢复内容结束------------

上一篇:r语言中如何进行两组独立样本秩和检验


下一篇:纯干货分享: 如何在 React 框架中使用SpreadJS