34数据转换

2024-03-30 21:34:39

------------恢复内容开始------------

(一)1.读取Excel文件

mtcars存在Excel文件，

library(xlsx)载入

cars32<-read.xlsx("mtcars.xlsx",sheetIndex=1,header=T)#Header=T第一行作为题目

2.判断数据框的类型

is.data.frame()

3.矩阵转化为数据框

as.data.frame(state.x77)

x<-as.data.frame(state.x77)

(二)

1.利用索引提取数据框内容

who<-read.csv("WHO.csv",header=T)

who1<-who[c(1:50),c(1:10)]

who2<-who[c(1,3,5,7),c(2,14,16,18)]

who3<-who[which$continent==7]

who4<-who[which(who$countryID>50&who$countryID<=1)]

2.随机取样

x<-1:100

sample(x,60,replace=T)#有放回的取样

排序：sort()

3.删除行

①负索引

mtcars[-1]

②赋值为-NULL

mtcars$mpg<--NULL

4.合并

cbind(x,y)合并列rbind(x,y)合并行，需要相同的列数

取重复部分：data4[duplicated(data4),]

取非重复部分：data4[!duplicated(data4),]

取非重复部分:uniqe(data4)

(三)

1.行和列的转置

mtcars<-t(mtcars)

2.翻转

rev(letters)

3.改变值

transform(women,height*2.54)

4.排序

sort(向量)

order(向量)显示对应向量所在的位置，即索引

（四）

1.求和和平均数

矩阵变数据框

worldphones<-as.data.frame(worldphones)

rs<-rowsums(worldphones)

cm<-colmeans(worldphones)

总和添加一列：total<-cbind(worldphones,total=rs)

添加最后一行：rbind(total,cm)

2.apply

apply(worldphone,MARGIN=1,FUN=sum)#MARGIN=1行，MARGIN=2列，FUN=调用其他函数

3.数据的中心化：x-mean(x)

数据的标准化(x-mean(x))/sd(x)

函数：scale(x,center=T,scale=T)

------------恢复内容结束------------

码农公寓

相关文章