------------恢复内容开始------------
(一)1.读取Excel文件
mtcars存在Excel文件,
library(xlsx)载入
cars32<-read.xlsx("mtcars.xlsx",sheetIndex=1,header=T)#Header=T第一行作为题目
2.判断数据框的类型
is.data.frame()
3.矩阵转化为数据框
as.data.frame(state.x77)
x<-as.data.frame(state.x77)
(二)
1.利用索引提取数据框内容
who<-read.csv("WHO.csv",header=T)
who1<-who[c(1:50),c(1:10)]
who2<-who[c(1,3,5,7),c(2,14,16,18)]
who3<-who[which$continent==7]
who4<-who[which(who$countryID>50&who$countryID<=1)]
2.随机取样
x<-1:100
sample(x,60,replace=T)#有放回的取样
排序:sort()
3.删除行
①负索引
mtcars[-1]
②赋值为-NULL
mtcars$mpg<--NULL
4.合并
cbind(x,y)合并列rbind(x,y)合并行,需要相同的列数
取重复部分:data4[duplicated(data4),]
取非重复部分:data4[!duplicated(data4),]
取非重复部分:uniqe(data4)
(三)
1.行和列的转置
mtcars<-t(mtcars)
2.翻转
rev(letters)
3.改变值
transform(women,height*2.54)
4.排序
sort(向量)
order(向量)显示对应向量所在的位置,即索引
(四)
1.求和和平均数
矩阵变数据框
worldphones<-as.data.frame(worldphones)
rs<-rowsums(worldphones)
cm<-colmeans(worldphones)
总和添加一列:total<-cbind(worldphones,total=rs)
添加最后一行:rbind(total,cm)
2.apply
apply(worldphone,MARGIN=1,FUN=sum)#MARGIN=1行,MARGIN=2列,FUN=调用其他函数
3.数据的中心化:x-mean(x)
数据的标准化(x-mean(x))/sd(x)
函数:scale(x,center=T,scale=T)
------------恢复内容结束------------