1.基础算术运算
1.1比较两数是否相等
res = log(640320**3+744, base=exp(1))/sqrt(163)
identical(res,pi)
1.2对数函数
log(x, base = exp(1))
log10(x)
log2(x)
2.内置数据结构
2.1Vecteur向量
初始化
c(1,2,3,4,5)
向量索引
vect[1:3]
返回布尔向量
choix <- vect > 0
notes[notes>10]
返回向量长度
length(vect)
les notes non fractionnaires整数的
利用floor()筛选整数元素
notes10[notes10 == floor(notes10)]
min()函数返回向量中的最小值
修改向量中元素的值
v[1] <- 1
v[1:4] <- 5
v[v == 1] <- 2
any()布尔向量,返回布尔向量中是否存在True
2.2Facteur 内置数据结构之二
factor(c)初始化facteur
给factor中的元素设置优先级
facteur(c(...), ordered = TRUE,levels = c(...))
levels(f)函数和nlevels(f)函数
返回f的集合元素,以及集合大小
统计factor对象某一元素出现的次数
length(factor[factor == 'A'])
2.3创建Tableau-individual data.frame
元素为数值型,则用vector表示,为quantitative,则用factor表示
data.frame(column1,column2,column3...)
3.CSV文件
setwd命令改变工作区
x <- read.csv("filename.data")
length(data.frame)返回data.frame的列数
nrow()
ncol()
names()返回列标签
data.frame[1:10,]
data.frame[c(1,3),c(4,5)]
如何索引data.frame对象最后一列元素?
data.frame[,ncol(data.frame)]
根据标签进行索引
X[1:10,'median']
X$median
X[X$median > 10,]
4.描述统计
mean()
sd()
var()
median()
max()
min()
summary()
分位点函数
quantile(data,0.25)
quantile(data,0.75)
quantile(X$median,0.75) - quantile(X$median,0.25)
IQR(X$median)
计算截断均值moyenne tronquée d'ordre 10
sort()
length()
mean(nms[11:(l-10)])
5.单变量分析
离散变量分析
table()频率表
barplot()
连续变量分析
boxplot()箱线图
stem()茎叶图
返回箱线图中的异常值
bound <- quantile(X$median,0.25) - 1.5*IQR(X$median)
histogram及其返回值
h<-hist(data,breaks = c(a,b,c),plot=FLASE)
h$density
density大小为区间概率除以区间宽度
diff()函数实现验证histograme面积和为1
sum(diff(breaks)*h$density)
6.多变量分析
plot()函数
plot(final~median,data=X)
boxplot(final ~ correcteur.final, data = X) stripchart(final ~ correcteur.final, data = X,method="jitter")