R语言小结1

1.基础算术运算

1.1比较两数是否相等

res = log(640320**3+744, base=exp(1))/sqrt(163)
identical(res,pi)

1.2对数函数

log(x, base = exp(1))
log10(x)
log2(x)

 


 

2.内置数据结构

2.1Vecteur向量

 

初始化

c(1,2,3,4,5)

 

向量索引

vect[1:3]


返回布尔向量

choix <- vect > 0

notes[notes>10]

 

返回向量长度

length(vect)

 

les notes non fractionnaires整数的

利用floor()筛选整数元素

notes10[notes10 == floor(notes10)]

 

min()函数返回向量中的最小值

 

修改向量中元素的值

v[1] <- 1

v[1:4] <- 5

v[v == 1] <- 2

 

any()布尔向量,返回布尔向量中是否存在True

 


2.2Facteur 内置数据结构之二

factor(c)初始化facteur

给factor中的元素设置优先级

facteur(c(...), ordered = TRUE,levels = c(...))

 

levels(f)函数和nlevels(f)函数

返回f的集合元素,以及集合大小

 

统计factor对象某一元素出现的次数

length(factor[factor == 'A'])


 

2.3创建Tableau-individual data.frame

元素为数值型,则用vector表示,为quantitative,则用factor表示

data.frame(column1,column2,column3...)

 


3.CSV文件

 

setwd命令改变工作区

 

x <- read.csv("filename.data")

 

length(data.frame)返回data.frame的列数

nrow()

ncol()

names()返回列标签

 

data.frame[1:10,]

data.frame[c(1,3),c(4,5)]

 

如何索引data.frame对象最后一列元素?

data.frame[,ncol(data.frame)]

 

根据标签进行索引

X[1:10,'median']

X$median

X[X$median > 10,]

 


 

4.描述统计

mean()

sd()

var()

median()

max()

min()

 

summary()

 

分位点函数

quantile(data,0.25)

quantile(data,0.75)

quantile(X$median,0.75) - quantile(X$median,0.25)

IQR(X$median)

 

计算截断均值moyenne tronquée d'ordre 10

sort()

length()

mean(nms[11:(l-10)])


 

 

5.单变量分析

 

离散变量分析

table()频率表

barplot()

 

连续变量分析

boxplot()箱线图

stem()茎叶图

 

返回箱线图中的异常值

bound <- quantile(X$median,0.25) - 1.5*IQR(X$median)

 

histogram及其返回值

h<-hist(data,breaks = c(a,b,c),plot=FLASE)

h$density

density大小为区间概率除以区间宽度

 

diff()函数实现验证histograme面积和为1

sum(diff(breaks)*h$density)

 

 


 

6.多变量分析

plot()函数

plot(final~median,data=X)

boxplot(final ~ correcteur.final, data = X) stripchart(final ~ correcteur.final, data = X,method="jitter")    

 

上一篇:CS188-pj4-Project 4: Inference in Bayes Nets


下一篇:第一次模拟总结