转自:https://www.douban.com/note/511740050/
1.数据管理
numeric:数值型向量
logical:逻辑型向量
character;字符型向量
list:列表
data.frame:数据框
c:连接为向量或列表 √
length:求长度
subset:求子集 √
seq,from:to,sequence:等差序列 √
rep:重复
NA:缺失值
NULL:空对象
sort,order,unique,rev:排序
unlist:展平列表
attr,attributes:对象属性
mode,typeof:对象存储模式与类型 √
names:对象的名字属性
二、字符串处理
character:字符型向量
nchar:字符数
substr:取子串
format,format C:把对象用格式转换为字符串
paste,strsplit:连接或拆分
charmatch,pmatch:字符串匹配 √
grep,sub,gsub:模式匹配与替换 √
三、复数
complex,Re,Im,Mod,Arg,Conj:复数函数
四、因子
factor:因子
codes:因子的编码
levels:因子的各水平的名字
nlevels:因子的水平个数
cut:把数值型对象分区间转换为因子
table:交叉频数表
split:按因子分组
aggregate:计算各数据子集的概括统计量
tapply:对“不规则”数组应用函数
五、计算
+, -, *, /, ^, %%, %/%:四则运算
ceiling,floor,round,signif,trunc,zapsmall:舍入 √
max,min,pmax,pmin:最大最小值
range:最大值和最小值 √
sum,prod:向量元素和积
cumsum,cumprod,cummax,cummin:累加、累乘 √
sort:排序
approx和approx fun:插值
diff:差分 √
sign:符号函数
六、数学函数
abs,sqrt:绝对值,平方根
log, exp, log10, log2:对数与指数函数 √
sin,cos,tan,asin,acos,atan,atan2:三角函数
sinh,cosh,tanh,asinh,acosh,atanh:双曲函数
beta,lbeta,gamma,lgamma,digamma,trigamma,tetragamma,pentagamma,choose ,lchoose:与贝塔函数、伽玛函数、组合数有关的特殊函数
fft,mvfft,convolve:富利叶变换及卷积
polyroot:多项式求根
poly:正交多项式
spline,splinefun:样条差值
besselI,besselK,besselJ,besselY,gammaCody:Bessel函数
deriv:简单表达式的符号微分或算法微分
七、数组
array:建立数组
matrix:生成矩阵
data.matrix:把数据框转换为数值型矩阵 √
lower.tri:矩阵的下三角部分
mat.or.vec:生成矩阵或向量
t:矩阵转置
cbind:把列合并为矩阵 √
rbind:把行合并为矩阵 √
diag:矩阵对角元素向量或生成对角矩阵
aperm:数组转置
nrow, ncol:计算数组的行数和列数
dim:对象的维向量 √
dimnames:对象的维名
row/colnames:行名或列名
%*%:矩阵乘法
crossprod:矩阵交叉乘积(内积)
outer:数组外积
kronecker:数组的Kronecker积
apply:对数组的某些维应用函数 √
tapply:对“不规则”数组应用函数 √
sweep:计算数组的概括统计量
aggregate:计算数据子集的概括统计量
scale:矩阵标准化 √
matplot:对矩阵各列绘图
cor:相关阵或协差阵
contrast:对照矩阵
row:矩阵的行下标集
col:求列下标集
八、线性代数
solve:解线性方程组或求逆
eigen:矩阵的特征值分解 √
svd:矩阵的奇异值分解
backsolve:解上三角或下三角方程组
chol:Choleski分解
qr:矩阵的QR分解
chol2inv:由Choleski分解求逆
九、逻辑运算
<,>,<=,>=,==,!=:比较运算符
!,&,&&,|,||,xor():逻辑运算符
logical:生成逻辑向量
all,any:逻辑向量都为真或存在真
ifelse():二者择一
match,%in%:查找 √
unique:找出互不相同的元素 √
which:找到真值下标集合 √
duplicated:找到重复元素 √
十、统计分布
每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数。
比如,正态分布的这四个函数为dnorm,pnorm,qnorm,rnorm
列出各分布后缀,前面加前缀d、p、q或r就构成函数名:
norm:正态
t:t分布
f:F分布
chisq:卡方(包括非中心)
unif:均匀
exp:指数
weibull:威布尔
gamma:伽玛
beta:贝塔
lnorm:对数正态
logis:逻辑分布 √
cauchy:柯西
binom:二项分布 √
geom:几何分布
hyper:超几何
nbinom:负二项
pois:泊松 √
signrank:符号秩, √
wilcox:秩和 √
tukey:学生化极差
十一、简单统计量
sum, mean, var, sd, min, max, range, median, IQR(四分位间距)等为统计量
sort,order,rank与排序有关,其它还有ave,fivenum,mad,quantile,stem等
//其中var是variant是方差的意思。
//其他包括,取均值,五分位数,中位数,茎叶图等。
十二、统计检验
R中已实现的有chisq.test,prop.test,t.test
十三、多元分析
cor,cov.wt,var:协方差阵及相关阵计算 √
biplot,biplot.princomp:多元数据biplot图
cancor:典则相关
princomp:主成分分析
hclust:谱系聚类
kmeans:k-均值聚类
cmdscale:经典多维标度 其它有dist,mahalanobis,cov.rob
十四、时间序列
ts:时间序列对象
diff:计算差分
time:时间序列的采样时间
window:时间窗
六、统计模型
lm,glm,aov:线性模型、广义线性模型、方差分析