R语⾔中描述统计量的多种⽅法summary()、
describe()、str()等
凳子简笔画
1. summary()函数可以获取描述性统计量
可以提供最⼩值、最⼤值、四分位数和数值型变量的均值,以及因⼦向量和逻辑型向量的频数统计
2. misc包中的describe()函数
可返回变量和观测的数量、缺失值和唯⼀值的数⽬、平均值、分位数,以及五个最⼤的值和五个最⼩的值
3.psych包中的describe()函数
psych包也拥有⼀个名为describe()的函数,它可以计算⾮缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最⼩值、最⼤值、值域、偏度、峰度和平均值的标准误
4.pastecs包中的stat.desc()的函数
可以计算种类繁多的描述性统计量。使⽤格式为:stat.desc(x,basic=TRUE,desc=TRUE,norm=FALSE,
p=0.95)
其中的x是⼀个数据框或时间序列。若basic=TRUE(默认值),则计算其中所有值、空值、缺失值的数量,以及最⼩值、最⼤值、值域,还有总和。若desc=TRUE(同样也是默认值),则计算中位数、平均数、平均数的标准误、平均数置信度为95%的置信区间、⽅差、标准差以及变异系数。最后,若norm=TRUE(不是默认的),则返回正态分布统计量,包括偏度和峰度(以及它们的统计显著程度)和Shapiro–Wilk正态检验结果
5.str()函数
以简洁的⽅式显⽰对象的数据结构及内容,可以查看数据框中每个变量的属性
6. attributes()函数
可以提取对象除长度和模式以外的各种属性
7.aggregate()函数
仅允许在每次调⽤中使⽤平均数、标准差这样的单返回值函数,它⽆法⼀次返回若⼲个统计量
8.by()函数
格式为:by(data,INDICES,FUN),其中data是⼀个数据框或矩阵,INDICES是⼀个因⼦或因⼦组成的列表,定义了分组,FUN是任意函数。
9.doBy包中的summaryBy()函数
10.psych包中的describe.by()函数
1.查看数据
2.探索单个变量
我们的青春期
> table(iris$Species) # 计算因⼦的频率数
tosa versicolor virginica 50 50 50> pie(table(iris$Species))
> barplot(table(iris$Species))
> cov(iris$Sepal.Length,iris$Petal.Length) # 协⽅差[1] 1.274315
> cov(iris[,1:4])
Sepal.Length Sepal.Width
Sepal.Length 0.6856935 -0.0424340
Sepal.Width -0.0424340 0.1899794
Petal.Length 1.2743154 -0.3296564
Petal.Width 0.5162707 -0.1216394
营销人Petal.Length Petal.Width
Sepal.Length 1.2743154 0.5162707一件的拼音
Sepal.Width -0.3296564 -0.1216394读圆明园的毁灭有感
Petal.Length 3.1162779 1.2956094
Petal.Width 1.2956094 0.5810063
暴露反义词> cor(iris$Sepal.Length,iris$Petal.Length) # 相关系数[1] 0.8717538
> cor(iris[,1:4])
Sepal.Length Sepal.Width
Sepal.Length 1.0000000 -0.1175698
Sepal.Width -0.1175698 1.0000000
Petal.Length 0.8717538 -0.4284401
Petal.Width 0.8179411 -0.3661259
Petal.Length Petal.Width
Sepal.Length 0.8717538 0.8179411
Sepal.Width -0.4284401 -0.3661259
Petal.Length 1.0000000 0.9628654
Petal.Width 0.9628654 1.0000000四季歌歌词
1 5.800
大班语言领域目标2 7.000
3 7.900