关于如何分辨鸢尾花的判别分析报告
1、目的与背景:鸢尾花为法国的国花,Seto,Versicolour,Virginica是三种有名的鸢尾花,其萼片是绚丽多彩的,和向上的花瓣不同,花萼是下垂的。这三种鸢尾花很像,根据萼片和花瓣的四个度量对鸢尾花分类。
二、分析过程
1、组间均值分析
H0:组间均值是相等的
H1:组间均值是不等的
Tests of Equality of Group Means
表1
| Wilks' Lambda | F | df1 | df2 | Sig. |
花萼长 | .364 | 76.098 | 2 | 87 | .000 |
花萼宽 | .608 | 28.023 | 2 | 87 | .000 |
花瓣长 | .060 | 675.871 | 2 | 87 | .000 |
花瓣宽 | .075 | 533.785 | 2 | 87 | .000 |
| | | | | |
表1是对各类均值是否相等的检验。有表1可以看出,在0.01的显著性水平上,拒绝在三组均值相等的原假设,即花萼长、花萼宽、花瓣长、花瓣宽在三组的均值是有显著性差异的。
2、协方差阵分析
H0:各组协方差阵是相等的
H1:各组协方差阵是不相等的
Test Results
表2
Box's M | 92.993 |
F | Approx. | 4.332 |
df1 | 20 |
df2 | 23344.026 |
Sig. | .000 |
| | |
Tests null hypothesis of equal population covariance matrices.
表2是对各总体协方差阵是否相等的统计检验。在0.05的显著性水平下拒绝原假设,即各总体协方差阵不相等。
3、确定非标准化典型判别函数
Canonical Discriminant Function Coefficients
表3
| 河狸Function |
1 | 2 |
花萼长 | -.083 | .037 |
花萼宽 | -.132 | .211 |
花瓣长 | .212 | -.104 |
花瓣宽 | .239 | .273 |
(Constant) | -2.063 | 玫瑰泡水 -8.045 |
| | |
Unstandardized coefficients
表3是非标准化的典型判别函数,表示为y1=-2.063-0.083*Sepal.Lenght-0.132*Sepal.Width+0.212*Petal.Length+0.239* Petal.Width
y2=-8.045+0.037*Sepal.Lenght+0.211*Sepal.Width-0.104*Petal.Length+0.273* Petal.Width
土建工程
4、函数的显著性检验
Eigenvalues
表4-1
Function | Eigenvalue | % of Variance | Cumulative % | Canonical Correlation |
1 | 28.215(a) | 99.0 | 99.0 | .983 |
2 | .274(a) | 1.0 | 100.0 | .463 |
| | | | |
a First 2 canonical discriminant functions were ud in the analysis.
Wilks' Lambda
表4-2
民为贵社稷次之君为轻 Test of Function(s) | Wilks' Lambda | Chi-square | df | Sig. |
1 through 2 | .027 | 309.214 | 8 | 湖心亭看雪的翻译 .000 |
2 | .785 | 20.678 | 3 | .000 |
| | | | |
表4-1和4-2是典型判别函数。表4-1反映了判别函数的特征值、解释方差的比例和典型相关系数。第一判别函数解释了99%的方差,第二判别函数解释了1%的方差,两个判别函数解释了全部的方差。表4-2是对两个判别函数显著性检验。由Wilks' Lambda检验,两个判别函数在0.05的显著性水平上拒绝原假设,认为函数是显著的。
5、对因素贡献度的分析
Standardized Canonical Discriminant Function Coefficients
表5-1
| Function |
1 | 2 |
花萼长 | -.444 | .195 |
花萼宽 | -.437 | .695 |
花瓣长 | .961 | -.471 |
花瓣宽 | .520 | .593uv254 |
| | |
Structure Matrix
表5-2
| Function |
1 | 2 |
花瓣长 | .742(*) | .217 |
花萼宽 | -.125 | .860(*) |
花瓣宽 | .656 | .704(*) |
花萼长 | .245 | .449(*) |
| | |
Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.
* Largest absolute correlation between each variable and any discriminant function
表5-1是标准化的判别函数,表示为:
y1=-0.444*Sepal.Lenght(*)-0.437*Sepal.Width(*)+0.961*Petal.Length(*)+0.520* Petal.Width(*)
四十式杨式太极拳y2=0.195*Sepal.Lenght(*)+0.695*Sepal.Width(*)-0.471*Petal.Length(*)+0.593* Petal.Width(*)
我们可以根据这个判别函数计算每个观测的判别Z得分。
表5-2是结构矩阵,即各依据变量与函数的相关关系。由表可以看出哪些解释变量对判别函数的贡献较大。绝对值越大,贡献越大,反之。
6、求出零界点
Functions at Group Centroids
表6
鸢尾花名 | Function |
1 | 2 |
刚毛鸢尾花 | -7.120 | .193 |
变色鸢尾花 | 1.547 | -.815 |
弗吉尼亚鸢尾花 | 4.998 | .416 |
| | |
Unstandardized canonical discriminant functions evaluated at group means
表6是反映判别函数在各组的重心。结果显示,判别函数在y=1这一组的重心为(-7.120,0.193),在y=2这一组的重心为(1.547,-0.815),在y=3这一组的重心为(4.998,0.416).这样,我们可以根据每个观测的判别Z得分将观测进行分类。
7、判别到底是哪一类
Classification Function Coefficients
表7
| 鸢尾花名 |
刚毛鸢尾花 | 变色鸢尾花 | 弗吉尼亚鸢尾花 |
花萼长 | 2.048 | 1.288 | 1.045 |
花萼宽 | 2.487 | 1.127 | .929 |
花瓣长 | arp防火墙-1.324 | .614 | 1.216 |
花瓣宽 | -1.566 | .231 | 1.392 |
(Constant) | -83.350 | -69.283 | -97.359 |
| | | |
Fisher's linear discriminant functions