目录
第一节数据分析指标 (1)
一常用数理指标 (1)
二常用业务指标 (6)
三财政经济指标 (7)
第二节统计分析方法 (8)
一对比分析 (8)
二同比分析 (10)
三环比分析 (10)
四定比分析 (11)
五差异分析 (11)
六结构分析 (12)
七因素分析 (13)
八预警分析 (14)
九80/20分析(二八分析) (14)
第三节高级分析方法 (15)
一时间序列分析 (15)
二聚类分析 (18)
三波士顿矩阵分析 (18)
四相关分析 (19)
五回归分析 (20)
六协整分析 (21)
七支出偏好分析 (22)
八支出甩尾评价模型 (23)
第四节数据挖掘方法 (23)
一数据挖掘定义与商业应用 (23)
二数据挖掘常用模型 (24)
三数据挖掘在财政收支分析中的应用 (30)
四数据挖掘的处理过程 (30)
五数据挖掘实践中的问题 (32)
第五节常用展现图形 (32)
一折线图 (32)
二圆饼图 (34)
三直条图 (35)
四绩效考核五星图 (37)
五气泡图 (38)
六雷达图 (39)
七面积图 (40)
八散点图 (41)
九漏斗图 (42)
十圆环图 (43)
数据分析方法
第一节 数据分析指标
数据可分为定性数据(Qualitative Data )和定量数据(Quantitative Data )。这里讨论范围着眼于定量数据。对于定量数据,从数据的时间属性来看,可以被分为截面数据(Cross-ctional Data )和时间序列数据(Time ries Data )。截面数据是在同一时点或近似同一时点上搜集到的数据,例如2008年6月北京市18个区县的收入数据;时间序列数据是在一系列时间段采集的数据,例如从1998-2008年北京市历年的收入数据。对于截面数据一般着重于不同群体之间的差异分析以及群体内各要素的结构分析;对于时间序列数据一般着重于观测数据的趋势分析。
数理指标:纯数理的,表征一个群体特征的指标,包括平均值,最大值,最小值,方差,集中度,基尼系数等
业务指标:在数理指标的基础之上结合业务产生的,反应业务特点的指标。如宏观税负率,边际税负率,税收弹性,GDP 等。
一 常用数理指标
体现特征的指标主要有平均数(mean )、标准差(standard deviation )与变异系数(variation coeff
icient )三个常用统计量,前者用于反映资料的集中性,即观测值以某一数值为中心而分布的性质;后两者用于反映资料的离散性,即观测值离中分散变异的性质。
(一) 平均数指标
平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。在财政收支分析中,平均数被广泛用来描述或比较各地区或部门的平均水平等,如平均赋税水平,人均教育支出水平等。平均数主要包括有算术平均数(arithmetic mean )、中位数(median )、众数(mode )、几何平均数(geometric mean )及调和平均数(harmonic mean ),现分别介绍如下。
1. 算术平均数
算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数,记为x 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。
设某一资料包含n 个观测值:
x 1、x 2、…、x n ,则样本平均数x
可通过下式计算:
n
x n x x x x n
i i
n ∑==+++=1
21
其中,Σ为总和符号;
∑=n
i i x 1
表示从第一个观测值x 1
累加到第n 个观测值x n
。当
∑=n
i i x 1
在意义上已明确时,可简写为Σx ,上式即可改写为:
n
x x ∑=
算术平均数对个别极值反应比较灵敏,因而在某些情况下可能具有一定欺骗性,这时它有可能走样。对于严重偏态的分布,算术平均数会失去它所应有的代表性。
2. 截尾均数
因为算术平均数较易受极端值的影响,因此可以考虑将数据进行排序后,按照一定比例去掉最两端的数据,包括中部的数据来求平均数。如果截尾均数和原来平均数差异不大,说明数据不存在极端值,或者两侧极端值的影响正好抵消,反之,则说明数据存在极端值,截尾均数能更好的反映数据的集中趋势。常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。
3. 中位数
将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为
M d 。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。中位数简称中数。
当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。
中位数的计算方法:先将各观测值由小到大依次排列。
(1) 当观测值个数n 为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数;
2/)1(+=n d x M
(2) 当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即:
2
)
12/(2/++=
n n d x x M
4. 几何平均数
n 个观测值相乘之积开n 次方所得的方根,称为几何平均数,记为G 。它主要应用于动
态分析,用几何平均数比用算术平均数更能代表其平均水平。其计算公式如下:
n
n n
n x x x x x x x x G 1
)(321321 ⋅⋅=⋅⋅=
为了计算方便,可将各观测值取对数后相加除以n ,得lgG ,再求lgG 的反对数,即得
G 值,即
)]lg lg (lg 1
[lg 211n x x x n
G +++=-