残差是个宝:盈余管理、过度投资、超额收益怎么算?
∙1. 引言——福尔摩斯与怀表
∙2. 实证中的黑匣子——残差
∙3. 研究实例:过度投资与投资不足
∙4. Stata 应用
o4.1 残差和拟合值的估计
o4.2 分组回归的残差
∙5. 便捷的 asreg 命令
o5.1 安装 asreg 命令
o5.2 asreg 命令的基本语法
o5.3 asreg 生成的新变量
o5.4 asreg 命令应用之 Stata 范例
∙6. 结语
∙阅读资料
∙关于我们
内容提要:
实证分析中,一般人很少关注残差。其实,残差是个神秘的黑箱,里面蕴含着丰富的信息。本文介绍如何通过分组回归获取的残差来构造衡量'盈余管理程度'、'过度投资'以及'过度消费'等指标。Stata 中的 asreg 命令可以快捷地完成这一任务!
asreg 命令的典型用途:
∙应计项目和真实项目盈余管理指标:分行业-分年度估计残差;
∙过度投资/过度消费指标:分行业分年度估计拟合值和残差;
∙股价同步性指标(synch):分行业分年度 (月、周) 计算 R2 或调整后的 R2.
福尔摩斯
1. 引言——福尔摩斯与怀表
相信很多人都读过英国侦探小说家阿瑟·柯南·道尔的中篇小说《四签名》。
故事中的主角大侦探福尔摩斯的名声可谓如雷贯耳,甚至在日本漫画家青山刚昌创作的侦探漫画《名侦探柯南》中,主角柯南也将福尔摩斯视作偶像。
在《四签名》中,福尔摩斯曾经准确地通过一块怀表的特征推断出了其旧主人的性格特点和生活习惯:'他是一个放荡不羁的人……最后因为好酒而死……'。
下面是相关的证据:
∙证据一: 这是一块价值五十多英镑的表,本应该很精心地保护和使用,但整个表的上面有无数的伤痕,这是因为惯于把表放在有钱币、钥匙一类硬东西的衣袋里的缘故。故知其主人'放荡不羁'。
∙证据二:表的里盖钥匙孔附近有上千的伤痕,这是因被钥匙摩擦而造成的。一般清醒的人插钥匙,一插就能够进去,只有醉汉才会因手腕颤抖而留下这些痕迹。故知其主人'好酒'。
上面的推理充分展现了福尔摩斯敏锐的观察力与严谨的分析能力。
然而,隐含在上述推理背后的逻辑是:
掌握一般情况下本应怎样,观察实际情况下却是怎样,将二者作一比对,便可以发现隐藏在后面的真相。
比如:一般情况下,对如此贵重的怀表本应精细呵护才是,
然而,实际上却在其表面发现许多伤痕,这些伤痕必然暗藏玄机……
智慧的真谛往往会得到跨领域的呼应。福尔摩斯这一推理方法也被广泛地运用于社会科学的学术研究中。
2. 实证中的黑匣子——残差
在基于大样本的社会科学实证研究中,我们往往会构建某种模型来描述事情在一般情况下本应怎样(回归模型的拟合值),然后再看一看事情的实际情况却是怎样(被解释变量的实际观测值),而上述二者之间的差异(残差)所隐藏的信息便成为了我们需要解释的重点。
我们可以看到,在很多领域,常常采用回归得到的残差作为某些重要变量的衡量指标,而
这些指标继而会作为随后分析中的被解释变量。这便是上述的福尔摩斯推理思想的一种运用。例如:
∙在会计和公司金融领域,研究盈余管理或盈余质量时,便是基于'分行业-分年度'回归得到的残差作为异常盈余的指标;
∙在事件研究法中,我们针对每家公司的日交易资料来估计市场模型(CAPM 的一个简化版本),并取其残差用以衡量异常收益率 (Abnormal Return, AR);
∙在公司投资行为的研究中,用实际投资支出与可能影响投资行为的变量进行回归,得到的残差往往被视为非预期投资,残差为负者视为投资不足,为正者则视为过度投资;
∙在个体消费行为的研究中,也会采取相同的思路,估计消费率方程后,用残差来衡量异常消费。
类似的例子和应用还有很多。这里我们以公司投资行为的研究为例,介绍此类模型的基本思想,并应用 Stata 范例来展现这一思想的实现过程。
3. 研究实例:过度投资与投资不足
Richardson(2006,'Over-Investment of Free Cash Flow') 对公司的投资行为进行了研究,文中构建了如下形式的投资模型:
模型中的被解释变量 是第 家公司在第 年的新增投资支出,解释变量 主要包括:公司的增长机会、杠杆率、公司规模、公司年龄、现金存量、股票回报率、新增投资支出,以及年度和行业虚拟变量等。干扰项 里则包含了各种无法观测,同时有可能影响公司投资支出的因素。比如,管理者的个人风格、公司文化、行业层面或宏观层面受到的各种冲击等等。
这些解释变量决定了公司新增投资支出的正常水平,因此上述回归模型的拟合值便是对公司'预期投资支出'的衡量。
若用 表示 的拟合值,即 (这里, 和 分别表示参数 和 的估计值),则模型的 残差 定义为:。它反映了公司的非预期投资支出。如果 为正值,表示公司倾向于过度投资;反之,则意味着存在投资不足倾向 。
4. Stata 应用
4.1 残差和拟合值的估计
若假设参数 α 和 β 在全样本中为常数 (以 Leverage 变量为例,这意味着 A 公司的负债率增加一个单位对投资的边际影响与 B 公司完全相同;或者,2009 年 Leverage 增加一个单位对投资的边际影响与 2008 年和 2010 年也米有差别,这显然是一个很严格的假设条件),则估计残差和拟合值是非常简单的事情:只需在完成回归后执行 predict 命令即可。
为便于各位读者演练,这里使用 Stata 手册中的一份范例数据来说明。该数据源于 Grunfeld & Griliches (1960,'Is aggregation necessarily bad?')。他们用公司前期市场价值和固定资产价值两个因素解释了公司的总投资支出。样本包括了 10 家公司 1935-1954 年 20 年间的数据。
虽然他们的模型与 Richardson (2006) 在设定上存在差异,但求取模型残差的思路是相通的。
webu grunfeld, clear // 调入数据
reg invest mvalue kstock
predict inv_fit // invest 的拟合值
predict E0, res // 残差,需要附加 residual 选项,可以简写为 res
label var E0 'E0'
list comp year inv* E0 if mod(year,5)==0, p(4)
*-Note: invest-总投资支出;
* mvalue-前期市场价值;
* kstock-前期固定资产价值
部分结果呈现如下:
+-------------------------------------------------+
| company year invest inv_fit E0 |
|-------------------------------------------------|
1. | 1 1935 317.6 313.6896 3.910378 |
6. | 1 1940 461.2 541.7413 -80.54128 |
11. | 1 1945 561.2 577.8403 -16.64025 |
16. | 1 1950 642.9 644.8065 -1.906509 |
|-------------------------------------------------|
21. | 2 1935 209.9 127.138 82.76198 |
26. | 2 1940 361.6 270.496 91.10404 |
31. | 2 1945 258.7 220.4178 38.28222 |
36. | 2 1950 418.8 233.6664 185.1336 |