均值回归:循规蹈矩,偶发癫狂
1
引⾔
经理费均值回归指的是⼀个指标随着时间的变化在其均值上下波动的现象。
⾃然科学和社会科学中都有⼤量均值回归(mean reversion 或 reverting to the mean)的例⼦。下图为尼罗河年最低⽔位随时间的变化,它表现出了明显的均值回归特性。
在社会科学中,诺贝尔奖获得者、著名的⾏为⾦融学家、展望理论的提出者 Daniel Kahneman 曾提出了⼀个“体育画报诅咒”的例⼦:凡是登上体育画报封⾯的明星,在接下来的新赛季的表现都会“跌落⼈间”。科学研究表明,运动员的表现也是围绕均值呈随机分布。因此,上⼀个赛季拥有⾼光表现的明星(以⾄于登上了体育画报),有很⼤可能在接下来的新赛季变得平庸。换句话说,运动员的表现呈现均值回归特性。
虽然远不如⾃然和社会科学中的现象完美,但是在⾦融市场投资中也有近似均值回归的现象,更是存在⼤量的围绕该现象构建的投资策略。那么,依靠均值回归是否能够挣到钱呢?这样的策略风险⼜有多⼤呢?这些就是本⽂要探讨的问题。
2
妨碍的近义词
⾦融领域的均值回归
basics and esnce
根据维基百科,⾦融市场的均值回归定义如下:
“
In finance, mean reversion is the assumption that a stock's price will tend to move to the average price over time.
译:在⾦融领域,均值回归假设随着时间的移动,股票的价格朝着它的均值移动。
小年是什么意思”
我们可以把上述定义中的“股票”换成其他任何投资品。我想强调的是,这个定义中最核⼼的两个字是“价格”(⽽不是投资品的“收益率”)。这⼀点怎么强调都不过分:
“价格呈现均值回归”等价于“收益率呈现负的序列相关性”。这是⼀种⾮常好的、可以被拿来构建优秀策
略的特性。
“收益率呈现均值回归(即收益率围绕 0 随机的上下波动)”等价于“价格呈现随机游⾛”。这是投资品最差的⼀种形态(不幸的是,这也恰恰是实际中的情况),在这种情况下不存在有效的赚钱策略(运⽓除外)。
在现实中,绝⼤多数单⼀(特地提出单⼀,为后⾯留个伏笔)投资品价格都不满⾜均值回归。如果有明显的均值回归,那么赚钱就太容易了,我们只需要做到所有那些伪专家说的“⾼抛低吸”。满⾜均值回归时,由于格在区间内震荡且围绕其均值波动,⾼抛低吸当然是可能的。⽐如下图是上证指数从 2016 年 11 ⽉到现在的波动区间,上限 3300 附近、下限 3050 左右。如果它就在这个区间内呈现均值回归的话,那么我们还愁赚不着钱吗?
然⽽,现在来看都是事后诸葛亮。当我们⾝在其中的时候,⼜有谁敢说上证指数会在这个区间内震荡呢?满⾜均值回归的投资品在现实中⼏乎没有的。如果⼀个时间序列满⾜均值回归,那么它⼀定也满⾜平稳性。平稳性要求时间序列的均值和⽅差不随时间变化。显然,投资品的价格⽆法满⾜这样的假设。
现实中,投资品价格基本上都呈现⼏何随机游⾛(关于这⽅⾯,感兴趣的读者可以参阅量信的《布朗运动、伊藤引理、BS 公式》和《写给你的⾦融时间序列分析》系列⽂章)。
虽然单⼀投资品的价格不满⾜均值回归,但幸运的是,我们可以把多个投资品(通常是两个)线性组合在⼀起,使它们的价差满⾜均值回归。
在数学上,如果多个⾮平稳的时间序列通过线性组合得到⼀个平稳的时间序列,则把满⾜这种关系称为协整(cointegration)。正因如此,均值回归这种现象才在⾦融领域才有了⼴泛的应⽤。如果⼀个价格(或者价差)序列满⾜均值回归,那么当前的价格对下⼀时刻价格的变化应该有预测性。例如,如果当前的价格⾼于均值,那么下⼀时刻的价格会倾向于朝着均值移动。基于这样的假设可以构建⼀个描述均值回归的线性数学模型。
对于价格(或多个投资品线性组合的价差)序列 y,该模型为:
我们可以通过历史数据来估计模型中的参数。如果 y 满⾜均值回归,那么这个模型中的参数λ就必须在统计上显著的不为零(更确切的说,λ需要显著为负)。通常可以使⽤ ADF 检验(Augmented Dickey-Fuller Test)来考察λ的取值。
ADF 检验
原假设为当前的价格对下⼀时刻价格的变化没有预测性,即λ=0。该检验的统计量是λ和它⾃⾝标准误差之⽐,即λ/SE(λ)。对于均值回归模型,我们预期λ/SE(λ) 为负。因此,只有当这个统计值⼩于给定
第一台智能手机
显著性⽔平的阈值(阈值是负数)时,我们才能在对应的置信⽔平下拒绝原假设、接受备择假设,即λ统计上不为 0 ⽽序列 y 呈现均值回归特性。
武大靖事迹⼀旦找到⼀个满⾜均值回归的价格或者价差序列,就可以⽤它构建⼀个均值回归策略,并利⽤这种特性来赚钱。下⾯我们就来看看⼀个经典的例⼦。
3
经典的 EWA 和 EWC 配对交易
EWA 和 EWC 的配对交易是均值回归策略的⼀个经典例⼦。他们分别代表澳⼤利亚(EWA)和加拿⼤(EWC)股指的两个 ETFs。由于这两个国家的经济都主要依靠商品,因此我们预期在特定的线性组合下,这两个 ETFs 的价差满⾜均值回归。
为了验证这⼀点,⾸先画出这两个 ETFs 的价格序列(下图)。可见,它们确实有很⾼的相似度,当然这两个价格之间的⽐例并不是 1:1——在绝⼤多数情况下,EWA 要⽐ EWC ⾼⼀些,它们之间存在⼀个随时间变化的⽐例,这个⽐例也称作 hedge ratio。
如果⽤θ_t 来表⽰ t 时刻它们的⽐例,则可以构建如下关系:
换句话说,d_t 就是它们线性组合得到的价差序列:
如果我们假设θ_t 不随时间变化⽽是⼀个常数,则可以⽤这两个历史价格序列做线性回归,从⽽确定θ的取值。之后便可以计算它俩线性组合的价差序列,如下图所⽰。
直观上看,价差序列确实符合均值回归。对它进⾏ ADF 检验,得到的统计值为 -4.09(p-value 为 0.0065),⼩于显著性 1% 对应的阈值 -3.96,这说明我们可以在 99% 的置信⽔平下拒绝原假设。ADF 检验说明该价差序列满⾜均值回归。
焗乳鸽crazy是什么意思如何利⽤这个价差序列来构建量化策略呢?
⾸先必须明确的是,在这个策略中,我们交易的将是这个价差。当价差在均值之下的时候,则做多价差;当价差在均值之上的时候,则做空价差。但不要忘记,价差是我们⼈为构建的。因此在实际交易中也必须通过配对交易 EWC 和 EWA 来实现对价差的多空交易。根据价差的数学表达式,最终的量化策略为:
当 d_t ⼩于均值之下的某个阈值时(做多买⼊点,long entry),做多 d_t,即做多 1 个单位的EWC 并同时做空θ_t 个单位的 EWA,当 d_t 回归到均值之上的某个阈值时(做多平仓
点,long exit),平仓;
当 d_t ⼤于均值之上的某个阈值时(做空买⼊点,short entry),做空 d_t,即做空 1 个单位的
EWC 并同时做多θ_t 个单位的 EWA,当 d_t 回归到均值之下的某个阈值时(做空平仓
点,short exit),平仓。
在实际交易中,必须确定多空双向交易开仓和平仓的阈值。此外,我们也假设这两个投资品的⽐例θ_t 是随时间变化的。在我们的实验中,采⽤状态空间模型(state space model)中的卡尔曼滤波(Kalman filter)算法来动态确定θ_t 以及上⾯提到的阈值的取值。状态空间模型的思想可以简述为它将θ_t 看作⼀个未知的状态,并通过观测值来确定状态的取值。详细的介绍超出本⽂的范畴,我们会在今后某期量化核武研究专题中介绍状态空间模型。
由于交易的是 ETFs,我们假设万分之三的成本。在这种假设下,上述价差交易策略的净值曲线和最⼤回撤曲线如下:
在回测期内,策略的年化连续复利收益率为 8.72%,最⼤回撤 -9.38%,夏普率 1.00。从净值和最⼤回撤曲线中看出很⼤的⼀部分收益来⾃ 2009 年;另外,在 2013 年到 2015 年间,策略发⽣了长达 700 多个⾃然⽇的回撤。尽管如此,策略的整体表现依然算是可圈可点,因此这哥俩的配对交易算是均值回归策略⾥⾯的经典案例。
在上⾯这个例⼦中,虽然年化收益率并不性感,但不要忘了,收益率对于⼀个⾼夏普且交易频率相对
较⾼的策略根本就不是事⼉。因为总可以捅过上杠杆来放⼤收益率。在上⾯这个例⼦中,让我们愿意相信该价差能够维持均值回归的根本原因是基本⾯层⾯的,即澳⼤利亚和加拿⼤这两个国家的经济都由商品贸易主宰。只要这个先决条件不变,我们有理由相信它们的价差会⼀直均值回归下去。
但是必须说明的是,与趋势追踪策略的“收益⽆限、风险有限”恰恰相反的是,均值回归策略“收益有限、风险⽆限”。当基本⾯原因的突然消失以及使⽤超⾼杠杆时,⼀个均值回归策略必然骤然失效、导致惨痛的亏损。长期资本的故事正是如此。
4
长期资本的教训
长期资本管理公司(Long-Term Capital Management)曾经是美国华尔街⾸屈⼀指的对冲基⾦公司,在基本没有亏损和回撤的情况下,取得了 1994 成⽴⾄ 1997 年辉煌顶峰每年费后死亡诗社观后感
28.5%、42.8%、40.8% 和 17% 的投资净回报。1998 年初其净资产达到 46 亿美元,通过 33倍杠杆控制 1500亿美元规模的⾦融资产。
长期资本管理公司的投资策略基于市场的有效性,认为资本市场不合理的债券利差会逐渐减⼩,可以通过买⼊低估资产/卖出⾼估资产赚取这部分利差。他们通过对⼤量历史数据的测算,认为可以通过对
债券投资进⾏严格对冲,保证⼀个极低的风险暴露。在执⾏层⾯,他们通过精确的电脑⾃动数学模型发现众多宝贵的债券利差投资机会,并通过向同业⾦融机构融资,运⽤巨⼤的财务杠杆来放⼤收益。
1998 年初,亚洲⾦融危机爆发后低信⽤等级国债相较欧美国债利差显著扩⼤。经过模型计算,长期资本管理公司的交易员相信互换利率交易利差会逐渐回缩。所以,他们动⽤⼤量资⾦抛空互换利率交易利差。1998 年 8 ⽉,俄罗斯⾦融危机爆发,俄罗斯违背了承诺拒绝偿付债款并任由卢布贬值;国际炒家和投资者纷纷撤资,从各种低信⽤等级债券中仓皇出逃,⽽这些撤出的
资⾦唯⼀⽬的地就是风险较低的欧美国家债券。所以,美国短期债券和 30 年长期债券利率⼤幅下调,长期资本公司持有的⼤量俄罗斯债券以及各种低信⽤国债利率⽕箭攀升,⼆者之间的利差并未如预期缩⼩⽽是进⼀步显著放⼤,⾼杠杆下产⽣的亏损惊⼈,长期资本管理公司的净资产 1 个多⽉时间缩⽔ 60%,被迫被美林、摩根出资收购接管,并于 2000 年彻底倒闭清算。
这个教训是对均值回归“风险⽆限”最好的诠释。
5
正确认识均值回归策略
尽管具有“收益有限、风险⽆限”的特性,但均值回归策略仍然在量化投资中占据着⼀席之地。如何来
正确的看待它的优缺点呢?
⾸先,随着层出不穷的⾦融⼯具,越来越多的投资品的线性组合将会满⾜均值回归特性。满⾜协整的投资品都存在某种基本⾯的原因,⽐如上⾯的 EWA 和 EWC,⼜⽐如 GDX 和 GLD——前者是跟踪⾦矿开采公司⽽后者跟踪黄⾦。诸如此类的例⼦还有很多。此外,均值回归策略在投资的频率和周期上⾮常灵活。我们既可以在⾼频交易中找到价格的背离⽽运⽤均值回归策略,⼜可以在低频的价值投资中找到价格偏离基本⾯价值的公司来进⾏投资(价格最终会回归到基本⾯价值)。因此均值回归策略的适⽤⾯⾮常⼴泛。另⼀⽅⾯,均值回归和主流的趋势追踪策略有很⾼的互补性。同时使⽤的话可以提⾼⼀个投资组合的夏普率。这些都是均值回归策略的优点。
⽽缺点⽅⾯,就如同上⾯长期资本的例⼦。谁也不知道基本⾯原因是否会突然失效。举个例⼦,GDX 和 GLD 的价差在 2008 年突然失效,后来得知是因为能源价格的蹿升(⾦矿开采需要⼤量能源)。因此,如果没有做好风控⽽依然等着价差回归的话可能会因此⽽死的很惨。后续研究发现,GDX、GLD 和油价三者从那之后可以构建出满⾜协整的线性组合。再有就是当⼀个均值回归策略让使⽤者尝到甜头之后,因为其较⾼的夏普率,投资者往往会变得⾮常⼤胆从⽽不⾃觉的加⼤杠杆。这⽆疑相当于⾝上随时绑着⼀颗雷。⼀旦价格未按预想的回归,则有可能在很短的时间内产⽣巨⼤的亏损。
最后来看看均值回归策略都有哪些应⽤场景:
股票配对:同⾏业内相似的公司(⽐如花旗银⾏和美国银⾏)的股价的价差可能满⾜均值回归。但⽆论在基本⾯还是操作层⾯,这都是有困难的。基本⾯层⾯,每个公司有⾃⾝独有的风险,因此⽆法保证价差回归。操作层⾯,配对交易需要做空股票,这是有⾼额的成本的。
ETF 配对:ETF 配对交易⽐股票配对交易要更切实际⼀些,就如同上⾯ EWA 和 EWC 的例⼦。此外,ETF 由于包括⼀篮⼦股票,它可以规避公司特有的风险。
指数套利:这指的是同时交易指数以及构成该指数的成分股。当然,这仅仅是理论上存在套利的可能,⽽实际交易是要⾯对种种限制以及可观的交易成本。
截⾯均值回归:我们可以考虑⼀篮⼦股票。这⾥均值回归的定义为,这些股票的价格虽然不⼀定相对于它们各⾃的长期均值回归,但是它们的收益率会相对于这⼀组股票的平均收益率来回归。即这⼀篮⼦股票中,之前涨的好的可能要跌⼀跌,⽽之前跌的多的就要涨⼀涨。这也就是⼈们常说的“补涨补跌”,相信你⼀定不陌⽣。