智能量化投资系统

更新时间:2025-01-13 10:48:49 阅读: 评论:0


2022年8月1日发
(作者:初级职称评定条件)

智能量化投资系统

简述:本课题将以全市场金融数据和全盘口量价数据为基础,融合现代量化投资特质,全面使用

机器学习算法做为数据建模和策略开发的核心,力求搭建在功能和算法上均模块化的,具有高度

可扩展性的的智能量化投资平台来驱动上层业务。

1.量化投资概要

截至2018初,量化对冲基金的全球规模超1TrillionUSD。欧美行业龙头包括:

全类量化基金(Multi-strategyQuantitative):如RenaissanceTechnology,D.E.

Shaw,TwoSigmaInvestments,AQRCapital,MillenniumManagement等;

专注高频的做市商或套利基金(HighFrequencyMarketMaking):如VirtuFinancial,

KnightCapital,TowerResearch,GETCO等;

如全球宏观风格(QuantitativeGlobalMacro)的BridgewaterAssociates等;

专营固定收益市场的(Mortgage&Fixedincome)的BrevanHoward等;

以相对价值和左侧交易见长(Relativevalue&Tailrisk)的CapulaInvestment;

做CTAsystematic的Citadel,PDTPartners,ManGroup等。

使用量化方法最为集中的金融业务是自营投资(ProprietaryTrading),指数跟踪(Index

Tracking),二级市场做市(MarketMaking),和代客交易执行(OrderExecution)。前两者属

买方业务,为资金方服务。后两者属卖方业务,为买方服务。规模皆海量。

自营投资:主体多集中在量化对冲基金和投行自营部。使用自有资金,以绝对高收益为目标,风险

敞口大,业务监管少。

自营业务以二级市场为主要交易场所,寻市场中无风险(或低风险)套利机会,实现零

成本(或低成本)正收益,或主动承担有溢价补偿(RiskPremium)的风险元素实现与大

盘弱相关的Alpha收益。盈利来源于管理费(如规模的1-2%)和绝对收益分成(如全年

收益的20-40%)。

金融核心是金融工程中的套利理论,收益与风险的自融资复制理论,和现代金融中的风险

资产定价理论。

指数跟踪:主体多为公募基金和投行证券部。服务养老基金,社保基金以及保险公司等机构资

金。以获取各类大盘的Beta收益为目标,投资品类和监管严格,风险偏好低,流动性要求高。

指数跟踪业务主要标的为股票,债券和货币,以最少调仓和最少标的为原则,实现为投资者

参与大盘或细分行业的内生成长收益为目标。业务盈利主要是资金规模挂钩的固定管理费,

少有参与分享Beta收益。过去多见于投行承销的指数产品(Indexproducts),现多以

ETF形式出现。

金融核心是风险因子的分析提取,和资产组合的最优化配置。

做市和交易执行:主体集中在投行的资本市场部(CapitalMarkets)和经纪部(Brokerage)。以

为所有买方提二级市场的交易中介为业务,承担流动性风险,赚取盘口价差(bid/askspreads)。

监管最严,风险敞口最小。

近年来,处于龙头地位的自营主体因其交易体量巨大,业务实质也属做市,如Citadel和

多数从事高频交易的龙头基金。

金融核心是市场微观结构的量化分析,冲击成本建模,和动态流动性管理。

2.明确盈利性质

盈利性质也即赚什么钱。是参与实现了价格发现,还是承担了有溢价补偿的风险,是增强了

市场有效性,还是为市场提供了流动性。

盈利性质不同,在资金容量(Capacity),收益风险比(Returnriskprofile),流动性(Liquidity),

尾部风险(Tailrisk)四个方面均不同。

传统量化方法的优势是剔除交易者的心理因素和认知偏差。传统量化方法是对基金经理的交易经

验做规则处理,做自动化执行。本质是投资人或交易者的经验集合。

现代量化方法的优势是挖掘金融市场中超出正常认知边界的深层次逻辑。如高维度数据间的非线

性关联(onlineardependence),高频率数据上的长程韧度(Longrangepersistence)。

真正意义上的量化投资不同于交易者经验集合的自动化执行。

现代量化投资的逻辑需来源于量价的可预测性。核心在于资产价格变化的随机性背后是否有确定

性结构,市场集体行为的在多大程度上有效。用科学原理建立量价模型,靠算法和数据驱动信号

和策略。

以量化为风格做投资也有其明确边界。一级市场的多数主动策略,如价值投资(Valueinvesting),

承压资产(Distressedassets),资产结构(Capitalstructure),杠杆收购(Leveragedbuyout)等

均不适合。

但量化投资的核心还是投资,针对量化的特质做策略开发,首先需要明确各类策略的盈利性质,

分以下几类。

价格发现型策略:方向性策略(Directionalstrategy)和相对价值策略(Relativevaluestrategy)

方向性策略:包括量化宏观类策略(Quantitativemacro),如用CTA/managed

futures实现的趋势跟踪(Trendfollowing);

相对价值类策略:包括债券类相对价值(Fixed-incomerelativevalue),股票多空策略

(equitylong/short);

特点:资金容量大,但尾部风险高。

增强市场有效性策略:套利类策略(Arbitragestrategy)

无风险套利策略:如汇率三角套利(Currencytrianglearbitrage),沽购平价策略(Put-

callparityarbitrage),

有风险的套利策略:如期限套利(Forward-spotarbitrage),可转债套利策略

(Convertiblearbitrage),相关性多空策略(Dispersionstrategy),以及各类统计套利策

略(Statisticalarbitrage)。

特点:资金容量有限,风险收益比高,可实现市场中性,但标的流动性风险高。

风险溢价型策略:统计型溢价策略(Statisticalriskpremium)和资产型溢价策略(Asset

specificriskpremium)

统计型溢价策略:包括波动性溢价策略(Shortvolatilitystrategy)和尾部风险策略

(Tail/crashstrategy)等。特点是所承担的风险有可预期的溢价特征如Volatilityrisk

premium和Tailriskpremium,

资产性溢价策略:包括赚取利率溢价(Interestrateriskpremium)的息差策略(Carry

tradestrategy),赚取权益溢价的策略(Equitypremium),和赚取信用溢价的策略

(Creditpremium)。特点是所承担风险的资产属性明确。

特点:资金容量大,多属右侧交易策略,可实现市场中性,也需管理尾部风险。

提供流动性型策略:提供标的流动性(Marketliquidity)和资金流动性(Fundingliquidity)策略

量化做市策略:包括二级市场上各类Deltaone标的(Equity,Debt)的量化做市策略,

高流动性衍生品(Futures,options,swaps)的量化做市策略,也包括高频做市策略,赚

取盘口价差。

特点:收益风险比高,盈利稳定,有资金流动性风险。高频做市策略的资金容量有上限。

3.投资逻辑表达

投资逻辑的表达回答的是如何产生交易观点(view),用什么产品表达观点,在什么市场表达,以

及如何高效表达的问题。

是直接用标的表达,还是使用期货,期权,或掉期;是表达于股市,期市,还是债市,汇市;如何优

化收益风险比例,以加强赢面空间(Upsideopportunity)和控制下行风险(Downsiderisk),以

及如何增减杠杆率和管理标的流动性和资金流动性。

比如投资风格是全球宏观,重点策略会是在各大类资产的期货市场做方向性策略(CTAManaged

futures)和在多币种间多资产间做量化息差策略(Carrytradestrategy)。

又比如投资风格是股票多空(Equitylong/short),重点策略会考虑承担权益溢价的策略(Equity

premium)或以个股为标的的统计套利(Statisticalarbitrage)。

例一:股票多空策略(Equitylong/short)。

观点的产生来源于对权益标的的市场面量价数据和基本面财务数据的量化分析。比如通过

分析产生的交易观点是看多京东。

最直接的表达是在标的市场做多个股(Outrightpurchaseofstocks),但资金占用高。

进一步,通过增加杠杆率来降低初始资金要求,也可以在该标的对应的期权市场表达,做

多价内看涨期权(LongIn-the-moneycall)。

再进一步,可实现对单一标的的零资金表达:做空高strike同时做多低strike,将超过预

期的upsideoption卖出,用所得来为预期内做多的表达实现融资。

看多个股的观点也可做跨标的表达。

假设看多京东这个观点的原因是看好京东线下重资产未来与其线上电商头部式零售的模式

潜力,尤其是相较于阿里等一众线下轻资产但线上长尾销售模式之间的不可持续。

跨资产表达可以是投资两类模式所代表个股的相对价值,并同时加配行业ETF对冲,实现行

业Beta中性的相对价值表达.

对同一标的的观点也可作跨市场表达。

比如交易观点是看空大盘,即可在期市上表达:做空指数期货;

也可在期权市场上表达:做多远价位指数期权(Deepout-of-moneyputs)获取Tailrisk

premium增值;

亦可在信用市场上表达:做多CreditDefaultIndex,如ACDXIG获取信用溢价

(Creditspread)增值。

例二:全球宏观中的息差策略(Carrytradestrategy)。

策略原理是以低息币种为融资货币,换汇并购买高息币种资产,获取息差回报。观点的产

生来源于对融资货种和投资币种的双重寻。

比如,过去10年发达经济体流动性宽松,美日欧瑞的银行间利率接近零或为负,与此同时

新型经济体,如中国,韩国,印度,因以美金为信用背书发行本币从而导致本土信贷宽松,

各类本土资产的资本回报率高企。

产生的交易观点是看空发达市场货币(Developedmarketcurrency),看多新兴市场货币

(Emergingmarketcurrency)。

观点表达既可以在外汇市场上直接表达成看多新兴市场货币对发达市场货币的汇率,涉

及产品是外汇远期(FXforward)。

也可以在利率市场上以跨币种利率掉期(Cross-currencyswaps)做利差表达;

亦可以先在美金银行间回购市场(Repomarket)低息融资,如0.5%年化成本,再以1:6.5

在外汇市场换汇人民币,购买4.5%年息的一年期国开债并持有,到期后若人民币持续升值

到1:6.2,将获取双重收益:4.8%的外汇升值和4.0%的息差。

同时该策略承担的风险有三种,发达市场货币的融资利率风险,新兴市场的资产收益率风

险,和外汇市场的反转风险。有效表达需管控收益-风险比例。

4.实施目标和构架

量化投资系统的开发流程中,会先明确业务线,策略逻辑和目标市场,再对相关数据进行统计分

析和时间序列建模,进而使用最优化算法对历史数据进行模型校准和收益风险回撤,最后同步上

线虚拟盘和实盘,观测和对比虚实盘表现,将异同反馈回相关模块中进行调整和二次开发。

涉及大量统计分析,模型调整和参数优化,以及IT系统开发。

传统上因业务不同,所需数据集合会不同,涉及的量化投资模型会不同,量化平台的结构也有很

大差异。

但共同点是,都需要对关联数据做特征分析,都高度依赖对量价的演化过程建立数学模型,也都

离不开高性能优化算法的实施。

基于这些共同点,本课题的目标是力求在功能上和算法上均封装并模块化,使量化投资平台具有

通用性和可扩展性,以期减少因所支持业务线不同而带来的重复开发时间和成本。

在架构上,我们力求依业务线来配置投资策略,依投资策略来配置交易信号,依交易信号来指导

提取数据,逐级封装,逐级扩展。

数据库-》信号库:全面使用机器学习和深度算法做为底层数据的建模核心,封装并接口到交易信

号生成模块,对每一个不同的投资逻辑建立多标的,多市场的信号表达,汇总形成底层信号库;

信号库-》策略库:封装信号库并接口到信号配置模型,针对每一个不同的投资逻辑,通过分配归

一化资金和风险在相应的多个信号上的权重,实现单一策略层面的最优收益风险比,输出最终策

略,并汇总形成中层策略库。

策略库-》产品:再次封装策略库并接口策略配置模型,针对具体投资产品的不同资金,风险,收益

和流动性要求,分配归一化权重到待选的策略子集和上,输出针对该具体产品的策略配比。

产品-》回撤平台:若同一业务线或同一客户单位有多个产品同时运行,再封装产品并接口到历史

回撤模型和实盘监测模型。

具化在功能上,我们强调:

强内生关联结构的高维度数据建模;

系统性产生交易信号的量化模型;

策略级信号配置的投资模型。

具化在算法上,我们重点放在:

机器学习和深度学习算法;

高维度非平稳时间序列算法;

带约束的随机优化算法。

例三:以下以股票类信号库,策略库,和产品对接为例说明。

假设按以下5中投资逻辑开发出的策略库中包含:

-方向型的CTAtrendfollowing策略;

-价值发现型的Relative-value策略;

-风险溢价型的Shortvolatility;

-期现息差型的Forward-spotarbitrage策略;

-和统计套利型的Statisticalarbitrage。

每个策略应用到所辖相关市场上的多个标的,生成的相关信号库包含:

在50只大盘蓝筹股上生成的CTAtrendfollowing信号;

在15个细分行业的行业内龙头个股之间形成的配对相对价值信号(Relativevalue);

在5X5的行权价和行权期网格上形成的25个看空股指期权信号(Shortvolatility);

在不同近远期股指期货之间形成的3个息差信号(Forward-spotarbitrage);

在300只小盘股之间形成的若干类多因子统计套利信号(Statisticalarbitrage)。

在每种策略中,以预先选取的收益-风险Profile为目标,如无回撤管理的单纯Sharpratio目标,

又如给定Value-at-Risk阈值的年终预期收益为目标,对有限个同质信号进行权重配置的优化,

得出最终的5种单一策略。

以某私募自营业务为例,该单位预发行一个8亿规模,预期年化回报20%,预期年化波动率10%,

最大可容忍回撤3.5%,一年2次赎回窗口的多空加套利的股票产品。

考虑到资金规模大,可主配蓝筹方向性策略;

考虑到收益风险比较高,可加配中小盘统计套利策略;

考虑到最大回撤容限严格,可额外适配shortvolatility的做多看空期权策略,以增加内在对冲。

信号配置问题和策略配置问题理论上都是最优组合问题:给定总体预期收益和风险度量约束,给

出资金权重的精确动态分配。

5.策略与信号开发

策略与信号是量化投资的核心技术,属行业中最稀缺最保密也最不分享的部分。量化系统的搭建

高度依赖对数据的分析,对模型的科研,和技术实现的深度与细节。

在系统开发上,本课题将重点着眼于以下模块:

数据建模和信号生成模块

信号组合和策略配置模块

历史回撤和风控模块

交易成本和冲击成本模块

以下以均值回归策略为例,简述从实证数据分析和统计建模出发,如何逐层递进策略开发,为最

终采用深度学习做指导。

均值回归策略的最简模型可以是:以5分钟为历史窗口,计算z-score做信号,未来价格超过单

位方差以外建仓,回归零点时平仓。

但细化实施时,需逐层考虑以下细节:

标的数据的时间尺度:数据是Tick频率的,1分钟,还是每日(dailydata).在不同时间尺

度上,历史数据中表现出的persistence性质不同,persistence性质不同决定用什么标的

模型,标的模型不同决定了可预测的未来窗口的长度,和预测强度。

历史窗口:使用多长的历史数据计算z-score,决定价格序列在多久范围内具有平稳性,

不发生regimeswitch,需建模做平稳区间测试。

标的演化模型:z-score是非参数统计指标,并不描述价格演化过程,也不描述价与量的依

存逻辑,更无法提取数据间的自相关联和互相关联性质,也即不是真正意义上的标的量化

模型。可预测性来源于数据序列中时间上的persistence,需要检测persistence性质。

短程关联(Shortrangedependence)是瞬态persistence,长程关联(Longrange

dependence)具有Permanentimpact.。

信号的度量指标:方差指标仅适用于正态价格分布(若平稳),但实证价格数据即使平稳

也极少正态,多呈现重尾分布。更一般的表述是以不依赖分布的给定的阈值的Quantile

Level做指标。

建仓与平仓阈值选取:1个单位方差建仓还是1.2,回归零点平仓还是回归负0.5个方差。

开平仓的阈值距离越大,单次信号的胜率越高,但总体信号数目越少。需依收益风险的设定

为目标函数做优化。

风险约束:最简模型无波动性或回撤性风险约束。需添加波动率锚定阈值(Volatility

targeting),或Value-at-Risk下界,或ExpectedShortfall阈值。有限数据(Finite

sample)下的最一般的回撤约束(Drawdownconstrain)是学界开放问题(open

problem)。

校准模型所使用的数据维度和频率:最简模型使用的历史价格数据于信号同频率的。可从

考虑用高频高维度数据校准模型,输出中低频低维度预测信号。如使用全盘口tick尺度的

量价数据校准模型,降维降频输出分钟尺度的价格信号。

每一部分的性能提升都需更高要求的建模和算法研发。差距体现在可将一个原始0.6-0.7sharp

ratio的信号至1.2-1.3。

更进一步,研究单个信号的sharpratio提升的原理时需做以下分析:

方向型策略和回归型策略在原理上都需挖据历史数据中的persistence。

韧度不同于correlation(二阶矩意义下的非独立,线性相关),也不同于通常意义下

dependence(高阶矩意义下的非独立,非线性相关)。韧度是随机现象因在微观时间尺度

下有关联作用(线性非线性均可),在宏观时间尺度上的残留表现。

数学上,短程韧度(Shortrangepersistence)的产生机制一般都满足强大数定理。时间窗

口稍长韧度会被averageout。比如个随机变量相加,但很大时,persistence度量

以指数速率递减(Exponentialrateoftaildecay)。

表现该性质的模型一般在价格序列上具有先后线性相关性(Linearcorrelation),典型的模

型如ARMA类。

要产生长程韧度(Longrangepersistence),数学机制上不能满足强大数定理。如同

个随机变量相加,即使当很大,也不会averageout,要求persistence度量以幂速率递

减(Powerrateoftaildecay)。

学界研究表明,微观机制的核心要求是价格序列上存在激发机制(Excitingmechanism)。

单个资产的自激机理(Self-exciting)表现为一维的极值关联(Serialextreme

dependence),多个资产间的互激机制(Mutual-exciting)表现为n-维的极值关联

(Multivariateextremedependence)。

具有微观激发机制并能模拟一定的长程韧度的模型主要有三类:GARCH,fractional

BrownianMotion,和Hawkesprocess。

理解这个性质就定位了模型的什么特点是预测性提高提高的原因,进而有针对性的开发,

不具备该特性的标的不适合做预测信号。

开发基于神经网络的深度学习算法在实证上提取数据中的长短程韧度。

现实中,围绕同一标的的产品种类很多,有futures,有option,还有ETF;不同投资主体交

易同一标的策略也各异。在数据上的集中体现是,一个标的的各阶矩都会有的独立的风险

驱动因子(Independentriskfactors)。

标的若在价格上表现出具有短程或长程韧度,既有可能是因对市场参与者对标的走势的不

确定性集体增加,使得驱动价格波动性(Volatility)演化的风险因子出现了自激进而让价

格变得长程相关。

也可能是由于下行风险开始实现,使得价格左侧三阶矩(Leftskewness)出现了自激;或

更一般的,某特定阈值上的Quantile演化开始自激,从而导致价格长程相关。

短长程韧度在实证上的原因起源于微观演化过程因非线性聚合(onlinearaggregation)

效应在宏观尺度上表现。但对其做价格演化建模的基础可以有多种。

可以把标的价格建模成连续时间非连续价位(Continuous-timenon-continuousvalue)

的跳变过程((Jumpprocess),在跳变强度上(Jumpintensity)上引入self-exciting的机

制,如Hawkesprocess。

也可以把标的建模成离散时间连续价位(Discrete-timecontinuousvalue)的随机过程,

然后在不同阶矩(Moments)或不同阈值的分位数(Quantile)上引入自激模型,如

熟知的二阶矩自激的GARCH类模型,和跟一般的分位数自激的QuantileRegression

类模型,形成价格上具有不同外延距离的韧度模型。

分位数回归模型(Quantileregressionmodel)是机器学习和计量模型的今年热点,其

中开放性问题很多。其次,具有自激性质的高阶矩模型和分位数模型,迄今尚未见于文献。

与此同时,上述分析中未涉及全盘口数据中的量和价的相互依存关系,量价同时演化在学

界从来都是难点。

基于此,模型研发可不做概率统计建模,改用深度神经网络来描述量价相互依存条件下的

一般的nonlinearaggregation机制。这将是本课题的研发重点:开发基于深度学习方法,

挖据全盘口量价数据中的市场微观关联机构,同时应用基于随机梯度的高维度快数收敛优

化算法。


本文发布于:2022-08-01 17:01:48,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/falv/fa/82/50960.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26