多因子模型是量化领域中应用最广泛的选股模型之一,基本原理是采用一系列的因子作为选股标准。
01 多因子模型的由来
1952 年,马科维茨提出了构建证券投资组合的新框架,该框架将不同证券的收益风险特征综合量化考虑,这就是被广为人知的现代组合理论(MPT)。
1964 年,夏普介绍了基于均值-方差理论基础的资本资产定价模型(CAPM)。
根据 CAPM 理论,资产收益值跟一个因子有关。系统性风险越高,贝塔值越高,要求的收益回报越高。但大量数据表明 CAPM 理论提供了一个对风险不完全的描述。
如果一个模型能够更多将系统性风险考虑在内,则对资产收益的建模将更为有效。因此诞生了多因子模型。
02 主要因子
现在的量化机构喜欢把多因子模型说的非常玄乎,其实用一句话说,因子就是选股条件。
市盈率可以作为一个因子,收盘价是一个因子,一条金融新闻也可以是一个因子。
那么,目前量化主要用到的因子是哪些呢?
一般都会有北向因子、成长价值因子、大小盘因子、动量因子。
03 因子有效性
IC(信息系数)、IR(信息比率)一般会作为检验因子有效性的度量指标。
IC代表的是预测值和实现值之间的相关性,通常用于评价预测能力(即选股能力)。
IR等于多个调仓周期的IC均值除以这些IC的标准差,所以IR兼顾了因子的选股能力(由IC表征)和选股能力的稳定性(由IC的标准方差的倒数代表)。
IC最大值为1,表示该因子选股100%准确,对应的排名分最高的股票,选出来的股票在下格调仓周期中涨幅最大;反之-1,则是反向指标。实际中对于多年的IC均值,当IC>0.03时,就可视为有效因子,当IC>0.1,就可以认为是很好的阿尔法因子了。当IC均值接近0,可视为无效因子。
IR大于0.5时,因子稳定获取超额收益的能力较强。
04 讲在最后
市场是千变万化的,但是模型毕竟是死板的。
所以很多量化挠破了头创新,最后发现结果差不多,甚至更差。如果回测过程中过度优化,可能就会存在过拟合的情况。
01 多因子模型的由来
1952 年,马科维茨提出了构建证券投资组合的新框架,该框架将不同证券的收益风险特征综合量化考虑,这就是被广为人知的现代组合理论(MPT)。
1964 年,夏普介绍了基于均值-方差理论基础的资本资产定价模型(CAPM)。
根据 CAPM 理论,资产收益值跟一个因子有关。系统性风险越高,贝塔值越高,要求的收益回报越高。但大量数据表明 CAPM 理论提供了一个对风险不完全的描述。
如果一个模型能够更多将系统性风险考虑在内,则对资产收益的建模将更为有效。因此诞生了多因子模型。
02 主要因子
现在的量化机构喜欢把多因子模型说的非常玄乎,其实用一句话说,因子就是选股条件。
市盈率可以作为一个因子,收盘价是一个因子,一条金融新闻也可以是一个因子。
那么,目前量化主要用到的因子是哪些呢?
一般都会有北向因子、成长价值因子、大小盘因子、动量因子。
03 因子有效性
IC(信息系数)、IR(信息比率)一般会作为检验因子有效性的度量指标。
IC代表的是预测值和实现值之间的相关性,通常用于评价预测能力(即选股能力)。
IR等于多个调仓周期的IC均值除以这些IC的标准差,所以IR兼顾了因子的选股能力(由IC表征)和选股能力的稳定性(由IC的标准方差的倒数代表)。
IC最大值为1,表示该因子选股100%准确,对应的排名分最高的股票,选出来的股票在下格调仓周期中涨幅最大;反之-1,则是反向指标。实际中对于多年的IC均值,当IC>0.03时,就可视为有效因子,当IC>0.1,就可以认为是很好的阿尔法因子了。当IC均值接近0,可视为无效因子。
IR大于0.5时,因子稳定获取超额收益的能力较强。
04 讲在最后
市场是千变万化的,但是模型毕竟是死板的。
所以很多量化挠破了头创新,最后发现结果差不多,甚至更差。如果回测过程中过度优化,可能就会存在过拟合的情况。