100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 多因子选股系列2——因子有效性检验的方法

多因子选股系列2——因子有效性检验的方法

时间:2022-03-21 13:52:14

相关推荐

多因子选股系列2——因子有效性检验的方法

在上一期,我们罗列了各种各样的因子,接下来是多因子选股必不可缺的一个步骤,那就是判断因子的有效性。我们将在这探讨如何找到有逻辑意义并且能够有效的区分个股的因子,也就是因子值对于个股未来收益有一定的预测能力。

多因子的有效性检验一般基于两个方法:

1、相关性检验:计算同一时刻的个股的指标值和未来一段时间收益的相关性,再进行显著性检验,相关性越强,说明选股能力越强;

2、单调性检验:按照指标值大小对股票进行分组,从时间序列的角度观察各组的历史累计收益、信息比率、最大回撤以及胜率等。各组表现的优势组的胜率越高,单调性越强,说明指标的区分能力和选股能力越强。

但在使用这两个方法检验因子有效性的时候,需要注意以下几点:

1、尽量把整体区间分为几个区间(分为每月或者每季度)进行回归。以往有的研究会将几年的数据放在一起,整体进行回归,但我们更建议每月或者每季度进行一次回归,好处有两个: 1)减少单次回归的样本数量;

2)有利于观察指标的历史表现。

2、有些指标排序尽量做到按照行业内分组,而不单单是全市场分组。有一些基本面因子,如总市值、市盈率、ROE和ROA等,不同行业间有着天然的差异,可能不具有可比性,而且如果全市场分组,可能存在行业的显著偏离,因此全市场分组有效与指标在行业中性的情况下有效不是等同的概念。通过因子的考察,同时采用了行业内分组和全市场分组两种方式进行对比,会发现有的指标在行业内分组的效果更好。

3、采用加权最小二乘法回归,而不是简单使用最小二乘法回归。为了得到回归系数值,最常用的方法是采用最小二乘法进行参数拟合。传统的最小二乘法方便估计出一个线性回归系数,但其目标函数并不是一个稳健的统计量,容易受到异常样本值的影响。在多因子模型中,一些选股因子很可能会出现一些异常值,而这些异常值会对回归的模型参数产生较大影响。为了降低异常值的影响,我们可以使用加权最小二乘法(稳健回归)估计模型。稳健回归的主要思路是将对异常值十分敏感的经典最小二乘回归中的目标函数进行修改;例如,剔除一些异常值,或者降低其在目标函数中的权重。稳健回归就能够克服最小二乘回归因异常值而失真的缺陷,得出更为接近实际值的估计

4、在指标值回归的基础上纳入秩相关系数。这是因为指标与收益之间往往并不是线性相关的,而使用Pearson线性相关系数需要满足两个假设:

1)数据是成对地从正态分布中取得的;

2)数据至少在逻辑范畴内必须是等间距的数据。

如果这两条件不符合,一种选择就是采用Spearman秩相关系数来代替Pearson线性相关系数。秩相关系数是一个非参数性质(与分布无关)的秩统计参数,由Spearman在1904年提出,用来度量两个变量之间联系的强弱。秩相关系数又称顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。不管变量之间的关系是不是线性的,只要变量之间具有严格的单调增加的函数关系,变量之间的秩相关系数就是1,相同情况下,Pearson相关性在变量不是线性函数关系时,并不是完全相关的。

5、注意回归分析时存在多重线性问题。不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好、区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。