模板NEW量化选股策略多因子选股模型实践.docx
- 文档编号:12918061
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:12
- 大小:32.36KB
模板NEW量化选股策略多因子选股模型实践.docx
《模板NEW量化选股策略多因子选股模型实践.docx》由会员分享,可在线阅读,更多相关《模板NEW量化选股策略多因子选股模型实践.docx(12页珍藏版)》请在冰点文库上搜索。
模板NEW量化选股策略多因子选股模型实践
对外经济贸易大学
UniversityofInternationalBusinessandEconomics
SAS课程期末论文2:
量化选股策略:
多因子选股模型实践
小组成员:
陈健纬201620220533
张鸿越201620220655
杨丹201620220663
小组分工:
由张鸿越同学负责收集、查阅相关文献资料,选出候选因子,并根据衡量因子有效性步骤和检验标准对候选因子进行检验,筛选出若干有效因子。
由杨丹同学负责按照各有效因子指标大小对股票池中股票排序,采用打分法对每只股票打分。
由陈健纬同学负责按照股票总分对每只股票排序,选取股票池中前20%纳入量化选股组合,完成多因子选股模型的构建。
最后,组内三人共同进行模型有效性的检验,比较我们构建的选股组合的表现是否有效战胜大盘指数。
量化选股策略:
多因子选股模型实践
摘要
最近几年量化投资在我国逐渐兴起,量化选股策略随之不断丰富。
我组基于多因子选股模型,采用等权重法对因子进行赋权,利用上市公司财务数据和行情数据,结合统计检验的方法对选股模型进行研究实证分析,试图对多因子模型进行优化。
首先,本文详细阐述了量化选股的相关概念及理论。
其次,阐述了候选因子的选取和检验,包括候选因子的检验步骤和衡量因子有效性标准。
最后,建立综合评分模型,并对多因子选股模型进行检验,验证了模型的有效性。
在因子选取上,我们从估值因子、成长因子、资本结构因子以及技术面因子四类中选取了20个因子指标。
本文选取了2011年1月—2014年12月A股市场和创业板的上市公司的财务数据和行情数据,结合统计分析方法对20个候选因子的有效性进行检验。
通过对有效因子的筛选和检验从20个候选因子中选出10个表现较好的有效因子,包括存货周转率、营业利润增长率、成本费用利润率、净资产收益率(TTM)、销售净利率、有形净值债务率、净利润/营业总收入(TTM)、资产负债率、流通股月换手率、日流通市值。
在有效因子的基础上,利用股票打分法建立了综合评分模型,即等权重法对有效因子赋权建立多因子选股模型。
选取了2011年1月—2014年12月A股市场和创业板的上市公司的财务数据和行情数据对选股模型进行检验。
检验指标包括年化收益率、最大回撤、夏普比率。
通过实证分析发现,等权重赋权方法下的多因子选股模型所建立的选股组合是有效的,能够为股票投资者提供投资参考。
一、量化选股相关概念及结论
量化投资可以简单概括为将计算机科学技术和数学模型应用到投资理念和投资决策中的投资行为。
量化投资方法采用数学模型来反映人的思想和投资经验,利用计算机科学技术帮助人脑处理大量信息,从而总结出市场规律,然后建立能够反复使用和不断优化的投资策略,引导人们做出投资决策。
量化选股是指利用数量化的方法对股票池中的待选股票进行筛选,选出其中的优势组合,期望该组合可以战胜大盘指数,获取超额收益的选股过程。
一般包括对股票收益率有影响的的因素的确定、对因子赋权形成指标体系、按照选股指标对待选股票进行综合评分、选择综合排名靠前的一定比例的股票作为选股组合。
(一)多因子选股相关概念
多因子模型在实际应用中最广泛,基本思想是把影响股票回报率的各类因子作为选股标准,买入满足选股标准的公司股票,卖出不满足选股标准的公司股票。
影响股票回报率的因素有很多,既有宏观经济方面、公司经营方面又有市场因素,在对股票价格进行分析时需要综合考虑各个方面的因素,如果忽略了某些对股价有重要影响的因素,则很难对股价作出准确的估价。
在量化投资各种多因子模型的研究中,它们的核心区别主要包括三个方面:
对候选因子的确定方面,在权重的设置上以及如何根据因子指标综合得到最优的选股组合。
多因子选股组合的构建过程主要包括候选因子的确定、因子有效性检验、综合评分模型的建立及模型的评价和持续改进等步骤。
首先,选出候选因子,按照衡量因子有效性步骤和检验标准对候选因子进行检验,筛选出若干有效因子。
有效因子是指那些和收益率之间存在因果关系,能够将上市公司好坏明显区分出来的因子,我们通过这些因子可以选出具有较高预期收益的股票,这类因子就可以称为有效因子。
其次,按照各有效因子指标大小对股票池中股票排序,采用打分法对每只股票打分。
选择因子赋权方法(本文采用等权重法)对每个有效因子赋权,根据因子权重加权求和得到每只股票的综合得分。
再次,按照股票总分对每只股票排序,选取股票池中前20%纳入量化选股组合,完成多因子选股模型的构建。
最后,检验模型的有效性。
比较我们构建的选股组合的表现是否有效战胜大盘指数。
(二)多因子选股方法
一般来说,多因子选股方法包括股票打分法和回归法两种判断方法。
打分法就是根据对股票回报率有影响的因子指标进行打分,对每个因子赋权,然后依据各自的权重对股票得分进行加权求和,最后根据综合评分对待选股票进行筛选。
股票打分法相对来说比较稳健,受极端值的影响较小,根据不同的因子赋权方法可以将打分法分为静态加权打分法和动态加权打分法。
股票打分的方式包括综合评估法、回归得分法和逐步回归得分法。
我组采用的是综合评估法(compositescoremethod,简称CSM),即根据估值因子、成长能力、资本结构类、技术面因子等,对待选股票按照每个因子指标进行打分,然后按照加权求和得到综合分数对所有股票排序,选取得分最高的股票。
回归法就是用股票过去的回报率对候选因子进行回归分析从而得到回归方程,将最新的因子值带入回归方程得到一个对股票将来回报率的预测,最后以此为根据进行选股。
回归法的优点是在因子敏感性的调整方面比较及时,股票对因子敏感性可以不同,其缺陷是容易受极端值的影响,在某种市场行情下如果股票对因子敏感度的变化比较大,那么因子对股票将来回报率的预测结果是不可靠的。
二.实证分析
多因子选股模型在评价某一只股票的可投资性时,从各个不同方面进行综合考察,包括估值类因素、成长因子、资本结构方面、技术面因素等方面。
在增强模型的解释力度及提高模拟组合回报率时,选择越来越多的有效因子起到至关重要的作用,我组在建立模型的过程中选择了四大类候选因子对股票池中的股票进行筛选以及分析其可投资性。
(一)数据的描述
我组以深交所、创业板、上交所的所有上市公司为样本,去除停牌股票,使用前复权价格计算收益以排除除权除息影响,样本数据来自锐思数据库(RESSET),数据频率为月度,选取2011年1月---2014年12月共计4年作为样本期。
(二)因子的有效性检验
1.因子的选取与检验
我组主要从公司层面选取候选因子,公司层面因素源于公司的微观结构,与公司生产经营活动息息相关,从公司层面对股票收益率进行分析,包括公司相对估值法、公司财务分析、技术面分析以及一致预期方面。
相对估值法揭示了市场对于公司价值的评价,利用估值类因子可以判断一个上市公司的股价被高估还是被低估。
但是,市盈率和市净率会随着市场上比较大的波动而大幅变动,从而使得对公司价值的评估出现偏差。
本文选取的样本区间是整个股票市场,并没有在熊市和牛市以及平衡市下分别进行验证。
财务分析是上市公司分析中最为重要的环节之一,通过财务报表可以反映公司在某一段时间内生产经营活动综合状况。
财务分析使得投资者能够对公司经营状况更加了解,对公司未来发展趋势有一个更好的判断。
成长性比率在财务分析中非常重要,成长性是公司产生投资回报的源泉,反映公司在经营和扩展方面的能力。
资本结构类因子也是重要的财务分析指标,投资者在对上市公司进行投资时需要考虑其资产的安全性,而上市公司的资产安全性是通过其偿债能力来反映的。
我组选取的成长类因子主要包括营业利润增长率、成本费用利润率、净资产收益率、销售净利率、每股收益增长率、净资产收益率增长率、归属母公司的净利润增长率、净利润增长率。
技术面分析是通过统计过去发生的历史行情,得出指标来从而推断未来的市场行情进行。
其优点是无论长期还是短期都可以进行判断,过去已经发生的信息比较可靠,容易操作。
本文选取的技术面因子主要有流通股月换手率。
我们共选取了四大类因素:
估值因子、成长因子、资本结构因子、技术面因子。
具体如下表所示:
因子代码
因子名称
计算方法
totassrat
总资产周转率
总资产周转率=主营业务收入/平均资产总额
invtrtrrat
存货周转率
存货周转率=主营业务成本/平均存货,平均存货=(期初存货+期末存货)/2
opeprfgrrt
营业利润增长率
营业利润增长率=(本期营业利润/去年同期营业利润-1)*100%
intcvr
利息保障倍数
利息保障倍数=息税前利润/利息费用。
其中息税前利润(EBIT)=利润总额+财务费用,利息费用=财务费用+资本化利息支出
totprfcostrt
成本费用利润率
成本费用利润率=利润总额/成本费用总额*100%,成本费用总额=营业成本+期间费用,期间费用=营业费用+管理费用+财务费用。
roettm
净资产收益率(TTM)
净资产收益率=(净利润(TTM)*2/(期初股东权益+期末归股东权益)*100%
netprfrt
销售净利率
销售净利率=净利润/营业收入*100%
currt
流动比率
流动比率=流动资产/流动负债*100%
dbtanequrt
有形净值债务率
有形净值债务率=负债总额/(股东权益-无形资产-商誉)*100%
EPSgrrt
每股收益增长率
每股收益增长率=(本期每股收益/去年同期每股收益-1)*100%。
ROAgrrt
净资产收益率(摊薄)增长率
NprTORTTM
净利润/营业总收入(TTM)
净利润/营业总收入_TTM(NPToTORTTM)=净利润(TTM)/营业总收入(TTM)*100%
Qckrt
速动比率
速动比率=(流动资产-存货)/流动负债*100%
Equtotlia
股东权益/负债合计
NPPCgrrt
归属母公司的净利润增长率
Dbastrt
资产负债率
资产负债率=负债合计/资产合计*100%。
roe
净资产收益率(摊薄)
净资产收益率(摊薄)=净利润/期末股东权益*100%。
Netprfgrrt
净利润增长率
净利润增长率=(本期净利润/去年同期净利润-1)*100%。
MonTrdTurnR
流通股月换手率
本月内流通股日换手率之和
DtmvCNY
日流通市值-人民币计价
以人民币计价
数据处理流程:
(1)筛去停牌股票及B股和H股,在每月月末获取所有股票因子值;
(2)去除每一个因子值中极端值(<1%及>99%分位数);
(3)对每一列因子值进行标准化处理,使因子值分布位于[-1,1];
(4)根据日期和股票代码匹配每只股票在下月的月收益率;
(5)计算每个因子值对月收益率的相关系数;
(6)在每月月末分别对每个因子值分组,每个因子分成十组;
(7)选取每个因子值最高那一组股票,组内股票月收益率等权平均作为因子月收益率;
(8)选取每个因子值最高的股票组及因子值最低股票组,高分组内股票月收益率减低分组内股票月收益率,以对冲市场风险,然后对对冲后的收益率进行等权平均作为因子超额月收益率;
(9)选取有较高收益相关性,较高超额月收益率的因子作为有效因子;
基于以上步骤,我们得到以下因子的有效性评估,如下表所示(因子绩效一栏中*表示相关性显著但超额收益率为负,**表示相关性显著且超额收益为正):
因子
因子收益率
超额收益率
收益相关性
因子绩效
Totassrat
0.06877
-0.035487
-0.09242
*
Invtrtrrat
0.08908
0.013669
0.06749
**
Opeprfgrrt
0.09185
0.045206
0.08291
**
Intcvr
0.05453
0.020314
0.02399
Totprfcostrt
0.07672
0.029344
0.07787
**
Roettm
0.0537
0.013295
0.04425
**
Netprfrt
0.09921
0.054741
0.05266
**
Currt
0.06193
-0.011581
-0.00514
Dbtanequrt
0.09897
0.036691
0.04308
**
EPSgrrt
0.09955
0.058882
-0.01064
ROAgrrt
0.09907
0.057203
-0.01101
NprTORTTM
0.1028
0.05387
0.12448
**
Qckrt
0.06882
-0.006242
0.00412
Equtotlia
0.07025
-0.028992
0.03303
NPPCgrrt
0.09951
0.058462
-0.00537
Dbastrt
0.0947
0.021035
0.06685
**
roe
0.05169
0.00805
0.01962
Netprfgrrt
0.09868
0.055954
-0.00185
MonTrdTurnR
0.10744
0.016328
0.1077
**
DtmvCNY
0.15272
0.078394
-0.24694
**
从表中可得出,因子绩效为**的因子即为有效因子,我们在下文将使用因子进行选股回测。
2.样本回测
基于以上的的因子选取结果,我们进行了股票回测。
涉及到的具体处理要点,现说明如下:
由于ressetHisDB数据库故障,本小组只从锐思数据库上下载2011-2014年股票行情数据,并对2011-2014年进行多因子选股策略回测,数据处理步骤如下:
(1)下载股票日行情数据,保留股票代码,日期,前复权价格;
(2)生成2011-2014年每月最后一个交易日的日期数据集DayMonth;
(3)使用宏对每个月月末进行循环,获取全市场中经停牌筛选后的a股及创业板股票的因子值;
(4)对因子值进行极端值处理;
(5)对因子值进行标准化处理;
(6)对因子进行等全平均得出加权总分;
(7)根据总分排序,获取总得分最高的10%股票,作为本月目标股票;
(8)生成本月目标股票持仓单,结合步骤一中得到的行情数据集,得到本月买入股票的成本价格;
(9)进入下一次循环;
(10)获取上月持仓股票在本月的最新价格,计算本月收益;
(11)本月调仓时循环第3-8步处理过程;
(12)得到每个月选股收益后,根据日期匹配中证500月收益率;
(13)每个月将选股收益减去中证500月收益率,得到超额收益率;
(14)为便于比较不同月份的收益大小,在得到所有月份选股收益后,使用收益率累加而非累乘,得到累计超额收益序列;
回测结果图像如下图所示:
回测指标如下表所示:
年化收益率
最大回撤
夏普比率
选股收益
中证500
超额
三、结论与建议
本文采用了等权重法对多因子选股模型中有效因子赋予权重,利用A股和创业板上市公司从2011年1月到2014年12月间股票的财务数据以及行情数据,建立了多因子选股模型,实证检验表明所选组合能稳定战胜业绩基准。
在因子选取中,选择了基本面指标中估值因子、成长性、资本结构及技术面因素共四大类20个候选因子。
通过实证分析,筛选出10个有效因子。
最终得到的的模拟组合都能稳定战胜大盘指数,实证结果良好。
总的来说本文所建立的多因子选股模型比较稳健,能稳定战胜大盘指数。
但是本文所建立的多因子选股模型并非一劳永逸,在因子选取、有效因子赋权以及选股方法上需要不断完善。
随着时间的推移和市场变化,有些选股因子不再适合多因子选股模型,加入其他一些因子会使得模型表现更好,因此我们需要结合中国证券市场未来的新特点构建新的选股因子,增加对股票收益率解释力度,使得选股模型包含更多的信息,进一步提高多因子选股模型的选股能力。
多因子选股模型有自身的局限性,并不能说明一切。
投资者在进行投资时,需要综合分析宏观经济因素、行业发展动态、市场资产评估公司水平以及上市公司财务状况等对股票的投资价值做出客观、理性的分析。
多因子选股模型为投资者提供了参考和借鉴作用,究竟选择哪种投资方法,需要投资者经过仔细研究,根据自己对上市公司的分析或喜好来确定。
最终需要提交的文件包括:
纸质版:
1.实证分析报告,内容含有
1)问题阐述:
小组处理的问题,
2)数据描述,包括数据频率、时间段、数据来源、字段等
3)数据的处理步骤,可以通过思维导图的形式展现。
4)数据处理最终得到的结果数据集,数据集包含的变量,每个变量的含义,观测的个数等;
5)关键数据结果的分析
6)实证结论
7)小组成员的分工情况
数据处理报告的书写格式按照研究生期末论文的格式书写,分为期末论文1,期末论文2,每篇论文首页之后的第二页为小组分工,需要每位成员在上面手写签字。
2.论文附件:
论文附件1.数据处理的程序使用文档,说明每个程序干什么,并按照数据处理的过程排好顺序。
不要有问题的程序,只要调试好的程序;
论文附件2.初始数据集的名字、包含的变量以及变量的含义,数据处理最终得到的结果数据集的名字、数据集包含的变量,每个变量的含义,观测的个数等。
电子版:
1.上述纸质版报告的电子版
2.SAS程序,一个小组的一个选题的程序最终汇总成一个SAS程序文件,SAS程序应该从原始数据的读入开始,如果已经获得了原始数据的SAS数据集,应该从原始SAS数据集开始;
3.样本数据集:
附一个股票完整的所有原始数据,如果涉及指数,加上对应指数所有的原始数据,能够用于检验程序是否可以正常运行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模板 NEW 量化 策略 因子 模型 实践
![提示](https://static.bingdoc.com/images/bang_tan.gif)