社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

高清『无码』!因子模型与机器学习

量化投资与机器学习 • 3 年前 • 713 次点击  

量化投资与机器学习微信公众号,是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据领域的主流自媒体公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者,连续2年被腾讯云+社区评选为“年度最佳作者”。


量化投资与机器学习公众号独家解读


量化投资与机器学公众号  QIML Insight——深度研读系列 是公众号今年全力打造的一档深度、前沿、高水准栏目。



公众号遴选了各大期刊前沿论文,按照理解和提炼的方式为读者呈现每篇论文最精华的部分。QIML希望大家能够读到可以成长的量化文章,愿与你共同进步!


今天跟大家分享一篇机器学习用于因子模型的论文,一句话概括文章的内容:


作者首先利用了几类机器学习的模型对多个因子进行降维(或者称为特征提取),再利用处理后的因子结合组合优化Minimum-Variance的框架进行组合构建。


首先,对原始因子处理的模型使用了以下五大类,只有第5种是跟深度学习相关的,为了行文一致性,我们后文都称为机器学习模型。


  • Principal component analysis 

  • Sparse principal component analysis

  • Partial least squares

  • Sparse partial least squares

  • Autoencoders


利用以上机器学习模型对因子进行处理后,通过时间序列线性回归计算出因子暴露及特质收益项,再分别得出因子收益的协方差矩阵及特质收益矩阵,并通过这两个风险矩阵结合组合优化模型确定组合权重。


文章内容本身很长,但作者利用滚动窗口把数据分为Training、Validation及Out of Sample,并结合基于Minimum-Variance的损失函数,这个整体的框架及步骤很有借鉴意义。这里把整个框架的步骤梳理出来跟大家分享,其他实证性的内容,请大家参考原论文。


需要注意的是,作者在文中采用的是基于时序的因子模型,也就是说,因子收益是已知的,如Fama-French的因子,因子本身代表组合的收益率。并不是如Barra体系下,截面回归中的因子暴露。所以回归时,求解的是因子暴露。



通过Training的数据求出因子暴露,并利用Training得到的因子暴露、截距及对应的机器学习模型参数,应用到验证数据中求得的风险矩阵。 


将验证数据中求得的风险矩阵,放到损失函数里,得到一组参数使用损失函数最小。这里的创新点就是巧妙的结合了训练数据与验证数据及损失函数。这正是我们可以借鉴的部分。


需要 论文 的小伙伴,请在公众号后台回复:


MLF

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/118434
 
713 次点击