利用机器学习预测股票市场日内交易量

Forecasting Intraday Volume in Equity Markets with Machine Learning

机器翻译，仅供参考！可使用微信自带翻译功能自行翻译

更多文献获取请关注公众号：量化前沿速递

获取文献链接/翻译/pdf/文章解析请加入知识星球“量化前沿速递”

文章概述

摘要

本文主要研究了使用机器学习模型预测股票市场日内交易量的方法，并探讨了其经济影响。研究发现，通过机器学习和考虑共同性，日内股票交易量具有很高的可预测性。此外，精确的日间预测为优化交易策略提供了重要见解。

引言

有效的投资组合实施需要理解交易量动态。交易成本与交易规模相对于市场交易量的比例有关。较高的市场交易量允许更激进的交易并隐藏交易意图，而较低的交易量则增加成本和风险。准确的日间交易量预测有助于优化订单调度，并改进成交量加权平均价格（VWAP）策略。

方法论

基准模型：CMEM

基准模型采用Component Multiplicative Error Model（CMEM），该模型将交易量分解为三个部分：日均成分、日内周期成分和日内非周期成分。CMEM通过广义矩估计法进行参数估计，以捕捉这三方面的动态变化。

训练方案

本文提出了三种训练方案：

1. 单资产模型（SAM）：每个交易量预测使用单个股票的预测因子。
2. 聚类资产模型（CAM）：利用集群内的预测因子增强模型，通过聚合邻居的预测因子来引入共享特征。
3. 通用资产模型（UAM）：在一个模型中训练所有股票的数据，以识别并利用股票之间的共性。

模型

使用了线性和非线性模型，包括线性回归（OLS、LASSO、Ridge）、XGBoost 和 DeepLOBv（结合CNN和LSTM的神经网络结构）。

实验结果

通过实验验证，非线性模型（如XGBoost和DeepLOBv）在预测精度上显著优于线性模型。辅助预测因子（如买卖金额、执行的股份数量等）显著提升了模型性能。聚类资产模型（CAM）和通用资产模型（UAM）比单资产模型（SAM）表现更好，证明了股票之间存在共性。最佳模型（DeepLOBv）在UAM设置下的R²值达到了0.624。

应用

准确的日间交易量预测不仅降低了VWAP跟踪误差，还提高了被动订单的成交率。通过预测日内交易量曲线，可以在高流动性时段提交更多被动订单，从而提高成交率。

结论

本文通过聚类模型识别了日内交易量预测中的共性，并首次应用深度神经网络模型揭示了交易量预测中的非线性特性。此外，利用匹配引擎研究了流动性的时空连续性对执行结果的影响，展示了其经济利益。

未来工作

未来的研究可以进一步结合日内波动率以增强交易量预测，并探索更多有用的辅助特征。此外，时间空间上的交易量分布也值得关注，以提供更全面的预测视角。