Forecasting Intraday Volume in Equity Markets with Machine Learning机器翻译,仅供参考!可使用微信自带翻译功能自行翻译获取文献链接/翻译/pdf/文章解析请加入知识星球“量化前沿速递”文章概述
摘要
本文主要研究了使用机器学习模型预测股票市场日内交易量的方法,并探讨了其经济影响。研究发现,通过机器学习和考虑共同性,日内股票交易量具有很高的可预测性。此外,精确的日间预测为优化交易策略提供了重要见解。
引言
有效的投资组合实施需要理解交易量动态。交易成本与交易规模相对于市场交易量的比例有关。较高的市场交易量允许更激进的交易并隐藏交易意图,而较低的交易量则增加成本和风险。准确的日间交易量预测有助于优化订单调度,并改进成交量加权平均价格(VWAP)策略。
方法论
基准模型:CMEM
基准模型采用Component Multiplicative Error Model(CMEM),该模型将交易量分解为三个部分:日均成分、日内周期成分和日内非周期成分。CMEM通过广义矩估计法进行参数估计,以捕捉这三方面的动态变化。
训练方案
本文提出了三种训练方案:
1. 单资产模型(SAM):每个交易量预测使用单个股票的预测因子。
2. 聚类资产模型(CAM):利用集群内的预测因子增强模型,通过聚合邻居的预测因子来引入共享特征。
3. 通用资产模型(UAM):在一个模型中训练所有股票的数据,以识别并利用股票之间的共性。
模型
使用了线性和非线性模型,包括线性回归(OLS、LASSO、Ridge)、XGBoost 和 DeepLOBv(结合CNN和LSTM的神经网络结构)。
实验结果
通过实验验证,非线性模型(如XGBoost和DeepLOBv)在预测精度上显著优于线性模型。辅助预测因子(如买卖金额、执行的股份数量等)显著提升了模型性能。聚类资产模型(CAM)和通用资产模型(UAM)比单资产模型(SAM)表现更好,证明了股票之间存在共性。最佳模型(DeepLOBv)在UAM设置下的R²值达到了0.624。
应用
准确的日间交易量预测不仅降低了VWAP跟踪误差,还提高了被动订单的成交率。通过预测日内交易量曲线,可以在高流动性时段提交更多被动订单,从而提高成交率。
结论
本文通过聚类模型识别了日内交易量预测中的共性,并首次应用深度神经网络模型揭示了交易量预测中的非线性特性。此外,利用匹配引擎研究了流动性的时空连续性对执行结果的影响,展示了其经济利益。
未来工作
未来的研究可以进一步结合日内波动率以增强交易量预测,并探索更多有用的辅助特征。此外,时间空间上的交易量分布也值得关注,以提供更全面的预测视角。