托特：北大系深度学习科班团队进军量化（策略篇）

来源：格上研究

托特在获取超额上有何不同？

托特团队有深厚的深度学习学术背景，并且自2016年起就将深度学习技术应用于量化策略的研究与开发，积累了大量独有的技术和经验，形成了以深度学习/机器学习+量价为核心，不断扩充各种基本面和另类数据进行多模态建模的因子库，在深度学习/机器学习技术的应用上走在业内前沿。

点击小程序查看完整文字版

在获取超额上，采用更多的信息来源是获取超额收益的重要方式。目前市场上各家量化管理人都在扩展自己的因子来源，托特也在这个方向上投入了大量精力和资源，在量价和基本面数据之外覆盖了如分析师、新闻舆情、专利、供应链等等多种另类数据。

另外，基于在深度学习等技术上的积累和对前沿技术的深入理解与掌握，托特在同时使用多类不同数据进行多模态建模方面进行了大量研究。通过合理设计的多模态模型，不仅可以挖掘出各类数据本身直接能够预测收益的信息，更能够挖掘到不同数据间相互作用产生的模式或是股票间或期货合约间深层的相关关系，从而获得更加丰富的收益来源。在这一方面托特仍将继续着力研发，不断充实策略。

模型过拟合问题如何解决？

此外，对于深度学习/机器学习技术来说，模型的鲁棒性（robustness）和过拟合问题非常容易影响到模型的稳定性和准确性。众所周知，由于金融数据存在信噪比低、样本分布可能变化等等问题，基于统计的模型往往容易出现过拟合现象，并且对于极端行情往往难以很好地应对。也就是说，并不是简单地将数据“喂到”模型中，模型的产出就能够简单地使用，这背后会有潜在的过拟合问题，可能数据的结果只能应用于过去，但对于未来并没有预测能力。

为尽量减少此问题，托特一方面借鉴学术界不同领域（如生物特征识别、自动驾驶等）的前沿研究成果，通过多种技术手段减轻这些问题。另一方面，托特遵循严格的逻辑驱动的研究范式，不仅仅以因子回测表现作为研究工作的评价标准，而是强调模型研发应该以一定的研究思想为起点，基于具体的因子设计逻辑进行建模，并通过实验验证模型实际工作方式和效果。通过这样的研究方法，可以最大程度地减少建模过程中对数据进行过拟合的可能性，从而得到更加多样、技术壁垒更高的alpha因子。

同时，单一的预测模型不一定能够每次都提供正确的预测，但组合不同频段，不同数据来源的多种模型，就相当于有上千个大脑做预测，胜率会比单个的高，如此就做到了不同收益来源结合。

点击小程序查看完整文字版

格上财富：十五年深度研究，甄选阳光私募、PE/VC、海外基金等高端理财产品，为您的资产增值保驾护航！