从深度学习到大模型：一篇文章搞懂量化投资中的AI应用

本文深入探讨了人工智能（AI），特别是深度学习（DL）和大型语言模型（LLMs），在量化投资（Quant）领域的发展历程、应用现状以及未来前景，并以阿尔法策略（Alpha Strategy）作为典型案例进行详细分析。

一、量化投资概述：阿尔法策略的崛起与演变

量化投资作为金融行业的重要组成部分，正日益受到技术进步的推动。量化投资策略利用统计分析、优化技术和人工智能算法来识别并利用市场低效现象，从而获得超越市场基准的回报。其中，阿尔法策略因其强大的捕捉市场低效现象的能力以及与人工智能驱动的预测方法的高度契合性，备受关注。

1. 阿尔法策略的定义与目标

阿尔法策略旨在通过识别能够产生超额回报的投资机会来获取超越市场基准的收益。该策略通常包含两个部分：

阿尔法端: 专注于通过预测单个资产、板块或整体市场的趋势来生成超额回报。这些预测用于将资金配置到不同的投资工具中，以实现收益最大化。然而，阿尔法端面临着诸多挑战，例如：

资产价格预测需要处理高维、噪声数据以及复杂的模式。
投资组合配置需要在风险和回报之间进行权衡优化。

对冲端: 侧重于管理与市场走势相关的风险。其目标是减轻市场风险，确保阿尔法端产生的超额回报不会被侵蚀。对冲端通常采用对冲投资组合，例如股票指数期货或期权，同时尽量降低对冲成本。对冲端也面临着选择合适的对冲投资组合以及控制交易成本等挑战。

尽管阿尔法端和对冲端都旨在在控制风险的同时创造回报，但它们面临的挑战不同，需要不同的解决方案。本文主要关注阿尔法策略的阿尔法端，并讨论了最近利用深度学习技术和大型语言模型来解决阿尔法端挑战的研究工作。

2. 阿尔法策略投资的发展历程

阿尔法策略投资的发展历程可以概括为三个阶段：

(1) 早期阶段：基于人工标注的交易信号和传统统计模型

在早期阶段，研究人员主要关注对市场模式的传统统计建模，依靠个人研究人员的专业知识来识别有利可图的投资信号并开发相应的模型。然而，这种方法存在局限性：

金融市场具有复杂性，难以在模型中捕捉所有相关因素。
仍然严重依赖人类研究人员对交易策略进行评估和执行。

(2) 深度学习兴起：实现从数据处理到订单执行的端到端可扩展建模

随着该领域的成熟，深度学习的应用为量化投资开辟了新的可能性，特别是在阿尔法研究方面，深度学习已被证明能够有效识别内在模式。例如：

深度学习模型被用于分析空间互联性、长期时间依赖性和新闻情绪等因素，以预测价格走势和管理头寸。
深度学习擅长处理复杂的数据模式，其应用使得量化投资从数据处理到订单执行的整个流程实现了端到端可扩展建模。

然而，深度学习在量化投资中的应用也面临着挑战：

过拟合风险: 模型在训练数据上表现良好，但在应用于新数据时可能表现不佳。
可解释性和准确性: 需要进一步提高，以更好地理解和推理大量多模态数据。

(3) 大型语言模型时代：人工智能从预测走向自动化

近年来，大型语言模型（LLMs）作为量化投资领域的一股新兴力量迅速崛起，其发展迅速，应用潜力巨大，引起了广泛关注。LLMs 在理解和处理多模态数据方面表现出色，并具有自主处理大规模数据集的接收、理解、推理等复杂任务的潜力。

在当前的阿尔法策略主流研究中，LLMs 主要扮演两个角色：

预测器:

利用其强大的自然语言处理能力，从金融文本中提取情感、因果关系和潜在交易因素等。
一些研究将 LLM 生成的情感信号与传统的资产定价因素相结合进行回测，结果表明，LLM 生成的情感信号具有预测能力。
例如，ChatGPT 可以根据金融新闻标题将其分类为看涨、看跌或中性，并构建基于情感的交易信号，通过资产定价回归框架和交易模拟来评估其预测强度。

智能体:

一些研究已经开始探索将 LLM 作为智能体应用于量化投资，例如构建 LLM 驱动的量化智能体，将金融决策的三个阶段（数据预测、投资组合优化和订单执行）整合到一个连贯的过程中。
该智能体利用 LLM 分析各种数据源以预测股票趋势，然后使用优化算法分配资金，最后执行市场订单以实现交易。

然而，LLM 在量化投资中的实际部署仍处于早期阶段，其应用仍面临一些挑战：

与市场动态的错位: LLM 主要基于文本语料库进行训练，其对情感的解释主要基于语言线索，而非金融市场反应。
数值时间序列数据的表示: LLM 处理基于文本的标记，而不是连续的数字序列，因此金融数据必须重新格式化以适应 LLM 的推理框架。
实时决策的延迟: 零样本提示和上下文学习虽然使 LLM 能够跨不同的预测任务进行泛化，但这些方法通常会带来计算开销。

二、深度学习在阿尔法策略中的应用

深度学习已广泛应用于阿尔法策略的各个阶段，本节将系统分析深度学习如何用于增强传统阿尔法研究在每个子任务中的表现。

(1) 数据处理

原始数据:

金融市场不断生成具有各种形式的多模态数据，包括数值数据（报价数据、基本面数据）、关系数据（成对边、超边）、替代数据（文本、图像等）和模拟数据。
例如，报价数据包括蜡烛图和限价订单簿，基本面数据则来自财务报表，如资产负债表、损益表和现金流量表。

特征工程:

为了从原始数据中提取有意义的信息，研究人员使用从原始数据派生的属性，即因子（factors），从不同的金融角度描述资产，例如价值、规模、动量、反转、波动性等。
因子挖掘过程对应于金融数据的特征工程，包括特征构建、特征提取和特征选择三个步骤。
特征构建: 通过对原始数据的战略组合和操作，创建更具信息量的表示形式，即因子。
特征提取: 使用特征提取模型（例如编码器-解码器架构）来提取潜在表示或预测输出作为因子。
特征选择: 选择特征子集以减少维度，避免过拟合并提高模型性能，常用的方法有过滤法等。

(2) 模型预测

建模数据之间的相互依赖关系:

金融数据本质上具有时间和空间相关性，准确的建模可以提高预测准确性。
时间模式: 研究人员构建时间序列输入，并应用时间建模技术（例如 CNN、RNN、Transformer 等）来聚合连续时间步的信息。
空间模式: 研究人员采用空间建模技术，例如隐式方法（使用自注意力机制）和显式方法（使用图神经网络 GNNs）。
时空交互: 研究人员采用时空建模技术，将空间和时间信息融合在一起，例如解耦方法（分别编码空间和时间特征）和耦合方法（同时整合空间和时间信息）。

定义预测目标:

中间目标: 主要评估股票的未来价格走势，例如：

个体趋势分析: 将资产未来回报作为标签，可以建模为回归或分类任务。

相对排名: 关注资产在横截面框架内的相对位置，例如配对排名方法（评估资产对以确定未来的优越表现）和全局排名（优化预测与实际未来回报之间的相关性）。

最终目标优化: 直接针对最终投资组合头寸进行优化，例如：

分析一组资产作为单个样本，使用时空建模方法来解释时间序列趋势和资产间关系

输出通常包括多期投资组合头寸，并根据回报率、夏普比率等指标进行优化。

(3) 投资组合优化

传统方法:

投资组合优化始于马科维茨的现代投资组合理论，将最优投资组合生成公式化为二次规划问题。
后续方法，例如基于凯利标准的方法，旨在最大化多个时期的累积回报。
主要分为单期投资组合选择（关注马科维茨理论）和多期投资组合问题（关注累积回报最大化）。

基于学习的方法:

将深度学习纳入投资组合优化框架，以增强某些模块，例如：

改进动态: 例如，使用神经网络预测特定回报的分布，并计算其预期均值和方差，然后进行马科维茨优化。

改进估计器: 例如，使用神经网络预测回报和风险，并应用传统的投资组合优化方法生成最终头寸。

改进求解器: 例如，研究连续时间、连续动作和连续空间的投资组合优化问题，并推导出基于高斯策略的模型。

端到端投资组合生成:

一些研究使用深度神经网络将参数估计和投资组合构建结合起来，实现“端到端”效果。
强化学习模型在端到端投资组合优化领域取得了更好的市场表现，因为它消除了对复杂标签构建的需求，并允许更灵活的风险回报平衡。

(4) 订单执行

传统方法:

假设限价订单簿的动态（包括其固有动态和市场订单的影响）可以分析表示为以最低成本执行的问题。
该最优控制框架分为离散模型和连续模型，两者都旨在找到一种动态交易策略，在固定时期内执行交易，并具有反映成本和波动性组合的最优效用函数。

强化学习框架:

强化学习（RL）由于其在动态、顺序决策环境中的适应性，在优化订单执行方面非常有效。
强化学习任务组件与订单执行过程高度契合，例如：

状态: 执行过程中的市场变量，例如剩余时间和当前头寸。

动作: 交易过程的决策集，通常包括提交、修改或取消订单。

奖励: 与市场订单相关的交易成本和影响。

一些研究将 Almgren-Chriss 模型的解决方案适应于考虑特定当前市场微观结构的动态策略，并使用 Q 学习进行训练。
一些研究提出了基于深度 Q 网络（DQN）的强化学习算法，用于订单拆分。

三、大型语言模型在阿尔法研究中的应用

大型语言模型的发展为量化投资带来了重大突破，推动其从人工智能驱动走向人工智能自动化，其未来发展前景广阔。然而，与其他深度学习方法相比，其应用仍不够成熟，在某些子任务中存在局限性。

(1) 基于 LLM 的预测器

LLM 用于情感提取:

LLM 的出现彻底改变了文本数据在量化金融中的角色，改变了投资者提取洞察和生成预测信号的方式。
早期方法依赖于基本的词频分析和基本的情感评分，但缺乏处理大规模文本信息的计算能力。
LLM 的出现使得对金融文本进行更细致、更具上下文感知能力的文本分析成为可能。

基于嵌入的 LLM 分类器: 利用预训练模型（例如 BERT、RoBERTa 或 FinBERT）的词或句子嵌入作为金融文本的密集向量表示，并训练监督分类器将其映射到预定义的类别（例如看涨、看跌或中性）。

LLM 驱动的情感分类: 直接提示 LLM 生成情感分类，通过将金融新闻或收益报告纳入结构化查询来生成情感分类。

LLM 还可以用于构建金融文本中的关系表示，例如构建静态或动态的金融关系图谱，以捕捉市场变量之间的因果关系。

LLM 用于直接时间序列预测:

LLM 已被证明能够在零样本情况下执行时间序列预测，无需对数值序列进行明确训练。
一些研究探索了 LLM 如何解决传统深度学习架构在跨序列推理、多源数据融合和可解释性方面的挑战，从而实现更具上下文感知能力、可解释性和适应性的预测框架。
例如，GPT-4 的推理能力（特别是当使用链式思维（CoT）提示时）显著提高了预测准确性【168†source】。
一些研究将 LLM 应用到金融时间序列预测中，例如预测纳斯达克 100 指数成分股的走势，并结合零样本和少样本推理、指令微调以及多模态数据集成来提高预测准确性【168†source】。

(2) 基于 LLM 的量化智能体

LLM 用于直接因子生成:

LLM 可以直接生成预测因子，作为因子智能体，为交易模型中的特征工程提供了一种新方法。
例如，Alpha-GPT 引入了人机交互框架，用于量化投资中的因子挖掘【145†source】。

Alpha-GPT 利用 LLM 通过迭代对话帮助研究人员和交易员发现新的阿尔法因子，模型提出因子想法，根据人工反馈进行完善，并生成可执行的代码以实现。

这种交互式工作流程使得因子发现过程更加动态和适应性强，允许领域专家指导 AI 的推理，同时受益于其丰富的知识和模式识别能力。

一些研究探索了如何将 ChatGPT 和 GPT-4 定位为代理金融分析师来生成新的股票回报因子。

LLM 驱动的量化智能体架构:

LLM 驱动的金融智能体将金融决策的三个阶段整合到一个连贯的过程中：

TradingAgents: 引入了一种新颖的多智能体系统，用于金融交易，模拟交易公司的协作动态【155†source】。

FINCON: 引入了一种新颖的基于 LLM 的多智能体框架，用于金融决策，专注于单股交易和投资组合管理【170†source】。

预测智能体: 利用 LLM 分析各种数据源（例如基本面数据、价格-成交量数据、文本数据和多媒体数据）以预测股票趋势。

一些研究提出了基于 LLM 的多智能体系统，例如：

投资组合优化智能体: 使用股票预测来优化资金配置，考虑回报目标、约束和风险控制。

订单执行智能体:通过执行市场订单来实施这些配置，同时最大限度地减少市场影响带来的损失。

(3) 当前局限性及未来方向

基于 LLM 的预测器:

情感与市场情绪的错位: LLM 主要基于文本语料库进行训练，其对情感的解释主要基于语言线索，而非金融市场反应。

未来研究方向包括将 LLM 衍生的情感与金融市场动态保持一致，例如通过强化学习、跨模态注意力机制或对金融特定数据集进行微调。

数值时间序列数据的表示: LLM 处理基于文本的标记，而不是连续的数字序列，因此金融数据必须重新格式化以适应 LLM 的推理框架。

未来研究方向包括开发更结构化的数值时间序列数据嵌入，例如集成基于 Transformer 的数值编码器或创建专门的金融 LLM 标记化技术。

实时决策的延迟: 零样本提示和上下文学习虽然使 LLM 能够跨不同的预测任务进行泛化，但这些方法通常会带来计算开销。

未来研究方向包括探索轻量级、经过微调的 LLM 架构或混合模型，将 LLM 推理与低延迟数值模型（例如卡尔曼滤波器或传统时间序列回归）相结合，以提高实时响应能力。

跨公司关系的捕捉: 金融时间序列预测本质上是关系性的，市场走势不仅受单个公司历史价格的影响，还受其竞争对手、行业同行和宏观经济因素的影响。

未来研究方向包括探索基于图的学习技术，将 LLM 纳入关系嵌入，以编码股票间依赖关系。

基于 LLM 的智能体:

预测范式的挑战: 尽管 LLM 在自然语言处理方面表现出色，但在定量推理任务中存在明显的不足，例如识别精确的价格-成交量模式的能力有限。

一些研究建议将现有的深度学习模型作为工具集成到专门的 LLM 量化分析师智能体中，使用智能体作为生成和优化预测模型的控制中心。
一些研究探索了将 LLM 与分位数回归网络相结合的混合架构，为模型输出提供自然语言解释的同时，实现概率预测。

投资组合优化框架的偏离: 当前交易智能体主要关注交易单个资产，而对多资产交易和投资组合优化的研究明显不足。

一些研究建议将现有的投资组合优化技术作为工具集成到专门的 LLM 优化智能体中，使其能够调用这些方法，分析结果，执行决策，评估并自主迭代。
神经符号学方法也提供了一种有希望的方向，可以将 LLM 生成的股市论点转化为数学严谨的优化约束，同时保持机器学习模型的灵活性。

订单执行阶段的局限性: 大多数系统假设完美的流动性，忽略了限价订单簿的复杂动态以及大订单带来的巨大市场影响。

一些研究建议将先进的订单执行工具和市场微观结构模拟器与低延迟 LLM 推理模块集成在一起，使 LLM 交易智能体能够开发出复杂的执行策略，同时考虑市场影响和机会成本。

四、结论

量化投资，特别是阿尔法策略，作为金融市场的前沿技术，正受到越来越多的关注。本文对深度学习和大型语言模型在量化投资中的应用进行了深入、全面的回顾，涵盖阿尔法策略研究的数据、模型和整体流程的各个方面。在此基础上，本文探讨了深度学习在各个方面的变革性影响和性能提升。此外，本文还探讨了如何最有效地利用 LLM 作为预测器和智能体。最后，本文比较了量化投资模型不同发展阶段及其应用，总结了当前局限性，分析了主要挑战和复杂性，并讨论了一系列未来研究方向。

更多资源见星球，加入QuantML星球，与800+专业人士一起交流学习：

往期回顾

QuantML-Qlib开发版：

从深度学习到大模型：一篇文章搞懂量化投资中的AI应用

一、 量化投资概述：阿尔法策略的崛起与演变

二、 深度学习在阿尔法策略中的应用

三、 大型语言模型在阿尔法研究中的应用

四、 结论

一、量化投资概述：阿尔法策略的崛起与演变

二、深度学习在阿尔法策略中的应用

三、大型语言模型在阿尔法研究中的应用

四、结论