Py学习  »  chatgpt

华泰 | 金工:ChatGPT能否用于预测股价变动?

华泰睿思 • 3 年前 • 1117 次点击  


核心观点

论文解读:ChatGPT能否用于预测股价变动?

2023年4月,佛罗里达大学的Alejandro Lopez-Lira发表了论文“Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models”。论文使用ChatGPT分析新闻标题对一只股票是利好还是利空,并预测次日股票回报,其表现优于传统模型。我们对论文的详细内容进行解读,供读者参考。


AI中证1000增强组合上周超额收益0.03%,今年超额收益2.54%

截至2023年4月21日,中证1000增强组合相对中证1000上周超额收益为0.03%,今年以来超额收益为2.54%。模型2018年初回测以来相对中证1000年化超额收益率为24.57%,年化跟踪误差为8.25%,信息比率为2.98,超额收益最大回撤为8.75%,超额收益Calmar比率为2.81。


GAT+residual模型上周超额收益0.38%,今年以来超额收益-1.97%

截至2023年4月21日,GAT+residual模型上周超额收益为0.38%,今年以来超额收益为-1.97%。模型2011年初回测以来年化超额收益率为15.23%,年化跟踪误差为5.90%,信息比率为2.58,超额收益最大回撤为8.26%,超额收益Calmar比率为1.84。


文本FADT_BERT组合今年绝对收益19.67%,相对中证500超额13.08%

截至2023年4月21日,文本FADT_BERT组合上周绝对收益-0.38%,今年以来绝对收益为19.67%,相对中证500超额收益13.08%。组合自2009年初回测以来年化收益率45.11%,相对中证500超额年化收益率34.98%,组合夏普比率1.56。


文本FADT组合今年绝对收益10.57%,相对中证500超额3.98%

截至2023年4月21日,文本FADT组合上周绝对收益-1.93%,今年以来绝对收益10.57%,相对中证500超额收益3.98%。组合自2009年初回测以来年化收益率42.44%,年化超额收益率32.94%,夏普比率1.44。


机构调研选股组合相对中证500上周超额收益0.32%,今年超额收益5.28%

截至2023年4月21日,机构调研选股组合相对中证500上周超额收益为0.32%,今年以来超额收益为5.28%。模型回测以来年化收益率为28.61%,相对中证500年化超额收益率为21.66%,信息比率为2.06,超额收益最大回撤为14.42%。


风险提示:通过人工智能模型构建选股策略是历史经验的总结,存在失效的可能。人工智能模型可解释程度较低,使用须谨慎。本报告对基金历史数据进行梳理总结,不构成任何投资建议。


正文

论文解读:ChatGPT能否预测股价变动?

2023年4月,佛罗里达大学的Alejandro Lopez-Lira发表了论文“Can ChatGPT Forecast Stock Price Movements? Return Predictability and Large Language Models”。论文使用ChatGPT分析新闻标题对一只股票是利好还是利空,并预测次日股票回报,其表现优于传统模型。


论文使用的数据包含两部分:

1. RavenPack提供的新闻标题。由于训练ChatGPT的数据截至到2021年9月,为了防止未来信息泄露,新闻数据的时间范围为2021年10月至2022年12月,总共5万多条新闻。

2. CRSP(Center for Research in Security Prices)的美股日频价格行情数据,用于评估模型的收益预测能力。


论文使用构造提问的方式利用ChatGPT分析新闻情感,下方图表为其中某条提问及回答的详细内容展示。



对于上图中的新闻,Ravenpack给出的情绪得分为-0.52 ,表明新闻情感被视为负面。ChatGPT 则认为新闻对于Oracle是积极的,其推理是罚款可能会提高投资者对Oracle保护知识产权能力的信心,从而可能导致其产品和服务的需求增加。这种情感上的差异强调了自然语言处理中上下文的重要性,以及在做出投资决策之前需要仔细考虑新闻标题的含义。


论文进一步将ChatGPT的回复转换为“ChatGPT分数”,其中YES映射为1,UNKNOWN映射为0,NO映射为-1,使用ChatGPT分数构建日频选股策略。如下图所示,ChatGPT(gpt)的分数与股票下一个交易的收益率呈现明显正相关,且表现优于对比模型gpt_1,gpt_2,bert和raven。




中证1000增强组合表现跟踪

华泰金工中证1000增强组合构建方法如下:

1. 因子:包含估值、成长、财务质量、技术、预期、深度学习因子等。

2. 因子合成模型:Boosting模型。

3. 组合构建方式:控制行业和市值暴露,个股权重偏离上限为1%,成分股权重占比为80%,周频调仓,交易费用为单边千分之二。


截至2023年4月21日,中证1000增强组合相对中证1000上周超额收益为0.03%,今年以来超额收益为2.54%。模型2018年初回测以来相对中证1000年化超额收益率为24.57%,年化跟踪误差为8.25%,信息比率为2.98,超额收益最大回撤为8.75%,超额收益Calmar比率为2.81。





图神经网络选股策略近期表现

华泰金工研报《人工智能55:图神经网络选股的进阶之路》(2022-04-11)将残差图注意力网络(GAT+residual)应用于中证500指数增强组合构建,我们将定期跟踪该模型表现。模型以半衰加权mse为损失函数,半衰期为0.75。组合为周度换仓,单次换仓单边换手率上限为15%,回测交易费率单边千分之二。选股因子、测试流程等细节请参见原文。


截至2023年4月21日,GAT+residual模型上周超额收益为0.38%,今年以来超额收益为-1.97%。模型2011年初回测以来年化超额收益率为15.23%,年化跟踪误差为5.90%,信息比率为2.58,超额收益最大回撤为8.26%,超额收益Calmar比率为1.84。








FADT选股组合近期表现跟踪

华泰金工研报《人工智能57:文本FADT选股》(2022-07-01)我们在分析师盈利预测调整的场景下对相关研报的标题和摘要进行情感分析,构建了forecast_adj_txt因子,并基于该因子的多头端基础股票池进行增强,构建top25的主动量化选股组合FADT(forecast-adjust-text portfolio)。


截至2023年4月21日,FADT组合上周绝对收益为-1.93%,今年以来绝对收益为10.57%,相对中证500超额收益3.98%。自2009年初回测以来年化收益率42.44%,相对中证500超额年化收益32.94%,组合夏普比率1.44。








文本FADT_BERT选股组合近期表现跟踪

华泰金工研报《人工智能62:再探文本FADT选股》(2022-10-28)中,我们对盈利预测调整场景下的文本因子进行升级,构建了forecast_adjust_txt_bert因子,并基于该因子的多头端基础股票池进行增强,构建top25的主动量化选股组合文本FADT_BERT(forecast-adjust-text portfolio BERT版)。


截至2023年4月21日,文本FADT_BERT组合上周绝对收益为-0.38%,今年以来绝对收益为19.67%,相对中证500超额收益13.08%。自2009年初回测以来年化收益率45.11%,相对中证500超额年化收益34.98%,组合夏普比率1.56。






机构调研选股组合表现跟踪

参考华泰金工报告《利用文本和反转改进机构调研选股》(2023.2.9),机构调研选股组合构建方法如下:

1. 将研报文本因子和一致预期EPS季度环比变化率因子标准化后等权合成,在每个调仓日剔除合成因子排名后10%的股票。

2. 在第1步筛选的股票中,计算过去60个交易日个股相对中证500的累积超额收益,在每个调仓日剔除超额收益排名前60%的股票。

3. 在第2步筛选的股票中,按照过去60个交易日调研次数排序选取前30只股票作为策略持仓,股票的权重为log(调研次数)。

4. 策略在每月第一个交易日以当日vwap价格调仓,交易成本为双边千分之三。策略基准为中证500。


截至2023年4月21日,机构调研选股组合相对中证500上周超额收益为0.32%,今年以来超额收益为5.28%。模型回测以来年化收益率为28.61%,相对中证500年化超额收益率为21.66%,信息比率为2.06,超额收益最大回撤为14.42%。






风险提示

通过人工智能模型构建选股策略是历史经验的总结,若市场规律改变,存在失效的可能。人工智能模型可解释程度较低,归因较困难,使用须谨慎。本报告对基金历史数据进行梳理总结,不构成任何投资建议。


相关研报

研报:《ChatGPT能否用于预测股价变动?》2023年4月23日

林晓明 S0570516010001 | BPY421

何康 S0570520080004 | BRB318

李子钰 S0570519110003 | BRV743


关注我们


华泰证券研究所国内站(研究Portal)

https://inst.htsc.com/research

访问权限:国内机构客户


华泰证券研究所海外站

https://intl.inst.htsc.com/mainland

访问权限:美国及香港金控机构客户
添加权限请联系您的华泰对口客户经理

免责声明

▲向上滑动阅览

本公众号不是华泰证券股份有限公司(以下简称“华泰证券”)研究报告的发布平台,本公众号仅供华泰证券中国内地研究服务客户参考使用。其他任何读者在订阅本公众号前,请自行评估接收相关推送内容的适当性,且若使用本公众号所载内容,务必寻求专业投资顾问的指导及解读。华泰证券不因任何订阅本公众号的行为而将订阅者视为华泰证券的客户。

本公众号转发、摘编华泰证券向其客户已发布研究报告的部分内容及观点,完整的投资意见分析应以报告发布当日的完整研究报告内容为准。订阅者仅使用本公众号内容,可能会因缺乏对完整报告的了解或缺乏相关的解读而产生理解上的歧义。如需了解完整内容,请具体参见华泰证券所发布的完整报告。

本公众号内容基于华泰证券认为可靠的信息编制,但华泰证券对该等信息的准确性、完整性及时效性不作任何保证,也不对证券价格的涨跌或市场走势作确定性判断。本公众号所载的意见、评估及预测仅反映发布当日的观点和判断。在不同时期,华泰证券可能会发出与本公众号所载意见、评估及预测不一致的研究报告。

在任何情况下,本公众号中的信息或所表述的意见均不构成对任何人的投资建议。订阅者不应单独依靠本订阅号中的内容而取代自身独立的判断,应自主做出投资决策并自行承担投资风险。订阅者若使用本资料,有可能会因缺乏解读服务而对内容产生理解上的歧义,进而造成投资损失。对依据或者使用本公众号内容所造成的一切后果,华泰证券及作者均不承担任何法律责任。

本公众号版权仅为华泰证券所有,未经华泰证券书面许可,任何机构或个人不得以翻版、复制、发表、引用或再次分发他人等任何形式侵犯本公众号发布的所有内容的版权。如因侵权行为给华泰证券造成任何直接或间接的损失,华泰证券保留追究一切法律责任的权利。华泰证券具有中国证监会核准的“证券投资咨询”业务资格,经营许可证编号为:91320000704041011J。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/154139