首页 / 学术活动 / 每周seminar

开放合作研究团队第84期Seminar学习讨论会

2025年4月28日晚上18:30-20:30,中山大学区域开放与合作研究院文献研读会议以线下的方式成功举行。本次学习讨论会由博士生梁韫捷同学分享文献《AI大模型赋能金融市场量化投资?基于另类数据与传统金融数据的研究》,参加学习讨论会人员包括博士生和硕士生等。

AI大模型赋能金融市场量化投资?基于另类数据与传统金融数据的研究

何勇  焦丽  杨艺  祝怡菲

一、摘要

1.全国统一大市场的战略意义

这篇论文基于 BERT 模型和 ChatGPT 构建了适用于中国股票市场的投资交易模型, 实现从财经新闻文本数据以及传统金融数据中获取交易信号。对于文本数据, 首先抓取每日的财经新闻将其与对应的股票代码相匹配。其次将新闻文本数据输入至训练好的 FTBERT (ffne-tuning BERT) 模型中, 得到每条新闻的情感倾向, 选择积极情感的财经新闻作为正的投资交易信号。对于传统金融数据, 借助 ChatGPT 的高级解析能力, 对中国股票市场的历史数据进行深入分析。通过调整 prompt 读取数据, 从而构造出用于股票投资的关键因子, 输出每日各股票的得分。最终根据不同数据类型得到每日各股票的投资交易信号, 并将其作为构建投资组合的依据, 构建有效的投资策略。实证结果表明, ChatGPT能有效判断文本情感倾向, 且经过微调后的大语言模型能有效助力量化投资, 为投资者带来超额收益。

二、引言

本文分析了传统的文本情感分析方法主要基于情感词典和传统的机器学习方法, 容易受到语言表达方式的限制, 且无法捕捉上下文信息。相比之下, 以 BERT (bidirectional encoderrepresentation from transformers) 和 GPT 为代表的大语言模型成为自然语言处理任务的重要基准模型。通过在大规模的无标签数据集上进行模型的预训练任务, 可以学习到通用的语言表示。这种表示能够捕捉到丰富的上下文信息, 并在多种下游任务中表现出色。现有研究中, 鲜有学者考虑使用 ChatGPT 来进行文本数据分析, 大部分学者仍采用 BERT 作为主要的分析模型, 但这往往需要手动标注数据。而 ChatGPT 的优势在于能够减少或消除手动标注的需求, 从而提高分析效率和减轻工作量。因此, 本文创新性地将 ChatGPT 与 BERT 模型组合, 提出 FTBERT (ffne-tuning BERT) 模型。此模型是在熵简科技发布的中文版开源FinBERT 模型基础上进一步微调得到, 将其应用到投资策略的构建中, 旨在探究 AI 大模型能否基于另类数据与传统金融数据构建出具有超额收益的投资策略, 赋能金融市场量化投资。

三、理论模型

模型1:基于 FTBERT 模型的文本情绪分析

本文以熵简科技发布的 FinBERT 模型为基础, 将 GPT-4 与 BERT 模型相结合, 构建了 FTBERT 模型做财经新闻情感分类任务。 首先让 GPT-4 判断每篇新闻文本的情感倾向,将其作为 BERT 微调过程中的标签集。 然后将带情感标签的数据集输入至 BERT 预训练模型, 再进行模型微调, 调整输出层为二分类任务, 输出最优参数。 于是给定一篇新的新闻文本,就可以使用该模型得到其情感倾向, 最终输出积极与消极情绪概率。

模型2:基于 ChatGPT 的选股因子生成过程

利用提示词来生成选股因子, 具体方法如下:

第一步, 读入数据。 使用 GPT-4 的代码解释器功能, 将传统金融数据文件传输至 ChatGPT的代码运行环境中。

第二步, 检查数据。 ChatGPT 会自行编写 Python 代码, 浏览数据的结构以及内容, 检查数据是否存在缺失值, 是否存在数据频率不一致的问题。

第三步, 数据预处理。 根据输入数据的特点, 采用适用于此数据类型的填充方式处理缺失值, 并将数据频率调整一致, 这一过程由 ChatGPT 自行判断得到。

第四步, 生成选股因子。 向 ChatGPT 的对话框输入生成选股因子指令。 随后使用该选股因子进行投资策略的回测, 如果回测结果优于大盘指数股, 则输出选股因子, 形成股票交易信号。 反之, 回到指令输入的部分重新生成选股因子。

四、实证分析

1.文本数据及其处理

本文借助财经数据接口包 Tushare 提取了 “东方财富网” 的新闻快讯, 将其作为本文的文本数据集; 从 Tushare 的 “沪深股票” 接口中提取了传统金融数据, 将其作为 GPT-4 读取的原始数据集。

数据清洗过程分为两步: 第一步, 根据财经新闻标题及内容匹配相应的股票代码, 本文研究的股票代码范围为非金融行业的 A 股市场, 并且排除了股票名称中含有 ST (special treatment)、*ST、SST、S*ST 及 PT (particular transfer) 等关键字段的股票; 第二步, 删除匹配结果不唯一的新闻, 确保数据一致性和分析的准确性。这意味着虽然一篇新闻仅对应一支股票, 但一支股票可以关联多篇新闻。清洗后的数据示例如表 3 所示。

最终, 从 “东方财富网” 按日度频率提取 2019 年 1 月 1 日 00:00 至 2023 年 7 月 31 日 24:00的财经新闻, 作为本文的文本数据源。提取的数据总量为 615,830 篇, 清洗后为 119,738 篇。


2.传统金融数据及其处理

对于传统金融数据, 本文利用 Tushare 的 “沪深股票” 接口得到 2019 年 1 月至 2023 年7 月的日度数据, 包括风险情绪类因子、估值与市值类因子、盈利因子与现金流因子、基本面类因子和技术类指标因子五类因子数据, 各类数据分项因子如表 4 所示。

这类数据通常是数值型数据, 本文将这类数据输入至 ChatGPT 的代码解释器中, 由 GPT-4 进行数据预处理的工作。 预处理过程分为三步: 第一步, 加载五个数据集并查看其基本信息, 目的是了解数据的结构与分布; 第二步, 分析数据集中的缺失值, 并填充缺失值; 第三步, 消除量纲的影响, 将数据标准化, 使每个因子数据的均值为 0, 标准差为 1。

3.文本数据交易信号提取

本文基于 GPT-4 和 BERT 模型实现财经新闻文本情感分析, 分为两个部分: 情感标签集的制作和 BERT 模型微调。

情感标签集的制作部分, 本文将财经新闻文本数据输入至 GPT-4, 由 GPT-4 判断其情感倾向, 得到带情感标签的数据集。输入的文本数据集经由Tushare 接口提取, 其中训练数据集时间跨度为 2019 年 1 月 1 日 00:00 至 2019 年 12 月 31日 24:00, 共 14,912 篇新闻。同时为精确评估 GPT-4 模型在判断财经新闻文本数据情感倾向 (积极或消极) 的效能与准确性, 本文将雪球网上的财经新闻情感分类公开数据集输入至GPT-4。此数据集共计 17,149 篇新闻数据, 包括日期、公司、代码、正/负面、标题、正文 6个字段, 其中正面新闻 12,514 条, 负面新闻 4,635 条。本节将此数据集的 10% 划分为验证集,其余部分用于模型训练, 将 GPT-4 的预测标签与真实标签作比较。同时将 GPT-4 与当今广泛使用的 SVM、CNN 和 XGBoost 这三种分类器对比, 结果如表 5 所示。


在 BERT 模型微调部分, 本文以熵简科技发布的面向金融领域的中文预训练语言模型FinBERT 为基础, 进行模型参数的微调。

本文的 FTBERT 模型在此基础上做了以下微调: 第一步, 确定数据集。本文使用从 Tushare 接口提取的 2019 年度 “东方财富网” 的新闻快讯。这些新闻文本数据经过 GPT-4 的情感分析处理, 生成一个带有情感标签的数据集。本文保留 10% 的数据集作为验证集, 剩余文本数据作为训练集。第二步, 参数训练。为了提高模型训练速度, 选择使用 GPU P100 进行加速运算。从PyTorch 导入经过预训练的 BERT 模型, 将训练集输入至此模型做参数微调的工作。在第5 个训练周期结束后模型收敛。最终模型训练得到最优参数, 学习率为 1 × 10−5、批量大小为 16、选用 AdamW 为优化器。训练集的准确率稳定在 99.962%, 验证集的准确率稳定在99.158%。同时, 本文计算了训练集和测试集上的召回率, 分别稳定在 99.961% 和 99.145%。

至此本文完成了 BERT 模型的微调, 微调后的模型记为 FTBERT 模型。将清洗后的文本数据输入至训练好的模型, 输出结果为积极情绪概率与消极情绪概率, 从而完成文本的情绪分类, 得到每日各股票的得分, 分别为 0 和 1。本文将文本数据传递的积极情绪作为正的投资交易信号。

4.金融数据交易信号提取

本文假定 ChatGPT 是一名资深的量化研究员, 拥有丰富的金融专业知识与中国 A 股市场的交易经验。ChatGPT 可以根据候选因子池 (如表 4 所示), 构造选股因子, 选股因子满足如下条件: 第一, 符合中国股票市场的市场运行规律, 不要随意杜撰捏造因子; 第二, 不要使用现有的金融指标直接作为选股因子, 要根据对中国股票市场的理解构造一个创新的因子; 第三, 不要使用单一的候选因子, 尽可能考虑多个维度的金融数据; 第四,假定投资者是理性投资者, 没有特定的股票偏好与行业偏好。

在多次试验后, 最终选取了 GPT-4 回复中高频出现的因子来构建综合性因子, 此因子由四部分构成, 分别如下:

1) 风险情绪与市场活跃度 (RSE): 市场情绪和股票的活跃度对股价的短期波动有显著影响。 活跃的交易和波动性往往表明投资者对股票的兴趣增加。 一般来说, 成交量、换手率、涨跌幅、量比、振幅这些指标能够从多个角度反映市场对股票的关注度和情绪变化。 本文通过分析成交量、换手率等, 获取市场活跃度和投资者情绪的信号。

2) 估值与市场价值 (VMV): 估值是投资决策的核心, 合理的估值反映了市场对未来收益预期的共识, 而低估或高估则可能指示未来股价调整的方向。 本文使用市盈率、市净率、股息率这三个指标评估股票的价格合理性, 可以帮助投资者判断股票是否被高估或低估。

3) 盈利能力与现金流 (PCF): 公司的盈利能力和现金流状况是其长期成功的关键。 盈利能力强、现金流稳定的公司更有可能在市场中保持竞争力, 为投资者带来持续的回报。 本文使用每股收益、净利润率、收入同比增长率这些指标反映公司的盈利能力和成长性, 以评估公司的基本面信息。

4) 技术动量 (TM): 技术分析是根据历史价格和交易量信息来预测股票未来走势的一种方法。 动量指标如相对强弱指标和乖离率可以帮助投资者识别趋势的强度和潜在的反转信号, 是短期或中期交易策略中常用的工具。

按照 IC 值(即信息系数, 指所选股票的因子值与股票下期收益率的截面相关系数, 通过 IC 值可以衡量因子的股票预测能力和实际结果一致性)大于 0.02 且因子相关性不低于 0.9 的原则筛选因子, 最终筛选出 10 个因子,分别是:

市盈率 (PE)、市销率 (PS)、市净率 (PB)、对数市值 (logMV)、流通市值 (circMV)、平均线指标 (MACD)、相对强弱指标 (RSI)、乖离率 (Bias)、顺势指标 (CCI)、随机线指标(KDJ)

上述因子与 GPT-4 选择的因子有 4 个相重合, 分别是市盈率 (PE)、市净率 (PB)、相对强弱指标 (RSI)、乖离率 (Bias) 这说明 GPT-4 选择的因子有一定的可靠性。

五、实证结果分析

在得到财经新闻文本数据和传统金融数据的得分后, 根据其与股票匹配结果, 分别得到对应股票的投资信号, 通过预测的投资信号建立股票投资组合并验证模型的有效性, 具体步骤如下:

步骤一: 设 t 为交易日, 收集 t 日开盘前一天中国股票市场相关的文本数据与传统金融数据, 并根据数据类型计算各自股票得分, 形成对应的股票交易信号。

步骤二: 分别对两种数据指定交易策略。 策略一: 对于文本数据, t 日投资情感倾向为正的股票; 策略二: 对于传统金融数据, 将股票按其得分从高到低依次排序, t 日等额投资交易信号为正且排名前 100 的股票。 策略三: t 日等额投资金融数据交易信号为正的前 100 支且财经新闻情绪为正的股票。

步骤三: 股票持有一天, 在 t + 1 日开盘后卖出, 重复步骤一和步骤二。

本文使用年化收益率、夏普比率、最大回撤、日均基点作为评价投资策略好坏的指标,原因如下:

年化收益率: 指投资期限为 1 年所获得的收益率, 计算公式如 (6) 式所示。 其中 pr 是年化收益率, pend 是投资策略最终总资产, pstart 是投资策略初始总资产

夏普比率: 指承担一单位风险所获得的超额收益率, 其公式如 (7) 式所示。 夏普比率为正值, 代表标的报酬率高过波动风险; 夏普比率为负值, 代表标的波动风险高过报酬率。 对于投资者而言, 这个比例越高, 投资组合越佳。 (7) 式中 E(Rp) 表示投资组合预期报酬率, Rf表示无风险利率, σp 表示投资组合的标准差。 本文考虑无风险收益率为 3.35%。

最大回撤: 是指可能发生的最大亏损幅度, 其值等于策略收益曲线上当前高点到回测期最低点的回撤幅度的最大值。 它是衡量投资策略风险的重要指标, 最大回撤数值越大, 说明投资者面临的风险越大。

日均基点: 1 个基点等于 0.01%, 用来表示金融工具的百分比变化。

本文计算了两种数据类型的交易信号, 并执行了对应的交易策略。 以 2021 年全年交易日为例, 共计 235 个交易日。 股票投资交易的结果总结在表 6。 对于文本数据, 本文构建的FTBERT 模型的年化收益率为 21.145%, 夏普比率为 3.115, 最大回撤为 1.199%, 各项指标均优于每日仅投资中证 500 指数股和仅由 GPT-4 打分的结果。 对于传统金融数据, 由 GPT-4构建的选股因子, 将其用于实际回测的年化收益率为 15.995%, 夏普比率为 0.826。 对于混合文本数据与传统金融数据类型下的交易策略, 根据 GPT-4 构建的选股因子, 每日投资得分最高的前 100 支且财经新闻情绪为正的股票, 结果显示, 市场情绪辅助因子可以显著提高投资策略的效果。 除此之外, 可以发现无论是 GPT-4 文本打分的结果还是构造因子的结果, 最大回撤值均较高, 超过了 10%, 这说明如果根据 GPT-4 的直接结果进行投资, 存在较高的风险性。 而本文将 GPT-4 的结果进行微调, 基于 FTBERT 模型的文本交易策略最大回撤仅有1.199%、混合数据类型下的交易策略最大回撤是 2.855%, 均明显低于 GPT-4 的最大回撤值,这说明本文构建的方法以及投资策略均具有优越性。

为了直观地展示本文投资策略相较于基准策略 (中证 500) 的优越性, 在图 4 中绘制了不同策略的累计对数收益率。在一年测试期内, 基于 FTBERT 模型的文本交易策略和混合数据类型交易策略的累计收益率均优于中证 500 指数股。对于文本数据交易策略, 其累计对数收益率随时间稳步增长, 对于混合数据类型指导下的交易策略, 其累计对数收益率随时间大幅增长, 远超其余策略, 因此该投资策略具有良好的稳定性和明确的投资价值。

六、稳健性检验

为评估本文构建的三种金融投资策略是否受特定时间和市场条件的影响, 本文分别获取不同年份的每日股票得分并执行股票投资策略的回测, 时间为 2020年1月1日至 2023年7月31日。投资回测收益率结果分别展示在表 7 至表 9。关于文本数据, 虽然各年份年化收益率有差异, 但总体来说, 都远超中证 500 指数股。充分说明本文构建的基于 FTBERT 模型的文本投资策略不受特定时间的影响。

关于传统金融数据, 经过多次调试指令, 本文构建了适用于传统金融数据的选股指标。为了验证 GPT-4 构造的选股因子是否存在稳健性, 本文测试了不同年份的投资效果, 结果展示在表 8。总体而言, 由 GPT-4 构建的因子各项指标优于大盘指数股 (中证 500), 年化收益率稳定在 10% 以上。需要注意的是 2022年四项指标表现不佳, 损失集中在第四季度, 可能受到后疫情的影响。

将文本数据与传统金融数据结合, 构建的投资策略结果如表 9 所示。综合得分在年化收益率、夏普比率以及日基点上优于两种单一策略。虽然最大回撤略高于 FTBERT, 但风险也控制在5%以内, 说明市场情绪的加入有助于捕捉投资交易信号, 能够从中国股票市场中获取股票收益。

为了确定哪种模型更适用于金融新闻文本的分析, 本节将 FinBERT 模型与其他几种主流的 BERT 变体模型做对比研究, 研究不同模型如何影响数据处理的效果。本文选用了精确率、准确率、召回率以及 F1 值作为模型评估指标, 测试结果汇总在表 10 中。实验数据显示,FinBERT 模型在整体性能上超越了其他比较模型。值得指出的是, FinBERT 和 RoBERTa两种模型均适用于处理中文文本数据。尽管在准确率方面, RoBERTa 略微领先于 FinBERT,但综合考虑所有评价指标, FinBERT 展现出更加卓越的表现。此外, 这一发现也间接证实了数据类型对于 BERT 系列模型性能的重要影响, 尤其是在处理针对特定语言 (如中文) 优化的模型时尤为显著。这些结果不仅展示了 FinBERT 在金融领域中文文本分析中的优势, 也强调了在选择适当的模型时考虑数据特性的重要性。

本文构建的投资交易策略, 以日度频率调整仓位, 属于高频交易。频繁交易会带来高交易费用, 直接影响净收益, 且对于长期投资效果和风险管理至关重要。不同市场和交易所往往有自己的费率结构, 包括佣金、交易费和其他相关费用。本文以 A 股市场为研究对象, 设定投资交易费率为0.15%。表 11 展示了控制交易费用对投资策略的影响。扣除交易费用后, 2021年的投资策略的年化收益率为 73.897%, 较扣除前降低了 24.647%。夏普比率由 8.328 降至6.199。扣除交易费用前的最大回撤为 2.855%, 扣除后为 3.772%。虽然交易费用一定程度上削减了部分策略收益, 但 74% 的年化收益率远远高于同期中证 500 指数收益率, 最大回撤在5% 以内, 属于低风险投资, 证明本文构建的投资策略仍具有较高的参考价值。

七、结论

本文实现了从财经新闻文本数据和传统金融数据中学习股票交易信号并构建投资策略,通过对中国股票市场的实际数据进行回测, 以评估构建的投资策略是否有效。 综合实证研究结果, 得出以下几点结论: 第一, 本文发现 ChatGPT 能够克服 BERT 等预训练模型需要手动构建标签集的局限, 从而显著降低了人工标注的成本。 第二, 本文从模型角度出发, 基于GPT 的解码器与 BERT 的编码器, 利用 ChatGPT 在人机交互方面的优势以及 BERT 在多重语义处理上的强大能力, 构建了股票投资交易策略。 在扣除交易费用后, 本文构建策略仍可以获得远超于中证 500 指数的超额收益率。 第三, 本文将大语言模型用于金融市场量化投资,为金融科技人员提供了规避潜在风险的指南, 并为金融机构在开发和训练自己的大语言模型方面提供了思路。

本次分享会为我院同学提供了一个学术交流的平台。我院将继续举办此类活动,以促进学术交流,推动学科发展。本次文献分享会在热烈的掌声中圆满结束,与会人员纷纷表示受益匪浅,期待未来能有更多此类学术交流的机会。





拟稿:梁韫捷

编辑:陈倩怡

审核发布:毛艳华