2025年金融时序预测新突破:Kronos模型在A股择时中展现33.9%收益率

大模型系列(5):大语言时序模型Kronos的A股择时应用
本篇文章的部分核心观点、图表及数据,出自中金公司于2025年10月18日发布的报告《大模型系列(5):大语言时序模型Kronos的A股择时应用》,如需获得原文,请前往文末下载。

在当今金融科技飞速发展的时代,金融时序预测成为了众多投资者和金融机构关注的焦点。以大规模语言模型(LLM)为代表的基础模型在自然语言处理和计算机视觉领域取得的成功,启发了时序基础模型(TSFMs)的诞生。TSFMs通过在海量、多样的时序数据上进行预训练,构建出通用且与任务无关的模型,能够以少量甚至无需额外训练的方式适应各种下游任务。这种零样本学习模式在金融领域具有重要意义,尤其是面对新上市的金融工具或数据记录有限的新兴市场时,传统模型常因数据稀疏而难以取得良好效果。然而,金融时序数据具有低信噪比、强非平稳性等特征,通用时序基础模型在金融预测中表现不佳。为解决这一问题,清华大学团队开发了专为金融K线数据设计的Kronos模型。本文将深入探讨时序基础模型的发展,以及Kronos模型在A股主要指数择时中的应用实践。

关键词:时序基础模型;Kronos;A股择时;金融预测;模型优化

时序基础模型的发展与挑战

近年来,基础模型在自然语言处理和计算机视觉领域取得了突破性进展,这推动了时序基础模型(TSFMs)的诞生。TSFMs的核心理念是在大规模、多样的时序数据语料库上进行预训练,构建一个通用、与任务无关的模型,该模型能够以较少甚至无需额外训练的方式适应各种下游任务。其根本优势在于泛化能力和迁移学习能力,通过在大量时间点上学习,模型能够捕捉普适性的时间模式、趋势和季节性规律。这种零样本学习模式让模型可直接在训练期间从未见过的新任务或新数据集上进行推理应用,无需任何额外的参数调整。

在金融领域,这种特性尤为重要。当面对新上市的金融工具或数据记录有限的新兴市场时,传统模型往往因数据稀疏而难以获得较好的训练效果。TSFM的构建主要围绕三大核心技术:模型架构、预训练策略和下游任务适配。当前主流的模型架构主要以Transformer为基础,也有部分团队探索更为轻量的新型模型架构。基于Transformer的模型利用自注意力机制来权衡序列中不同时间点的重要性,从而捕捉长距离之间的依赖性,其架构又可进一步分为编码器 - 解码器架构和仅解码器架构等。非Transformer模型如IBM的TTM模型采用基于多层感知机(MLP - Mixer)的轻量级架构,以实现更高的计算效率。

预训练是TSFM获取通用知识的关键步骤,常见技术方案可分为全监督方法和自监督方法,其中自监督方法是TSFM预训练的核心,包括生成式、对比式和混合式等常见策略。预训练完成后,TSFM需要适配到特定的下游任务,主要适配方法有零样本学习、全参数微调、参数高效微调和提示词工程等。目前,时序基础模型正处于快速发展阶段,不同的研究团队提出了多样的架构和方法,从模型架构上可分为基于Transformer的模型和基于非Transformer的模型,从应用领域上可分为通用模型和针对特定领域的专用模型。基于Transformer的通用模型如亚马逊Chronos将时序语言化,谷歌TimesFM采用基于补丁的策略,Salesforce Lag - Llama与Moirai分别是概率预测模型,清华大学Sundial代表原生连续值建模,卡内基梅隆大学MOMENT基于掩码预训练;基于Transformer的金融领域特化模型如清华大学Kronos面向金融K线图,凭借其领域特化的设计在多项任务中超越通用TSFM和非预训练基准模型;基于非Transformer架构的模型如IBM TTM是高效的MLP混合器;商业化模型代表如Nixtla TimeGPT是首个商业化的TSFM,以API服务提供,具有卓越的零样本推理能力。

Kronos模型:金融时序预测的新突破

与来自气象、交通或零售等领域的时序数据相比,金融时序数据具有低信噪比、强非平稳性等特征,因此应用于金融预测任务的通用时序基础模型往往表现不佳。为解决这一根本性的“领域错位”问题,清华大学团队开发了Kronos,这是一个专为金融K线数据设计的统一、可扩展的预训练框架。Kronos不追求宽泛的通用性,而是通过“领域预训练 + 微调”的范式,深度挖掘并理解金融市场。

Kronos的框架包含两个核心阶段:K线分词(K - line Tokenization)和自回归预训练(Autoregressive Pre - training)。在第一阶段,K线分词的目标是将连续的K线数据转化为离散的令牌序列。该部分包含特化分词器、分层量化和由粗到精的令牌结构三个核心设计点。Kronos设计了包含编码器和解码器的专用Transformer自编码器,编码器通过二元球面量化(BSQ)层将每个多维、连续的数据点映射为一个层级化的离散令牌,每个生成的令牌由捕捉市场宏观动态与主要结构的粗粒度子令牌和编码价格精细波动的细粒度子令牌组成,这种结构确保了令牌内部信息组织的有效性,为后续的语言模型预训练奠定了基础。

在第二阶段,获得离散的令牌序列后,Kronos采用一个仅解码器的Transformer架构进行大规模的自回归预训练。该部分包含分层预测目标、步骤分解和数学表达三个核心设计点。其核心训练目标是基于历史令牌序列,自回归地预测下一个层级化令牌,体现“由粗到精”预测机制。模型先利用历史上下文信息通过Header预测出下一个时间步的粗粒度子令牌,再将其作为Query与来自历史上下文的Key和Value进行交叉注意力计算,最后通过另一个Header在给定宏观趋势的条件下预测出细粒度子令牌。数学上,将单个令牌的预测概率分解为两个条件概率表达式的乘积,模型先生成对市场主要趋势的预测,然后在此基础上进行精细化调整。

Kronos凭借其领域特化的设计和大规模的金融数据预训练,学习到深刻、泛化且鲁棒的市场表征。其训练集覆盖股票、加密货币、期货、外汇等多种资产类别和从1分钟到周线等7种不同的时间频率,训练集截止日期为2024年2月,验证集范围为2024年3月至5月,样本外从2024年6月开始。官方团队公布了迷你版、轻量版、标准版和超大版四个模型,前三个模型参数均已在Hugging Face开源可直接下载使用,模型的主要上下文长度为512,可支持包括低频和高频在内的任意频率K线数据预测。凭借领域特化的设计,Kronos在股价序列预测、波动率预测和合成K线生成等多项任务中,全面超越了目前通用的TSFM以及非预训练的基准模型,如在价格序列预测中,RankIC指标比领先的通用TSFM高出93%,比表现最好的非预训练专用模型高出87%;波动率预测中,平均绝对误差(MAE)降低了9%;合成K线数据生成方面,在生成数据的保真度和实用性方面提升了22%;在中国A股市场的回测中,由Kronos预测信号驱动的投资组合取得了最高的年化超额回报和信息比率,证明了其预测能力可以有效地转化为实际的投资收益。

Kronos模型在A股主要指数择时中的应用实践

为探究Kronos模型在A股主要指数择时中的应用,本节直接测试Kronos标准版模型在不同指数K线数据预测任务中的表现。待测指数集包括沪深300指数、中证500指数、中证1000指数、中证2000指数、国证成长指数和国证价值指数。评价指标为模型输出的预测序列和真实序列间的斯皮尔曼相关系数(Spearman)和绝对误差均值(MAE)。测试区间选择2025年初至9月底,以过去400个交易日的价量数据作为输入,预测未来5个交易日的价量数据,并根据收盘价的预测结果计算对应的评价指标,推理环节设置特定参数。

根据实验结果,可得到三个主要结论。整体预测结果与真实序列相关性都较高,直接预测第1个交易日后的收盘价表现最好,预测第5个交易日后的收盘价仍能保持和真实收盘价较高的一致性,平均相关性为0.78,绝对误差均值为6.17,但收益率的预测效果与价格序列无明显相关性。Kronos在大市值指数中的表现优于小市值指数,沪深300指数未来5条预测序列的平均相关性为0.92,绝对误差均值为90.28,相比之下中证1000指数未来5条预测序列的平均相关性为0.85,绝对误差均值为306.03。价值指数上的预测表现优于成长指数表现,价值指数未来5条预测序列的平均相关性为0.92,收益率序列的平均相关性为0.20,价格和收益率序列的绝对误差均值分别为129.03和0.019。

Kronos具有一定的价格预测能力,但应用到择时策略中能否获得相应的超额收益是其可否得到应用的关键。本节利用Kronos(base)预测的第5日收盘价来构建择时策略,以中证1000指数为交易标的,信号来源为外部每日滚动预测价格文件。策略以未来第5天的预测价格与当前收盘价比较计算预测收益率作为核心交易信号,当预测收益率超过1.0%时产生做多信号,交易执行采用T - 1日收盘后生成的信号,在T日开盘时建仓,每次开仓后持仓周期为固定5个交易日,仓位管理采用满仓操作。该策略通过严格的信号筛选和持仓周期控制,力求在市场中获得稳健的收益表现。但对于Kronos来说择时虽总体获得了正收益,实际上错过了2025年7月以来的大部分涨幅,原因是Kronos较为依赖前期的指数反转逻辑,进而造成在2025年指数持续上涨后一直未发出看多信号。

为解决上述问题,提出微调版Kronos的滚动择时系统。采用模型参数微调和滚动调整推理参数并行的方案,引导Kronos适应指数的价格分布和变化特性,并在推理环节对市场状态进行快速调整。具体而言,Kronos的参数微调环节使用中证1000指数成分股2010年至2022年的日度价量数据集作为微调数据集进行训练,2023年至2024年作为验证集,验证集用于判断模型微调过程中是否出现过拟合,并选择最优的模型参数,微调环节有特定参数取值。滚动搜参方案以1个月作为滚动测试集区间,以当前测试集前1个月的数据集作为验证集,对T、top_p和lookback_window三个参数进行网格搜索,保留Kronos在验证集上具有最高Spearman相关系数的参数组应用于对应的测试区间。

采用模型参数微调和滚动搜参的方案在中证1000指数上的预测结果相比Kronos标准版有明显提升,未来5日收盘价预测序列与真实序列间的相关系数由0.732提升为0.856,绝对误差均值也由435.2下调为275.5。沿用上文中提到的择时方法并利用滚动5日信号数据进行择时,对比优化版Kronos模型与通用基础模型Sundial的表现差异,实验结果表明优化版的Kronos模型具有相对最优的性能表现。模型2025年的收益率达33.9%,年化超额收益达到9%,相较于原方法提升20个百分点以上。定期微调后的模型在2025年7月以来对于模型趋势性变化的敏感度有效上升,更好地根据当前市场状态主动调整了预测风格,最终的策略收益率得到显著提高。

常见问题解答(FAQs)

时序基础模型有哪些主要应用领域?

时序基础模型主要应用于金融、气象、交通、零售等领域。在金融领域可用于股价预测、波动率预测等;在气象领域可进行天气数据预测;在交通领域可预测交通流量等;在零售领域可预测销售数据等。不同领域根据自身数据特点选择合适的时序基础模型架构和方法。

Kronos模型与其他时序基础模型相比有何优势?

Kronos模型专为金融K线数据设计,通过“领域预训练 + 微调”的范式,深度挖掘并理解金融市场的数据特征。与其他通用时序基础模型相比,它在金融领域的预测表现更优,在股价序列预测、波动率预测和合成K线生成等多项任务中,全面超越了目前通用的TSFM以及非预训练的基准模型,如在价格序列预测中,RankIC指标比领先的通用TSFM高出93%,比表现最好的非预训练专用模型高出87%。

微调版Kronos的滚动择时系统是如何提升择时效果的?

微调版Kronos的滚动择时系统采用模型参数微调和滚动调整推理参数并行的方案。模型参数微调使用中证1000指数成分股特定时间段的数据集进行训练和验证,选择最优参数;滚动搜参方案对关键参数进行网格搜索,保留最优参数组。通过这些方案,引导Kronos适应指数的价格分布和变化特性,对市场状态进行快速调整,从而提升了未来5日收盘价预测序列与真实序列间的相关系数,降低了绝对误差均值,最终提高了择时策略的收益率和年化超额收益。

相关深度报告

大模型系列(5):大语言时序模型Kronos的A股择时应用

大模型系列(5):大语言时序模型Kronos的A股择时应用

报告介绍:本报告由中金公司于2025年10月18日发布,共22页,本报告包含了关于大模型,大语言时序模型的详细内容,欢迎下载PDF完整版。