FactorMiner 论文简读

公式化因子挖掘做到一定规模会撞上一堵墙:库里已经有几十个因子,新挖的候选 IC 不算差,但跟现有因子相关性总是超过阈值,admit 不进去。AlphaGPT、AlphaForge、AlphaAgent、QuantFactor REINFORCE 都在解决"怎么生成更多候选",对"库越大越难加新货"的处理仍有限。 FactorMiner(A Self-Evolving Agent with Skills and Experience Memory for Financial Alpha Discovery,2026/02,arXiv 2602.14670)的核心思路:把因子挖掘流程封装成一个 agent skill,并维护一个 experience memory 记录"哪些方向已经撞墙、哪些模板还能复用",让 agent 每轮挖掘都从过去的成功和失败里取先验。CSI500 上 top-40 因子的 IC 达到 8.25%,ICIR 0.77,对比 AlphaAgent 的 5.90%/0.46 是约 40% 的相对提升。 ...

Posted on 2026-06-14 ·  In Quant ·  8 min read

QuantaAlpha:把因子挖掘当成轨迹来进化

AlphaAgent 那篇 解决的是"LLM 挖出来的因子太像,加速 alpha decay",用的是因子层面的正则化。QuantaAlpha(arXiv 2602.07085)的视角抬高了一层:与其在单次生成上加约束,不如把"假设→因子→回测"的整个 pipeline 看作一条 trajectory,然后在 trajectory 之间做变异和交叉。在 CSI 300 上用 GPT-5.2 拿到 IC 0.0472、ARR 4.68%、MDD 11.8%,跨市场零样本迁移到 CSI 500 和 S&P 500 还分别留下 40.28% 和 19.1% 的累计超额收益。 ...

Posted on 2026-05-20 ·  In Quant ·  10 min read

AlphaAgent:用正则化探索对抗因子衰减

上一篇 AlphaGPT 解读留了一个开放问题:当所有人都用 LLM 挖因子,产出的因子能有效多久?AlphaAgent(论文链接,KDD 2025)直接回应了这个问题。它的核心观察是:LLM 生成的因子太依赖已有知识,产出的因子同质化严重,加剧因子拥挤,反而加速了 alpha decay。解决方案是在 LLM 因子生成的过程中加入三重正则化约束,逼迫模型探索结构上新颖、逻辑上自洽、复杂度可控的因子。 ...

Posted on 2026-04-21 ·  In Quant ·  7 min read

AlphaGPT:用大模型挖掘量化因子

量化投资的核心工作之一是挖掘 Alpha 因子——找到能预测资产收益的信号。传统做法依赖研究员手工构造因子表达式,或者用遗传规划(Genetic Programming)等自动化搜索方法在算子空间里暴力枚举。前者依赖人的经验和直觉,效率低但因子可解释性强;后者效率高但产出的因子往往是一堆难以理解的算子嵌套,研究员很难判断它到底在捕捉什么逻辑。 AlphaGPT(论文链接)的思路是把大语言模型引入因子挖掘的流程,让 LLM 作为因子的生成器参与进来。后续的 AlphaGPT 2.0(论文链接)进一步引入了人机协作的闭环。 ...

Posted on 2026-04-10 ·  In Quant ·  5 min read