Paper

FactorMiner 论文简读

公式化因子挖掘做到一定规模会撞上一堵墙：库里已经有几十个因子，新挖的候选 IC 不算差，但跟现有因子相关性总是超过阈值，admit 不进去。AlphaGPT、AlphaForge、AlphaAgent、QuantFactor REINFORCE 都在解决"怎么生成更多候选"，对"库越大越难加新货"的处理仍有限。 FactorMiner（A Self-Evolving Agent with Skills and Experience Memory for Financial Alpha Discovery，2026/02，arXiv 2602.14670）的核心思路：把因子挖掘流程封装成一个 agent skill，并维护一个 experience memory 记录"哪些方向已经撞墙、哪些模板还能复用"，让 agent 每轮挖掘都从过去的成功和失败里取先验。CSI500 上 top-40 因子的 IC 达到 8.25%，ICIR 0.77，对比 AlphaAgent 的 5.90%/0.46 是约 40% 的相对提升。 ...

QuantaAlpha：把因子挖掘当成轨迹来进化

AlphaAgent 那篇解决的是"LLM 挖出来的因子太像，加速 alpha decay"，用的是因子层面的正则化。QuantaAlpha（arXiv 2602.07085）的视角抬高了一层：与其在单次生成上加约束，不如把"假设→因子→回测"的整个 pipeline 看作一条 trajectory，然后在 trajectory 之间做变异和交叉。在 CSI 300 上用 GPT-5.2 拿到 IC 0.0472、ARR 4.68%、MDD 11.8%，跨市场零样本迁移到 CSI 500 和 S&P 500 还分别留下 40.28% 和 19.1% 的累计超额收益。 ...

AlphaAgent：用正则化探索对抗因子衰减

上一篇 AlphaGPT 解读留了一个开放问题：当所有人都用 LLM 挖因子，产出的因子能有效多久？AlphaAgent（论文链接，KDD 2025）直接回应了这个问题。它的核心观察是：LLM 生成的因子太依赖已有知识，产出的因子同质化严重，加剧因子拥挤，反而加速了 alpha decay。解决方案是在 LLM 因子生成的过程中加入三重正则化约束，逼迫模型探索结构上新颖、逻辑上自洽、复杂度可控的因子。 ...

AlphaGPT：用大模型挖掘量化因子

量化投资的核心工作之一是挖掘 Alpha 因子——找到能预测资产收益的信号。传统做法依赖研究员手工构造因子表达式，或者用遗传规划（Genetic Programming）等自动化搜索方法在算子空间里暴力枚举。前者依赖人的经验和直觉，效率低但因子可解释性强；后者效率高但产出的因子往往是一堆难以理解的算子嵌套，研究员很难判断它到底在捕捉什么逻辑。 AlphaGPT（论文链接）的思路是把大语言模型引入因子挖掘的流程，让 LLM 作为因子的生成器参与进来。后续的 AlphaGPT 2.0（论文链接）进一步引入了人机协作的闭环。 ...