量化回测陷阱大全
回测报告上年化 80%、最大回撤 5%,看起来像是发现了圣杯。上线三个月,亏了 30%。这个剧本在量化圈反复上演,原因几乎都一样:回测本身就是错的。不是代码有 bug,而是回测的假设、数据、统计方法里藏着系统性的陷阱,让你以为策略有效,实际上只是在欺骗自己。 这篇文章把量化回测中最常见的陷阱按类型拆开:数据陷阱、统计陷阱、执行陷阱、心理陷阱。每个陷阱给出错误写法和正确写法的代码对比,最后附一张自查清单。 ...
回测报告上年化 80%、最大回撤 5%,看起来像是发现了圣杯。上线三个月,亏了 30%。这个剧本在量化圈反复上演,原因几乎都一样:回测本身就是错的。不是代码有 bug,而是回测的假设、数据、统计方法里藏着系统性的陷阱,让你以为策略有效,实际上只是在欺骗自己。 这篇文章把量化回测中最常见的陷阱按类型拆开:数据陷阱、统计陷阱、执行陷阱、心理陷阱。每个陷阱给出错误写法和正确写法的代码对比,最后附一张自查清单。 ...
量化投资的核心工作之一是挖掘 Alpha 因子——找到能预测资产收益的信号。传统做法依赖研究员手工构造因子表达式,或者用遗传规划(Genetic Programming)等自动化搜索方法在算子空间里暴力枚举。前者依赖人的经验和直觉,效率低但因子可解释性强;后者效率高但产出的因子往往是一堆难以理解的算子嵌套,研究员很难判断它到底在捕捉什么逻辑。 AlphaGPT(论文链接)的思路是把大语言模型引入因子挖掘的流程,让 LLM 作为因子的生成器参与进来。后续的 AlphaGPT 2.0(论文链接)进一步引入了人机协作的闭环。 ...
做量化最怕的不是策略不好,是你根本不知道策略好不好。年化收益 30% 的策略,如果最大回撤 60%,大概率你拿不住。夏普比率 2.0 听起来很牛,但如果是靠极端行情下的几笔暴利撑起来的,Sortino 一算就露馅了。 量化交易指标不是用来装饰回测报告的,是用来帮你在上线之前,判断一个策略到底值不值得拿真金白银去跑。 ...
MEDUSA 是一个针对大语言模型推理过程的加速框架,核心创新在于引入多个解码头(Multiple Decoding Heads),在一次解码步骤中同时生成多个候选输出,大幅降低推理时间。 Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads ...
市盈率(P/E Ratio)是最常用的估值指标之一,反映投资者愿意为每单位盈利支付的价格。用 Python 的 yfinance 库可以很方便地获取这个数据。 ...
yfinance 是一个 Python 库,用于从 Yahoo Finance 获取金融数据。它可以下载历史行情、获取股票基本信息、分析趋势,操作简单高效。这篇教程会带你从安装到实际使用,把核心功能过一遍。 ...
D 盘突然消失是 Windows 用户偶尔会遇到的问题,原因可能是硬件连接、系统设置或分区丢失。这篇文章整理了常见的排查步骤。 ...
Windows 11 用远程桌面(RDP)连接时遇到黑屏,大概率是网卡驱动更新导致的兼容性问题。回滚网卡驱动通常能直接解决。 ...
在开始大模型创业之前,首先应该想清楚下面五个问题,否则人无远虑,必有近忧。 自ChatGPT面世以来,有两种趋势主导着初创公司和初创投资的世界,可惜这两种趋势都是错误的。首先,有一大批初创公司计划使用大模型(ChatGPT或GPT4)为已知问题提供更好的解决方案。这就像说他们正在拿一些预先烘焙的蛋糕之一,再在上面加点糖,就能使其更美味。其次,这些初创公司正在烘烤大量这些蛋糕,投资者已经开始关注糖本身的差异化——他们现在强调位于大模型之上的技术层的深度。最近一些成功融资的案例大多在宣扬糖本身拥有不同颜色、口味或质地。 ...
微软发布了Phi-2,这是一个拥有27亿参数的语言模型,展示了出色的推理和语言理解能力,在小于130亿参数的基础语言模型中表现出最先进的性能。在复杂的基准测试中,由于模型扩展和训练数据精选方面的创新,Phi-2能够匹敌或超越大约25倍更大的模型。 ...