金融洞见:量化投资中被低估的“定价因子”

发布时间:2025-11-15  |   来源: 川总写量化

摘要:石川
摘要:很多人问我,搞量化是否学好数理和计算机就够了。本文给出我的回答。

1

经常有年轻人和立志转行量化的朋友问我一个问题:“做量化,是不是只要数理统计和计算机科学够强就行了?金融知识好像没那么重要,反正数据里会告诉我们一切。”

作为一名在量化行业摸爬滚打多年的人,我想提供一个不同的视角:在量化投资这个复杂的定价系统中,金融洞见,恰恰是那个最重要、却被普遍低估的“定价因子”。我们穷尽各种技术去寻找 Alpha,却常常忽略了,深刻的理解本身,就是最宝贵的 Alpha 来源之一。

在展开论述之前,需深刻理解金融市场数据的根本特性:信噪比极低,且数据生成过程不满足平稳性假设

这一特性,决定了量化研究与其他领域(如图像识别、自然语言处理)的根本不同。在图像识别中,一只猫的图片特征在多年间是相对稳定的;而在金融市场中,驱动资产价格的因素复杂多变,市场的“游戏规则”和参与者的行为模式会随时间演变。这意味着,任何纯粹的、无指导的数据挖掘,都极易在浩瀚的噪声中拟合出毫无意义的“幻影”规律,这些规律在样本外会迅速失效。

因此,在量化领域,无论是经典的计量经济学模型,还是前沿的机器学习算法,其成功应用都必须在一个更高的框架下进行——即金融学与经济学理论的指引(这也是我为什么那么推崇 Nagel 的那本《Machine Learning in Asset Pricing》)。理论,为我们提供了宝贵的先验知识。这些先验能帮助我们:

  • 约束模型:在参数估计时,将估计值引导至经济逻辑认为合理的范围内。

  • 指导特征工程:优先构建那些有坚实经济学解释的因子,而非盲目地组合数据。

  • 理解模型输出:当一个模型做出预测时,我们能从金融逻辑上判断其是否合理,从而避免做出荒谬的决策。

将金融数据视为一个纯粹的数据问题,试图仅凭算力“大力出奇迹”,往往是徒劳的。 唯有在金融理论的“灯塔”指引下,数理模型之“舟”才能在数据的噪声海洋中,找到正确的航向,做到事半功倍。

2

近年来,随着机器学习和大数据的兴起,一种强调“数据驱动”、“快速实验”的范式越来越流行。著名对冲基金 Winton 在其论述中,精准地描绘了量化研究的两种面貌,并将其概括为 “实验性”与“观测性”的路径分歧。理解这两种范式,能让我们更清晰地看到金融知识的核心价值。


图片


Winton 的框架系统性地呈现了当前量化领域的两种主流范式:

  • “实验性”范式:

    • 核心:组合成千上万个高夏普、低容量的信号。
    • 特征:数据驱动,不追求单一信号的可解释性;回测期较短,信号权重根据近期表现动态调整;是机器学习技术的沃土;对选择偏差的敏感性较低。
  • “观测性”范式:

    • 核心:组合 10 至 100 个低夏普、互不相关且高容量的信号。
    • 特征:假设驱动——先形成金融逻辑假设,再用数据验证;理解策略持仓逻辑至关重要,经济学或行为学原理能增强长期信心;依赖长期回测(理想情况下 30-40 年)以建立对信号性能及相关性的信任。

乍看之下,“实验性”范式似乎更“酷”,更符合技术极客的审美:算力至上,数据说话,“逻辑靠边”。这恰恰是“只需数理和编程”这一误解的温床。然而,正是在这条路径上,金融知识扮演着防止研究坠入数据窥探深渊的“导航仪”角色。

逻辑锚定:从“相关”到“因果”的桥梁

纯“实验性”研究允许“不需要理解算法为何交易”,但这建立在“任何单一信号权重很小且可快速终结”的前提下。这本质上是一种风险分散和快速迭代的工程思想。然而,如何判断一个信号是暂时失效还是永久性失效?如何科学界定实验的边界?

此时,金融知识所提供的逻辑先验至关重要。它能引导你优先在经济学直觉上更可能有效的领域(如价值、动量、质量)进行探索,而非盲目测试诸如“太阳黑子与股价”、“股票 ticker 是不是顺口和收益率”之类的关系。当面对一个回测优异但逻辑怪异的因子时,它赋予你理性判断的基石。缺乏金融知识的“导航”,再强大的算力也只是一台在噪声中盲目乱撞的挖掘机。

而在“观测性”范式中,金融知识的作用更是从“辅助”升级为“核心”,成为驱动整个策略生命周期的核心生产工具。

假设生成:洞见的源头与逻辑的锚定

在“实验性”范式中,假设可以源于数据本身;但在“观测性”范式中,一个强有力的、先验的金融经济学假设是研究的起点与逻辑的锚点。这个假设深深植根于:

  • 资产定价理论:引导我们探寻市场为何以及如何为“风险”定价,从而理解价值、动量等因子的经济学根基,而非视其为统计黑箱。

  • 公司金融与会计学:帮助我们穿透财务报表,构建真正反映企业“质量”或“困境”的指标,而非进行机械的比率组合。(说起“高质量”,我又有话不得不说;等我后面的文章再来唠唠。)

  • 行为金融学:为市场异象提供解释,例如投资者系统性反应不足或过度反应的机理,为动量或反转策略注入基于人类心理的稳固逻辑。

在此,金融知识的作用是为策略“注入灵魂”并“锚定逻辑”,确保所寻信号建立在市场可能持续存在的“无效性”或“风险补偿”之上。

组合构建:理解相关性、容量与风险的宏观视角

“观测性”范式要求信号具备“低相关性”和“高容量”。对这两点的深刻理解,远超纯统计范畴,直接触及金融核心。

  • 低相关性:不仅仅是根据历史数据计算而来的相关系数。它要求我们理解为什么不同资产或策略间的相关性会时变——这背后是宏观经济周期、货币政策、风险偏好等宏观金融理论的支撑。

  • 高容量:直接关联到市场微观结构和资产流动性的理论与实践。策略的容量上限由市场深度、广度及交易成本决定。缺乏此知识,可能构建出回测完美、实盘却无法实现的“纸上神话”。

值得注意的是,即便在“实验性”范式中,当试图将海量信号整合为实盘组合时,研究者也必须直面容量、交易成本与风险集中问题,完成从“数据科学家”到精通投资组合理论与资产定价的“基金经理”的角色转变。

Winton 将“观测性”范式的科学灵感归于医学、引力波探测等低信噪比领域,这绝非巧合。在这些领域,缺乏强大的理论先验,几乎不可能从噪声中提取真实信号。

  • 对抗选择偏差:在金融的低信噪比环境中,先形成基于金融理论的假设,再用数据验证,是抵御数据窥探偏见(data snooping)的黄金法则。这如同按图索骥,而非盲目掘金。金融知识提供了评判策略内在合理性的终极标尺。

  • 建立长期信心:策略在实盘中必然经历痛苦的回撤。若不明其盈利根源,极易在压力下放弃。反之,深刻理解其背后的风险溢价来源(如价值因子承载的困境风险),才能做出正确的决策。

因此,在“观测性”范式的全周期中,金融知识已超越辅助角色,成为最核心的生产资料和决策依据。它帮助我们提出正确问题,理性解读数据,并最终建立起对策略的长期信念。

3

在我们讨论了两种研究范式之后,我们或许可以从一个更现实的视角——个人职业发展——来审视这个问题。

短期来看,卓越的数理统计与计算机科学能力,是您踏入量化行业最硬的“敲门砖”和最可靠的“安全网”。它能让你迅速融入团队,负责因子挖掘、模型实现、回测引擎开发等具体任务。在这个阶段,你是一个价值极高的“执行者”。市场对这类人才的需求旺盛,你能凭借纯技术能力成为一名合格的、甚至非常优秀的“工具人”。

然而,长期来看,若想实现职业的跃迁,从“执行”走向“决策”,从“研究员”成长为“基金经理”或“合伙人”,金融洞见的重要性将无可替代地凸显出来。

这背后的逻辑在于:

  • 资源分配与方向决策:作为团队领导者,你需要决定“向哪里投入研发资源”。这个决策无法仅靠回测做出,因为它关乎对未来市场结构的预判。这需要你对经济周期、货币政策、市场生态有超越数据层面的理解与信念。

  • 策略的“信仰”与坚持:一个只懂模型代码而不懂其金融内核的经理,在策略大幅回撤时,很容易陷入自我怀疑。而一个深刻理解策略背后风险溢价来源的掌舵者,才能拥有“穿越低谷的信仰”

  • 创新与范式转移的感知:真正的创新往往不是来自对历史数据的穷举,而是源于对市场无效性的先验性洞见。这种能力,源于对金融学经典理论的深刻理解,以及对现实市场运行的持续观察与思考。

因此,可以说:你的技术能力让你不可或缺,但你的金融洞见让你无可替代。技术能力决定了你职业生涯的“下限”,而金融洞见则决定了你职业发展的“上限”。

4

优秀的量化机构,往往不是在两种范式中二选一,而是寻求其精妙的融合。我们可以用“实验性”范式的技术和流程,去高效地探索和验证海量想法;但同时,我们必须用“观测性”范式的金融逻辑和严谨性,去指导实验的方向、甄别结果的真伪,并构建具备长期生命力的核心资产。

对于个人而言,这条职业道路何尝不是如此?我们花费大量时间优化模型参数、提升计算效率,这都是在为已知的因子寻找更优的权重。但职业的跃迁,更来自于发现并为你策略库中那个名为“金融洞见”的关键因子赋予更高的权重。

量化投资是一场在非平稳、低信噪比的复杂环境中进行的科学探索。数理和编程提供了探索所需的精密仪器和强大动力,而金融知识则是指导我们探索方向、并解读探索发现的地图与诠释理论。

当整个行业都在算力与数据的军备竞赛中不断内卷时,不妨回归本源:为你自己的认知“定价”,深度挖掘“金融洞见”这个因子,它或许能为你带来下一个显著的策略 Alpha,以及职业生涯的终极 Beta。

当我们惊叹于某些经典因子(如价值、动量)历经数十年市场洗礼而依然有效时,我们惊叹的不仅仅是其统计上的稳健性,更是其背后金融逻辑的深刻与持久。

免责声明:入市有风险,投资需谨慎。在任何情况下,本文的内容、信息及数据或所表述的意见并不构成对任何人的投资建议。在任何情况下,本文作者及所属机构不对任何人因使用本文的任何内容所引致的任何损失负任何责任。除特别说明外,文中图表均直接或间接来自于相应论文,仅为介绍之用,版权归原作者和期刊所有。