规模因子(SMB)和价值因子(HML)计算方法
规模因子(SMB)和价值因子(HML)是法玛-弗伦奇三因子模型(Fama-French Three-Factor Model)中的两个核心因子,用于解释股票投资组合的超额收益。它们分别捕捉了“小盘股溢价”和“价值股溢价”的市场现象。
一、因子定义与逻辑
1. 规模因子(SMB - Small Minus Big)
- 定义:小市值股票组合收益减去大市值股票组合收益的差值。
- 经济含义:衡量小盘股相对于大盘股的超额收益(小盘股溢价)。理论上,小公司风险更高(流动性差、抗风险能力弱),因此需要更高的收益补偿。
- 计算逻辑:做多小盘股,做空大盘股。
2. 价值因子(HML - High Minus Low)
- 定义:高账面市值比(价值股)股票组合收益减去低账面市值比(成长股)股票组合收益的差值。
- 经济含义:衡量价值股相对于成长股的超额收益(价值溢价)。价值股(通常被认为“便宜”)因基本面风险或市场情绪被低估,长期看有均值回归的动力。
- 计算逻辑:做多价值股(高B/M),做空成长股(低B/M)。
二、详细计算方法(基于FF三因子模型标准流程)
计算通常基于全市场股票数据,按市值和账面市值比(B/M)双重排序分组。
第一步:数据准备(每年6月底)
- 确定样本:选取交易所所有普通股(如A股全部股票)。
- 计算市值(Size):使用每年6月底的股价 × 总股本。
- 计算账面市值比(B/M):
- 分子(Book Equity):使用上一年年末的股东权益(账面价值)。
- 分母(Market Equity):使用去年12月底的市值。
- B/M比率 = 上年末股东权益 / 上年末市值
第二步:分组(2×3独立排序)
在每年6月底(投资组合形成日),对所有股票进行独立双重排序:
- 按市值(Size)分组:
- 找到所有股票市值的中位数。
- S (Small):市值小于中位数的股票。
- B (Big):市值大于中位数的股票。
- 按B/M(价值)分组(在S组和B组内分别独立进行):
- 分别找到S组和B组内股票B/M的30%分位数(Low Breakpoint)和70%分位数(High Breakpoint)。
- L (Low):B/M ≤ 30%分位数 的股票(成长股)。
- M (Medium):30% < B/M ≤ 70% 的股票。
- H (High):B/M > 70%分位数 的股票(价值股)。
最终得到 2 (Size) × 3 (B/M) = 6 个投资组合:
- S/L (Small & Low B/M - 小盘成长)
- S/M (Small & Medium B/M)
- S/H (Small & High B/M - 小盘价值)
- B/L (Big & Low B/M - 大盘成长)
- B/M (Big & Medium B/M)
- B/H (Big & High B/M - 大盘价值)
第三步:计算组合收益(t年7月 至 t+1年6月)
- 从当年7月开始,每月计算这6个组合的市值加权收益率(以组合形成时的市值为权重)。
- 持续计算12个月,直到次年6月。然后在下一年6月底重新分组。
第四步:合成因子时间序列
规模因子 SMB:
对于每个B/M类别(L, M, H),分别计算小盘组合与大盘组合的收益差,然后取三者平均值。
公式:
SMB = (S/L - B/L + S/M - B/M + S/H - B/H) / 3含义:控制了价值属性后,纯粹的小盘股溢价。
价值因子 HML:
对于每个Size类别(S, B),分别计算高B/M组合与低B/M组合的收益差,然后取二者平均值。
公式:
HML = (S/H - S/L + B/H - B/L) / 2含义:控制了规模属性后,纯粹的价值股溢价。
三、计算示例(简化)
假设在某个月,6个组合的收益率如下(单位:%):
| 组合 | 收益率 |
|---|---|
| S/L | 1.5 |
| S/M | 2.0 |
| S/H | 2.8 |
| B/L | 1.0 |
| B/M | 1.4 |
| B/H | 1.9 |
计算该月的因子值:
SMB= [ (1.5 - 1.0) + (2.0 - 1.4) + (2.8 - 1.9) ] / 3
= [0.5 + 0.6 + 0.9] / 3
=0.67%
解读:该月小盘股整体跑赢大盘股0.67%。
HML= [ (2.8 - 1.5) + (1.9 - 1.0) ] / 2
= [1.3 + 0.9] / 2
=1.10%
解读:该月价值股整体跑赢成长股1.10%。
四、实务应用与注意事项
- 数据来源:学术研究通常使用肯尼斯·弗伦奇(Kenneth French)数据图书馆提供的现成因子数据(针对美国市场)。中国A股市场也有相应的CSMAR、Wind等数据库提供因子数据。
- 频率:因子通常计算为月度收益率序列。
- 模型回归:在分析基金或股票表现时,将其超额收益(Rt−Rf)对市场因子(Mkt-Rf)、SMB、HML进行时间序列回归,系数(因子载荷)即为对该风格的风险暴露。
- R−Rf=α+β1∗(Mkt−Rf)+β2∗SMB+β3∗HML+εR - R_f = α + β_1*(Mkt-R_f) + β_2*SMB + β_3*HML + εR−Rf=α+β1∗(Mkt−Rf)+β2∗SMB+β3∗HML+ε
- 局限性:
- 动态变化:小盘和价值溢价并非每一年都存在,有时会出现长期失效(如2010年代成长股长期跑赢价值股)。
- 市场差异:因子效应在不同国家(如新兴市场)的显著性和稳定性存在差异。
- 数据依赖:B/M比率依赖年报数据,存在滞后性。
总结
SMB和HML是量化投资和资产定价的基石因子。其核心计算思想是通过独立双重排序构建对冲组合,剥离出纯粹的“规模”和“价值”风险溢价。理解其构建方法有助于深刻洞察因子投资的本质,而非仅仅将其视为一个回归变量。
