从苏格拉底的麦穗,到找对象的“37%法则”:数学如何教我们在不确定中做选择
你有没有遇到过这样的情况?
找对象时,太早确定关系,后来发现也许还有更合适的人;一直挑挑拣拣,又可能错过真正不错的人。找工作时,第一家公司给了 offer,要不要接?买房时,看了几套之后,是不是应该继续等?
这其实就是一个经典问题:
机会一个个出现,错过了不能回头,但如果一直等待,又可能最后一无所获。
苏格拉底“麦穗问题”讲的正是这个道理。弟子走进麦田,只能往前走,不能回头,只能摘一支最大的麦穗。有人太早摘,有人一直等,最后发现人生最难的不是选择,而是不知道什么时候停止比较。
这个故事在数学中有一个严格版本,叫做:
秘书问题(Secretary Problem)
或最优停止问题(Optimal Stopping Problem)
它能推导出一个著名结论:
先观察前约 37% 的选项,然后从后面选择第一个超过此前所有选项的对象。
这就是常说的37%法则。
一、为什么要学数学:因为数学不是算数,而是建模
很多人觉得数学离生活很远,似乎只是考试、公式和计算。但真正有价值的数学,往往不是告诉你一个具体答案,而是帮你把混乱的问题变成可分析的问题。
比如“找对象该不该继续等”这个问题,看起来很感性,但它背后包含几个关键变量:机会是依次出现的,每次只能根据当前信息判断,错过之后不能回头,目标是尽可能选到最好的那个,而未来又是不确定的。
这就是数学建模的第一步:
把现实问题抽象成结构清晰的问题。
当一个问题被建模之后,我们就可以分析它,而不只是靠感觉、经验或鸡汤。
二、把麦穗问题建模成数学问题
假设一共有nnn支麦穗,或者说有nnn个候选对象。
它们依次出现,你只能从左往右看。每看到一个,你可以选择它,也可以放弃它。但一旦放弃,就不能回头。
我们的目标是:
最大化选中全局最大麦穗的概率。
这里有一个重要假设:
这些麦穗出现的顺序是随机排列的。
也就是说,最大的麦穗可能出现在任何位置,每个位置的概率都是一样的。
三、一个自然的策略:先观察,再出手
最经典的策略是:
先观察前rrr个,不选择,只记录其中最大的那个;
从第r+1r+1r+1个开始,一旦遇到一个比前面所有都大的,就立刻选择。
这个策略非常符合人的直觉。
因为一开始你没有标准,所以先看一段时间,建立对“好”的判断。等你有了标准之后,再遇到明显超过标准的机会,就不要犹豫。
这其实就是:
先建立认知标尺,再做不可逆选择。
四、严谨数学证明:为什么是 37%?
设策略为SrS_rSr:
先跳过前rrr个,然后选择之后第一个超过前面所有候选者的对象。
我们计算这个策略成功的概率。
假设全局最优对象出现在第kkk个位置。
如果:
k≤rk \le rk≤r
那么它在观察阶段已经被跳过,策略一定失败。
所以只有当:
k>rk > rk>r
时,策略才有可能成功。
那么在k>rk>rk>r的情况下,策略什么时候会成功呢?
答案是:
在前k−1k-1k−1个候选者中,最大的那个必须出现在前rrr个观察样本里。
原因很简单。
如果前k−1k-1k−1个候选者中最大的那个出现在第r+1r+1r+1到第k−1k-1k−1个之间,那么策略会在遇到它时提前选择,从而错过第kkk个真正的全局最优。
而如果前k−1k-1k−1个候选者中最大的那个出现在前rrr个观察阶段,那么从第r+1r+1r+1个到第k−1k-1k−1个都不会超过观察阶段的最高标准。这样第kkk个全局最优出现时,就会成为观察阶段之后第一个刷新纪录的对象,策略成功。
在前k−1k-1k−1个位置中,最大者等概率出现在任意位置。因此:
P(成功∣最大值在第 k 位)=rk−1P(\text{成功} \mid \text{最大值在第 } k \text{ 位})=\frac{r}{k-1}P(成功∣最大值在第k位)=k−1r
而全局最大值出现在第kkk位的概率为:
P(最大值在第 k 位)=1nP(\text{最大值在第 } k \text{ 位})=\frac{1}{n}P(最大值在第k位)=n1
所以总成功概率为:
Pn(r)=∑k=r+1n1n⋅rk−1P_n(r)=\sum_{k=r+1}^{n}\frac{1}{n}\cdot\frac{r}{k-1}Pn(r)=∑k=r+1nn1⋅k−1r
整理可得:
Pn(r)=rn∑k=r+1n1k−1P_n(r)=\frac{r}{n}\sum_{k=r+1}^{n}\frac{1}{k-1}Pn(r)=nr∑k=r+1nk−11
令:
j=k−1j = k-1j=k−1
则:
Pn(r)=rn∑j=rn−11jP_n(r)=\frac{r}{n}\sum_{j=r}^{n-1}\frac{1}{j}Pn(r)=nr∑j=rn−1j1
这就是该策略的精确成功概率。
当nnn很大时,令:
x=rnx=\frac{r}{n}x=nr
则:
∑j=rn−11j≈∫rn1tdt\sum_{j=r}^{n-1}\frac{1}{j} \approx \int_r^n \frac{1}{t}dt∑j=rn−1j1≈∫rnt1dt
继续计算:
∫rn1tdt=lnn−lnr=lnnr\int_r^n \frac{1}{t}dt=\ln n-\ln r=\ln \frac{n}{r}∫rnt1dt=lnn−lnr=lnrn
由于:
x=rnx=\frac{r}{n}x=nr
所以:
nr=1x\frac{n}{r}=\frac{1}{x}rn=x1
因此:
lnnr=ln1x=−lnx\ln \frac{n}{r}=\ln \frac{1}{x}= -\ln xlnrn=lnx1=−lnx
于是:
Pn(r)≈x(−lnx)P_n(r) \approx x(-\ln x)Pn(r)≈x(−lnx)
接下来最大化函数:
f(x)=−xlnxf(x)=-x\ln xf(x)=−xlnx
对它求导:
f′(x)=−lnx−1f'(x)=-\ln x-1f′(x)=−lnx−1
令导数为 0:
−lnx−1=0-\ln x-1=0−lnx−1=0
得到:
lnx=−1\ln x=-1lnx=−1
因此:
x=e−1=1e≈0.3679x=e^{-1}=\frac{1}{e}\approx 0.3679x=e−1=e1≈0.3679
也就是说:
r≈ner \approx \frac{n}{e}r≈en
所以最优策略是:
先观察前约 36.8% 的对象,不选择;
然后从剩下的对象中,选择第一个超过此前所有对象的。
最大成功概率也约为:
1e≈36.8%\frac{1}{e}\approx 36.8\%e1≈36.8%
这就是“37%法则”的数学来源。
五、这个结论真正告诉我们的是什么?
很多人第一次看到这个结论会觉得失望:最优策略居然也只有 36.8% 的成功率?
但这恰恰是这个问题最深刻的地方。
它告诉我们:
在信息不完整、不能回头、必须实时决策的场景中,即使采用最优策略,也无法保证成功。
数学不是告诉你“人生一定能选对”,而是告诉你:
在不确定条件下,怎样做才是长期来看最合理的。
这也是为什么“37%法则”不是鸡汤。它真正强调的是两件事:第一,前期不要急着决定,因为你还没有建立判断标准;第二,一旦你已经有了足够多的观察,遇到明显超过历史标准的机会,就应该果断出手。
六、这个模型可以用在哪些领域?
秘书问题不仅可以解释麦穗故事,也可以解释很多现实场景。
1. 找对象
你不可能认识世界上所有潜在伴侣,也不可能无限等待。前期的经历帮助你理解自己真正看重什么,后期则需要在遇到足够好的人时停止比较。
2. 招聘
公司面试候选人时,也常常面临类似问题。太早录用可能错过更好的人,一直等待又可能让优秀候选人流失。
3. 找工作
求职者面对多个机会时,也不知道后面是否会有更好的 offer。此时就需要平衡探索和决策。
4. 买房
看房也是典型的不可逆选择问题。你需要先看一些房子建立市场认知,再判断某套房是否明显优于此前见过的选择。
5. 科研选题
科研方向同样如此。一直调研可能永远不开始,太早确定又可能进入价值不高的问题。好的研究判断,往往来自一定探索后的果断聚焦。
6. 投资与创业
投资项目、创业方向、商业机会也都具有类似结构:机会依次出现,信息不完整,错过之后未必还能回来。
七、但37%法则不是万能的
需要注意的是,秘书问题有很多理想化假设。
例如:
- 候选对象总数nnn是已知的;
- 所有对象的出现顺序是随机的;
- 只能选择一个;
- 只能比较相对好坏,无法知道绝对分数;
- 错过之后不能回头;
- 目标是选中全局最优,而不是选择一个足够好的人。
现实世界往往不完全满足这些条件。
比如找对象并不是只选“全局最优”,而是要考虑匹配、相处、价值观、稳定性和共同成长。招聘也不是只要最优秀的人,而是要岗位匹配、团队协作和长期发展。
因此,37%法则更像是一种思维模型,而不是机械公式。
它的价值在于提醒我们:
决策不是单纯追求完美,而是在探索和利用之间找到平衡。
八、除了37%法则,还有哪些常见策略?
秘书问题只是最优停止问题中的一个经典模型。现实中还有很多相关策略值得继续讨论。
1. 满意即可策略
不追求全局最优,而是设定一个满意标准,只要超过标准就选择。
这比“必须选到最好”更接近现实生活。
2. 阈值策略
提前设定一个分数线,候选对象超过某个阈值就接受。
例如找工作时,薪资、平台、地点、发展空间达到综合标准就接受。
3. 探索—利用策略
前期多探索,后期多利用已有经验做决策。
这在机器学习、推荐系统、强化学习中非常常见。
4. 多臂老虎机问题
你面对多个选择,每个选择的收益未知。你需要决定是继续尝试新选项,还是坚持当前看起来最好的选项。
这广泛应用于广告投放、推荐系统、临床试验和策略优化。
5. 动态规划策略
如果决策过程可以被拆解成多个阶段,并且每个阶段的选择会影响后续结果,就可以用动态规划来寻找最优策略。
6. 贝叶斯更新策略
随着新信息不断出现,我们不断更新对世界的判断。
现实中的很多选择,并不是一次性决定,而是在不断获得信息后逐步修正判断。
九、结语:数学不是让你变冷漠,而是让你更清醒
苏格拉底的麦穗故事之所以动人,是因为它讲的不只是麦穗,而是人生中的选择。
我们总是在有限的信息中做决定。我们无法回到过去,也无法提前看见未来。于是,选择就变成了一件既理性又遗憾的事情。
数学给出的不是完美答案,而是一种清醒:
先观察,建立标准;
再行动,停止无尽比较;
接受不确定性中的遗憾;
在有限信息下做长期最优的选择。
这也许就是数学最迷人的地方。
它不是替我们消除人生的不确定性,而是帮助我们在不确定性中,看见一种可解释、可分析、可优化的秩序。
因为很多时候,真正重要的不是“答案是什么”,而是:
我们如何把一个混乱的人生问题,变成一个可以被理解的问题。
