当前位置: 首页 > news >正文

从苏格拉底的麦穗,到找对象的“37%法则”:数学如何教我们在不确定中做选择

你有没有遇到过这样的情况?

找对象时,太早确定关系,后来发现也许还有更合适的人;一直挑挑拣拣,又可能错过真正不错的人。找工作时,第一家公司给了 offer,要不要接?买房时,看了几套之后,是不是应该继续等?

这其实就是一个经典问题:

机会一个个出现,错过了不能回头,但如果一直等待,又可能最后一无所获。

苏格拉底“麦穗问题”讲的正是这个道理。弟子走进麦田,只能往前走,不能回头,只能摘一支最大的麦穗。有人太早摘,有人一直等,最后发现人生最难的不是选择,而是不知道什么时候停止比较。

这个故事在数学中有一个严格版本,叫做:

秘书问题(Secretary Problem)
最优停止问题(Optimal Stopping Problem)

它能推导出一个著名结论:

先观察前约 37% 的选项,然后从后面选择第一个超过此前所有选项的对象。

这就是常说的37%法则


一、为什么要学数学:因为数学不是算数,而是建模

很多人觉得数学离生活很远,似乎只是考试、公式和计算。但真正有价值的数学,往往不是告诉你一个具体答案,而是帮你把混乱的问题变成可分析的问题。

比如“找对象该不该继续等”这个问题,看起来很感性,但它背后包含几个关键变量:机会是依次出现的,每次只能根据当前信息判断,错过之后不能回头,目标是尽可能选到最好的那个,而未来又是不确定的。

这就是数学建模的第一步:

把现实问题抽象成结构清晰的问题。

当一个问题被建模之后,我们就可以分析它,而不只是靠感觉、经验或鸡汤。


二、把麦穗问题建模成数学问题

假设一共有nnn支麦穗,或者说有nnn个候选对象。

它们依次出现,你只能从左往右看。每看到一个,你可以选择它,也可以放弃它。但一旦放弃,就不能回头。

我们的目标是:

最大化选中全局最大麦穗的概率。

这里有一个重要假设:

这些麦穗出现的顺序是随机排列的。

也就是说,最大的麦穗可能出现在任何位置,每个位置的概率都是一样的。


三、一个自然的策略:先观察,再出手

最经典的策略是:

先观察前rrr个,不选择,只记录其中最大的那个;
从第r+1r+1r+1个开始,一旦遇到一个比前面所有都大的,就立刻选择。

这个策略非常符合人的直觉。

因为一开始你没有标准,所以先看一段时间,建立对“好”的判断。等你有了标准之后,再遇到明显超过标准的机会,就不要犹豫。

这其实就是:

先建立认知标尺,再做不可逆选择。


四、严谨数学证明:为什么是 37%?

设策略为SrS_rSr

先跳过前rrr个,然后选择之后第一个超过前面所有候选者的对象。

我们计算这个策略成功的概率。

假设全局最优对象出现在第kkk个位置。

如果:
k≤rk \le rkr
那么它在观察阶段已经被跳过,策略一定失败。

所以只有当:

k>rk > rk>r

时,策略才有可能成功。

那么在k>rk>rk>r的情况下,策略什么时候会成功呢?

答案是:

在前k−1k-1k1个候选者中,最大的那个必须出现在前rrr个观察样本里。

原因很简单。

如果前k−1k-1k1个候选者中最大的那个出现在第r+1r+1r+1到第k−1k-1k1个之间,那么策略会在遇到它时提前选择,从而错过第kkk个真正的全局最优。

而如果前k−1k-1k1个候选者中最大的那个出现在前rrr个观察阶段,那么从第r+1r+1r+1个到第k−1k-1k1个都不会超过观察阶段的最高标准。这样第kkk个全局最优出现时,就会成为观察阶段之后第一个刷新纪录的对象,策略成功。

在前k−1k-1k1个位置中,最大者等概率出现在任意位置。因此:

P(成功∣最大值在第 k 位)=rk−1P(\text{成功} \mid \text{最大值在第 } k \text{ 位})=\frac{r}{k-1}P(成功最大值在第k)=k1r

而全局最大值出现在第kkk位的概率为:

P(最大值在第 k 位)=1nP(\text{最大值在第 } k \text{ 位})=\frac{1}{n}P(最大值在第k)=n1

所以总成功概率为:

Pn(r)=∑k=r+1n1n⋅rk−1P_n(r)=\sum_{k=r+1}^{n}\frac{1}{n}\cdot\frac{r}{k-1}Pn(r)=k=r+1nn1k1r

整理可得:

Pn(r)=rn∑k=r+1n1k−1P_n(r)=\frac{r}{n}\sum_{k=r+1}^{n}\frac{1}{k-1}Pn(r)=nrk=r+1nk11

令:

j=k−1j = k-1j=k1

则:

Pn(r)=rn∑j=rn−11jP_n(r)=\frac{r}{n}\sum_{j=r}^{n-1}\frac{1}{j}Pn(r)=nrj=rn1j1

这就是该策略的精确成功概率。

nnn很大时,令:

x=rnx=\frac{r}{n}x=nr

则:

∑j=rn−11j≈∫rn1tdt\sum_{j=r}^{n-1}\frac{1}{j} \approx \int_r^n \frac{1}{t}dtj=rn1j1rnt1dt

继续计算:

∫rn1tdt=ln⁡n−ln⁡r=ln⁡nr\int_r^n \frac{1}{t}dt=\ln n-\ln r=\ln \frac{n}{r}rnt1dt=lnnlnr=lnrn

由于:

x=rnx=\frac{r}{n}x=nr

所以:

nr=1x\frac{n}{r}=\frac{1}{x}rn=x1

因此:

ln⁡nr=ln⁡1x=−ln⁡x\ln \frac{n}{r}=\ln \frac{1}{x}= -\ln xlnrn=lnx1=lnx

于是:

Pn(r)≈x(−ln⁡x)P_n(r) \approx x(-\ln x)Pn(r)x(lnx)

接下来最大化函数:

f(x)=−xln⁡xf(x)=-x\ln xf(x)=xlnx

对它求导:

f′(x)=−ln⁡x−1f'(x)=-\ln x-1f(x)=lnx1

令导数为 0:

−ln⁡x−1=0-\ln x-1=0lnx1=0

得到:

ln⁡x=−1\ln x=-1lnx=1

因此:

x=e−1=1e≈0.3679x=e^{-1}=\frac{1}{e}\approx 0.3679x=e1=e10.3679

也就是说:

r≈ner \approx \frac{n}{e}ren

所以最优策略是:

先观察前约 36.8% 的对象,不选择;
然后从剩下的对象中,选择第一个超过此前所有对象的。

最大成功概率也约为:

1e≈36.8%\frac{1}{e}\approx 36.8\%e136.8%

这就是“37%法则”的数学来源。


五、这个结论真正告诉我们的是什么?

很多人第一次看到这个结论会觉得失望:最优策略居然也只有 36.8% 的成功率?

但这恰恰是这个问题最深刻的地方。

它告诉我们:

在信息不完整、不能回头、必须实时决策的场景中,即使采用最优策略,也无法保证成功。

数学不是告诉你“人生一定能选对”,而是告诉你:

在不确定条件下,怎样做才是长期来看最合理的。

这也是为什么“37%法则”不是鸡汤。它真正强调的是两件事:第一,前期不要急着决定,因为你还没有建立判断标准;第二,一旦你已经有了足够多的观察,遇到明显超过历史标准的机会,就应该果断出手。


六、这个模型可以用在哪些领域?

秘书问题不仅可以解释麦穗故事,也可以解释很多现实场景。

1. 找对象

你不可能认识世界上所有潜在伴侣,也不可能无限等待。前期的经历帮助你理解自己真正看重什么,后期则需要在遇到足够好的人时停止比较。

2. 招聘

公司面试候选人时,也常常面临类似问题。太早录用可能错过更好的人,一直等待又可能让优秀候选人流失。

3. 找工作

求职者面对多个机会时,也不知道后面是否会有更好的 offer。此时就需要平衡探索和决策。

4. 买房

看房也是典型的不可逆选择问题。你需要先看一些房子建立市场认知,再判断某套房是否明显优于此前见过的选择。

5. 科研选题

科研方向同样如此。一直调研可能永远不开始,太早确定又可能进入价值不高的问题。好的研究判断,往往来自一定探索后的果断聚焦。

6. 投资与创业

投资项目、创业方向、商业机会也都具有类似结构:机会依次出现,信息不完整,错过之后未必还能回来。


七、但37%法则不是万能的

需要注意的是,秘书问题有很多理想化假设。

例如:

  1. 候选对象总数nnn是已知的;
  2. 所有对象的出现顺序是随机的;
  3. 只能选择一个;
  4. 只能比较相对好坏,无法知道绝对分数;
  5. 错过之后不能回头;
  6. 目标是选中全局最优,而不是选择一个足够好的人。

现实世界往往不完全满足这些条件。

比如找对象并不是只选“全局最优”,而是要考虑匹配、相处、价值观、稳定性和共同成长。招聘也不是只要最优秀的人,而是要岗位匹配、团队协作和长期发展。

因此,37%法则更像是一种思维模型,而不是机械公式。

它的价值在于提醒我们:

决策不是单纯追求完美,而是在探索和利用之间找到平衡。


八、除了37%法则,还有哪些常见策略?

秘书问题只是最优停止问题中的一个经典模型。现实中还有很多相关策略值得继续讨论。

1. 满意即可策略

不追求全局最优,而是设定一个满意标准,只要超过标准就选择。

这比“必须选到最好”更接近现实生活。

2. 阈值策略

提前设定一个分数线,候选对象超过某个阈值就接受。

例如找工作时,薪资、平台、地点、发展空间达到综合标准就接受。

3. 探索—利用策略

前期多探索,后期多利用已有经验做决策。

这在机器学习、推荐系统、强化学习中非常常见。

4. 多臂老虎机问题

你面对多个选择,每个选择的收益未知。你需要决定是继续尝试新选项,还是坚持当前看起来最好的选项。

这广泛应用于广告投放、推荐系统、临床试验和策略优化。

5. 动态规划策略

如果决策过程可以被拆解成多个阶段,并且每个阶段的选择会影响后续结果,就可以用动态规划来寻找最优策略。

6. 贝叶斯更新策略

随着新信息不断出现,我们不断更新对世界的判断。

现实中的很多选择,并不是一次性决定,而是在不断获得信息后逐步修正判断。


九、结语:数学不是让你变冷漠,而是让你更清醒

苏格拉底的麦穗故事之所以动人,是因为它讲的不只是麦穗,而是人生中的选择。

我们总是在有限的信息中做决定。我们无法回到过去,也无法提前看见未来。于是,选择就变成了一件既理性又遗憾的事情。

数学给出的不是完美答案,而是一种清醒:

先观察,建立标准;
再行动,停止无尽比较;
接受不确定性中的遗憾;
在有限信息下做长期最优的选择。

这也许就是数学最迷人的地方。

它不是替我们消除人生的不确定性,而是帮助我们在不确定性中,看见一种可解释、可分析、可优化的秩序。

因为很多时候,真正重要的不是“答案是什么”,而是:

我们如何把一个混乱的人生问题,变成一个可以被理解的问题。

http://www.jsqmd.com/news/886671/

相关文章:

  • 【Java基础|Stream流:从基础入门到实战进阶,告别繁琐循环!】
  • 腾讯 Marvis 初级使用教程——从安装到上手
  • 基于ConvNeXt与多元高斯损失的NLSE参数联合估计方法
  • 终极指南:3分钟学会用EldenRingSaveCopier轻松迁移艾尔登法环存档
  • 【收藏级・2026 版】小白 程序员必看!打通金融大模型落地最后一公里
  • “烟雾飘散方向不对”是Prompt问题还是模型缺陷?2024 Q2 Midjourney烟雾物理引擎更新深度逆向分析(含3大未公开--stylize影响因子)
  • 企业数据安全方案有哪些:2026年从风险评估到落地的完整指南 - 华旭传媒
  • AMD Ryzen终极调试指南:用SMUDebugTool解锁隐藏性能的完整教程
  • 为什么阴干的衣服那么臭?原因竟然是……
  • 现在不看就亏!2024Q2语音合成价格窗口期将关闭:3类企业正紧急切换供应商
  • 高效实现百度网盘链接解析:技术架构与API调用深度解析
  • DeepSeek模型上线前最后1道关卡:生产环境级评估 checklist(含GPU显存泄漏检测、长尾请求P99延迟验证)
  • RTX51 Tiny内存冲突与ISD51调试器解决方案
  • 不以0开头的偶数集和奇数集
  • 2026年金华为餐饮企业提供SAAS收银系统的服务商综合分析与适配指南 - 万事通达
  • C#与Unity学习(26_05_24)
  • 【DeepSeek性能测试黄金法则】:20年专家亲授5大避坑指南与实测调优参数清单
  • 全国奢侈品回收流程、价格范围及市场现状究竟怎样
  • WaveTools深度解析:鸣潮玩家的专业性能调优与数据管理实战指南
  • 16告警处理:如何避免告警风暴?
  • 【Claude数据库设计辅助实战指南】:20年DBA亲授AI时代建模新范式,错过再等三年?
  • 超越向量检索:用 Graph RAG 构建具备推理能力的企业知识问答系统
  • 2026年家居定制观察:木饰面隐形门护墙板工艺解析 - 产品测评官
  • 历史建筑隐形门铃系统设计:物联网与智能交互的工程实践
  • 大模型开发中format_messages、invoke、format三种方法的对比
  • 搜维尔科技:Xsens动作捕捉在人形机器人研发中的应用
  • 【会议征稿通知 | 绵阳师范学院主办 | IET出版 | EI 、Scopus稳定检索】第五届电力工程与电气技术学术会议(ICPEET 2026)
  • 2026年老面小笼包面粉出数高选哪家:出品率与耐发酵对比 - 科技焦点
  • Awoo Installer:终极Nintendo Switch游戏安装解决方案
  • 基于扩散模型的电网故障智能生成:从N-1筛选到主动风险预测