当前位置：首页 > news >正文

从苏格拉底的麦穗，到找对象的“37%法则”：数学如何教我们在不确定中做选择

news 2026/7/25 3:30:43

你有没有遇到过这样的情况？

找对象时，太早确定关系，后来发现也许还有更合适的人；一直挑挑拣拣，又可能错过真正不错的人。找工作时，第一家公司给了 offer，要不要接？买房时，看了几套之后，是不是应该继续等？

这其实就是一个经典问题：

机会一个个出现，错过了不能回头，但如果一直等待，又可能最后一无所获。

苏格拉底“麦穗问题”讲的正是这个道理。弟子走进麦田，只能往前走，不能回头，只能摘一支最大的麦穗。有人太早摘，有人一直等，最后发现人生最难的不是选择，而是不知道什么时候停止比较。

这个故事在数学中有一个严格版本，叫做：

秘书问题（Secretary Problem）
或最优停止问题（Optimal Stopping Problem）

它能推导出一个著名结论：

先观察前约 37% 的选项，然后从后面选择第一个超过此前所有选项的对象。

这就是常说的37%法则。

一、为什么要学数学：因为数学不是算数，而是建模

很多人觉得数学离生活很远，似乎只是考试、公式和计算。但真正有价值的数学，往往不是告诉你一个具体答案，而是帮你把混乱的问题变成可分析的问题。

比如“找对象该不该继续等”这个问题，看起来很感性，但它背后包含几个关键变量：机会是依次出现的，每次只能根据当前信息判断，错过之后不能回头，目标是尽可能选到最好的那个，而未来又是不确定的。

这就是数学建模的第一步：

把现实问题抽象成结构清晰的问题。

当一个问题被建模之后，我们就可以分析它，而不只是靠感觉、经验或鸡汤。

二、把麦穗问题建模成数学问题

假设一共有nnn支麦穗，或者说有nnn个候选对象。

它们依次出现，你只能从左往右看。每看到一个，你可以选择它，也可以放弃它。但一旦放弃，就不能回头。

我们的目标是：

最大化选中全局最大麦穗的概率。

这里有一个重要假设：

这些麦穗出现的顺序是随机排列的。

也就是说，最大的麦穗可能出现在任何位置，每个位置的概率都是一样的。

三、一个自然的策略：先观察，再出手

最经典的策略是：

先观察前rrr个，不选择，只记录其中最大的那个；
从第r+1r+1r+1个开始，一旦遇到一个比前面所有都大的，就立刻选择。

这个策略非常符合人的直觉。

因为一开始你没有标准，所以先看一段时间，建立对“好”的判断。等你有了标准之后，再遇到明显超过标准的机会，就不要犹豫。

这其实就是：

先建立认知标尺，再做不可逆选择。

四、严谨数学证明：为什么是 37%？

设策略为SrS_rSr：

先跳过前rrr个，然后选择之后第一个超过前面所有候选者的对象。

我们计算这个策略成功的概率。

假设全局最优对象出现在第kkk个位置。

如果：
k≤rk \le rk≤r
那么它在观察阶段已经被跳过，策略一定失败。

所以只有当：

k>rk > rk>r

时，策略才有可能成功。

那么在k>rk>rk>r的情况下，策略什么时候会成功呢？

答案是：

在前k−1k-1k−1个候选者中，最大的那个必须出现在前rrr个观察样本里。

原因很简单。

如果前k−1k-1k−1个候选者中最大的那个出现在第r+1r+1r+1到第k−1k-1k−1个之间，那么策略会在遇到它时提前选择，从而错过第kkk个真正的全局最优。

而如果前k−1k-1k−1个候选者中最大的那个出现在前rrr个观察阶段，那么从第r+1r+1r+1个到第k−1k-1k−1个都不会超过观察阶段的最高标准。这样第kkk个全局最优出现时，就会成为观察阶段之后第一个刷新纪录的对象，策略成功。

在前k−1k-1k−1个位置中，最大者等概率出现在任意位置。因此：

P(成功∣最大值在第 k 位)=rk−1P(\text{成功} \mid \text{最大值在第 } k \text{ 位})=\frac{r}{k-1}P(成功∣最大值在第k位)=k−1r

而全局最大值出现在第kkk位的概率为：

P(最大值在第 k 位)=1nP(\text{最大值在第 } k \text{ 位})=\frac{1}{n}P(最大值在第k位)=n1

所以总成功概率为：

Pn(r)=∑k=r+1n1n⋅rk−1P_n(r)=\sum_{k=r+1}^{n}\frac{1}{n}\cdot\frac{r}{k-1}Pn(r)=∑k=r+1nn1⋅k−1r

整理可得：

Pn(r)=rn∑k=r+1n1k−1P_n(r)=\frac{r}{n}\sum_{k=r+1}^{n}\frac{1}{k-1}Pn(r)=nr∑k=r+1nk−11

令：

j=k−1j = k-1j=k−1

则：

Pn(r)=rn∑j=rn−11jP_n(r)=\frac{r}{n}\sum_{j=r}^{n-1}\frac{1}{j}Pn(r)=nr∑j=rn−1j1

这就是该策略的精确成功概率。

当nnn很大时，令：

x=rnx=\frac{r}{n}x=nr

则：

∑j=rn−11j≈∫rn1tdt\sum_{j=r}^{n-1}\frac{1}{j} \approx \int_r^n \frac{1}{t}dt∑j=rn−1j1≈∫rnt1dt

继续计算：

∫rn1tdt=ln⁡n−ln⁡r=ln⁡nr\int_r^n \frac{1}{t}dt=\ln n-\ln r=\ln \frac{n}{r}∫rnt1dt=lnn−lnr=lnrn

由于：

x=rnx=\frac{r}{n}x=nr

所以：

nr=1x\frac{n}{r}=\frac{1}{x}rn=x1

因此：

ln⁡nr=ln⁡1x=−ln⁡x\ln \frac{n}{r}=\ln \frac{1}{x}= -\ln xlnrn=lnx1=−lnx

于是：

Pn(r)≈x(−ln⁡x)P_n(r) \approx x(-\ln x)Pn(r)≈x(−lnx)

接下来最大化函数：

f(x)=−xln⁡xf(x)=-x\ln xf(x)=−xlnx

对它求导：

f′(x)=−ln⁡x−1f'(x)=-\ln x-1f′(x)=−lnx−1

令导数为 0：

−ln⁡x−1=0-\ln x-1=0−lnx−1=0

得到：

ln⁡x=−1\ln x=-1lnx=−1

因此：

x=e−1=1e≈0.3679x=e^{-1}=\frac{1}{e}\approx 0.3679x=e−1=e1≈0.3679

也就是说：

r≈ner \approx \frac{n}{e}r≈en

所以最优策略是：

先观察前约 36.8% 的对象，不选择；
然后从剩下的对象中，选择第一个超过此前所有对象的。

最大成功概率也约为：

1e≈36.8%\frac{1}{e}\approx 36.8\%e1≈36.8%

这就是“37%法则”的数学来源。

五、这个结论真正告诉我们的是什么？

很多人第一次看到这个结论会觉得失望：最优策略居然也只有 36.8% 的成功率？

但这恰恰是这个问题最深刻的地方。

它告诉我们：

在信息不完整、不能回头、必须实时决策的场景中，即使采用最优策略，也无法保证成功。

数学不是告诉你“人生一定能选对”，而是告诉你：

在不确定条件下，怎样做才是长期来看最合理的。

这也是为什么“37%法则”不是鸡汤。它真正强调的是两件事：第一，前期不要急着决定，因为你还没有建立判断标准；第二，一旦你已经有了足够多的观察，遇到明显超过历史标准的机会，就应该果断出手。

六、这个模型可以用在哪些领域？

秘书问题不仅可以解释麦穗故事，也可以解释很多现实场景。

1. 找对象

你不可能认识世界上所有潜在伴侣，也不可能无限等待。前期的经历帮助你理解自己真正看重什么，后期则需要在遇到足够好的人时停止比较。

2. 招聘

公司面试候选人时，也常常面临类似问题。太早录用可能错过更好的人，一直等待又可能让优秀候选人流失。

3. 找工作

求职者面对多个机会时，也不知道后面是否会有更好的 offer。此时就需要平衡探索和决策。

4. 买房

看房也是典型的不可逆选择问题。你需要先看一些房子建立市场认知，再判断某套房是否明显优于此前见过的选择。

5. 科研选题

科研方向同样如此。一直调研可能永远不开始，太早确定又可能进入价值不高的问题。好的研究判断，往往来自一定探索后的果断聚焦。

6. 投资与创业

投资项目、创业方向、商业机会也都具有类似结构：机会依次出现，信息不完整，错过之后未必还能回来。

七、但37%法则不是万能的

需要注意的是，秘书问题有很多理想化假设。

例如：

候选对象总数nnn是已知的；
所有对象的出现顺序是随机的；
只能选择一个；
只能比较相对好坏，无法知道绝对分数；
错过之后不能回头；
目标是选中全局最优，而不是选择一个足够好的人。

现实世界往往不完全满足这些条件。

比如找对象并不是只选“全局最优”，而是要考虑匹配、相处、价值观、稳定性和共同成长。招聘也不是只要最优秀的人，而是要岗位匹配、团队协作和长期发展。

因此，37%法则更像是一种思维模型，而不是机械公式。

它的价值在于提醒我们：

决策不是单纯追求完美，而是在探索和利用之间找到平衡。

八、除了37%法则，还有哪些常见策略？

秘书问题只是最优停止问题中的一个经典模型。现实中还有很多相关策略值得继续讨论。

1. 满意即可策略

不追求全局最优，而是设定一个满意标准，只要超过标准就选择。

这比“必须选到最好”更接近现实生活。

2. 阈值策略

提前设定一个分数线，候选对象超过某个阈值就接受。

例如找工作时，薪资、平台、地点、发展空间达到综合标准就接受。

3. 探索—利用策略

前期多探索，后期多利用已有经验做决策。

这在机器学习、推荐系统、强化学习中非常常见。

4. 多臂老虎机问题

你面对多个选择，每个选择的收益未知。你需要决定是继续尝试新选项，还是坚持当前看起来最好的选项。

这广泛应用于广告投放、推荐系统、临床试验和策略优化。

5. 动态规划策略

如果决策过程可以被拆解成多个阶段，并且每个阶段的选择会影响后续结果，就可以用动态规划来寻找最优策略。

6. 贝叶斯更新策略

随着新信息不断出现，我们不断更新对世界的判断。

现实中的很多选择，并不是一次性决定，而是在不断获得信息后逐步修正判断。

九、结语：数学不是让你变冷漠，而是让你更清醒

苏格拉底的麦穗故事之所以动人，是因为它讲的不只是麦穗，而是人生中的选择。

我们总是在有限的信息中做决定。我们无法回到过去，也无法提前看见未来。于是，选择就变成了一件既理性又遗憾的事情。

数学给出的不是完美答案，而是一种清醒：

先观察，建立标准；
再行动，停止无尽比较；
接受不确定性中的遗憾；
在有限信息下做长期最优的选择。

这也许就是数学最迷人的地方。

它不是替我们消除人生的不确定性，而是帮助我们在不确定性中，看见一种可解释、可分析、可优化的秩序。

因为很多时候，真正重要的不是“答案是什么”，而是：

我们如何把一个混乱的人生问题，变成一个可以被理解的问题。

查看全文

http://www.jsqmd.com/news/886671/

【Java基础|Stream流：从基础入门到实战进阶，告别繁琐循环！】

腾讯 Marvis 初级使用教程——从安装到上手

基于ConvNeXt与多元高斯损失的NLSE参数联合估计方法

终极指南：3分钟学会用EldenRingSaveCopier轻松迁移艾尔登法环存档

【收藏级・2026 版】小白程序员必看！打通金融大模型落地最后一公里

“烟雾飘散方向不对”是Prompt问题还是模型缺陷？2024 Q2 Midjourney烟雾物理引擎更新深度逆向分析（含3大未公开--stylize影响因子）

企业数据安全方案有哪些：2026年从风险评估到落地的完整指南 - 华旭传媒

AMD Ryzen终极调试指南：用SMUDebugTool解锁隐藏性能的完整教程

为什么阴干的衣服那么臭？原因竟然是……

现在不看就亏！2024Q2语音合成价格窗口期将关闭：3类企业正紧急切换供应商

高效实现百度网盘链接解析：技术架构与API调用深度解析

DeepSeek模型上线前最后1道关卡：生产环境级评估 checklist（含GPU显存泄漏检测、长尾请求P99延迟验证）

RTX51 Tiny内存冲突与ISD51调试器解决方案

不以0开头的偶数集和奇数集

2026年金华为餐饮企业提供SAAS收银系统的服务商综合分析与适配指南 - 万事通达

C#与Unity学习（26_05_24)

【DeepSeek性能测试黄金法则】：20年专家亲授5大避坑指南与实测调优参数清单

全国奢侈品回收流程、价格范围及市场现状究竟怎样

WaveTools深度解析：鸣潮玩家的专业性能调优与数据管理实战指南

16告警处理：如何避免告警风暴？

【Claude数据库设计辅助实战指南】：20年DBA亲授AI时代建模新范式，错过再等三年？

超越向量检索：用 Graph RAG 构建具备推理能力的企业知识问答系统

2026年家居定制观察：木饰面隐形门护墙板工艺解析 - 产品测评官

历史建筑隐形门铃系统设计：物联网与智能交互的工程实践

大模型开发中format_messages、invoke、format三种方法的对比

搜维尔科技：Xsens动作捕捉在人形机器人研发中的应用

【会议征稿通知 | 绵阳师范学院主办 | IET出版 | EI 、Scopus稳定检索】第五届电力工程与电气技术学术会议（ICPEET 2026）

2026年老面小笼包面粉出数高选哪家：出品率与耐发酵对比 - 科技焦点

Awoo Installer：终极Nintendo Switch游戏安装解决方案

基于扩散模型的电网故障智能生成：从N-1筛选到主动风险预测