当前位置: 首页 > news >正文

鞅的停时定理

定义离散时间的随机过程 \(X = \{X_n, n\ge 0\}\)关于自身的鞅,当且仅当满足:

  • \(\forall n \ge 0, E(|X_n|) < \infty\)

  • \(\forall n \ge 0, E(X_{n+1} | X_0,X_1,\ldots X_n) = X_n\)

即对于任意时间 \(s\),状态 \(X_0 \sim X_s\) 都确定时,\(X_{s+1}\) 的期望值等于 \(X_s\)

同理,定义 \(Y = \{Y_n, n\ge 0\}\) 是关于 \(X\) 的鞅,当且仅当满足:

  • \(\forall n \ge 0, E(|Y_n|) < \infty\)

  • \(\forall n \ge 0, E(Y_{n+1} | X_0,X_1,\ldots X_n) = Y_n\)

例如,定义随机过程 \(X = \{X_t, t \ge 0\}\),设 \(X_{t+1} = X_t + d_{t+1}\),且 \(P(d_i = 1) = P(d_i = -1) = \dfrac{1}{2}\),即 \(X_t\) 为从原点出发,每个时间等概率向左或向右走 \(1\) 单位长度,经过 \(t\) 时刻的位置,则 \(X\) 是一个鞅。

\[\begin{align} E(|X_n|) &\le n < \infty \tag{1} \\ E(X_{n+1} | X_0 \sim X_n) &= E(X_n + d_{n+1}) \notag \\&=X_n + E(d_{n+1}) \notag \\&=X_n \tag{2} \end{align} \]

继续定义 \(Y_t = X_t^2 - t\),则 \(Y\) 是一个关于 \(X\) 的鞅。

\[\begin{align} E(|Y_n|) &= E(|X_n^2 - n|) \le E(|X_n^2|) + n \notag \\ &\le n^2 + n < \infty\tag{1} \\ E(Y_{n+1} | Y_0 \sim Y_n) &= E((X_n + d_{n+1})^2 - (n+1)) \notag \\&= E(X_n^2 +2X_n d_{n+1} + d_{n+1}^2 - (n+1)) \notag \\&=X_n^2 + 2X_n E(d_{n+1}) + E(d_{n+1}^2) - n - 1 \notag \\&=X_n^2 - n=Y_n\tag{2} \end{align} \]

停时

定义时间变量 \(T(T \ge 0)\) 为停时与随机过程 \(X\),满足当知道 \(X_0 \sim X_n\) 时能判断 \(T\) 是否等于 \(n\),则令停止过程 \(\bar{X}\)

\[ \bar{X} = \begin{cases} X_n, & n\le T \\ X_T & n > T \end{cases} \]

鞅的停时定理

若鞅 \(X\) 与停时 \(T\) 满足以下三个条件之一,则有 \(E(X_T)=E(X_0)\)

  • \(\bar{X}\) 有界。

  • \(T\) 有界。

  • \(E(T)\) 有限,且 \(E(|X_{n+1} - X_n|)\) 有界。

例如,求从 \(p(0\le p \le n)\) 位置出发,每次等概率往两边走,第一次走到 \(0\)\(n\) 的时间 \(T\) 的期望。

\(X_t\)\(t\) 时刻的位置,则 \(X\) 是一个鞅,由于 \(T\) 有界,则有 \(E(X_T) = E(X_0) = p\)

\(q\)\(T\) 时刻到达 \(0\) 的概率,由于 \(E(X_T) = p = q \cdot 0 + (1-q)\cdot n\),则 \(q = \dfrac{n-p}{n}\)

\(Y_t = X_t^2 - t\),则 \(Y_t\) 是一个关于 \(X\) 的鞅,则有 \(E(Y_T)=E(Y_0)\),即 \(E(X_T^2 - T) = E(X_0^2) = p^2\),所以 \(E(T) = E(X_T^2) - p^2 = q \cdot 0^2 + (1-q) \cdot n^2 - p^2 = p(n-p)\)

势能函数

在 OI 中,通常势能函数 \(\Phi(A_t)\) 描述 \(t\) 时刻的局面,其满足 \(E(\Phi(A_{t + 1}) - \Phi(A_t) | A_0 \sim A_t) = -1\),然后构造 \(X_t = \Phi(A_t)+t\),那么 \(X_t\) 是一个鞅。

再根据鞅的停时定理,有 \(E(X_T) = E(X_0)\),那么 \(E(T) = \Phi(A_0) - \Phi(A_T)\)

例题

CF1025G Company Acquisitions

题目链接

\(\Phi(A_t) = \sum f(a_i)\),其中 \(a_i\) 是每个活跃公司的大小(包括自身)。

假设随机选到了 \(a_i = x, a_j = y\),由于有 \(E(\Phi(A_{t+1})-\Phi(A_t))=-1\),所以 \(x,y\) 变化后的期望势能要等于 \(f(x)+f(y)-1\),即

\[\begin{align} f(x)+f(y)-1&= \dfrac{1}{2}\cdot(f(x+1)+(y-1)\cdot f(1))+ \dfrac{1}{2}\cdot(f(y+1)+(x-1)\cdot f(1)) \end{align} \]

考虑直接钦定 \(f(x)-\dfrac{1}{2}=\dfrac{1}{2}\cdot(f(x+1)+(x-1)f(1))\),不妨假设 \(f(1)=0\),则有 \(f(x)=-(2^{x-1} - 1)\)

答案即为 \(\sum f(c_i) - f(n)\),复杂度 \(O(n)\)

CF1349D Slime and Biscuits

题目链接

\(\Phi(A_t) = \sum f(a_i)\),其中 \(a_i\) 是每个人的饼干数量,\(m = \sum a_i\)

可以直接考虑一个人的势能变化,期望为 \(\dfrac{x}{m}\cdot f(x-1) + \dfrac{m-x}{m}\cdot \dfrac{1}{n-1} \cdot f(x+1) + \dfrac{m-x}{m}\cdot \dfrac{n-2}{n-1} \cdot f(x)\)

由于有 \(E(\Phi(A_{t+1})-\Phi(A_t))=-1\),所以 \(\sum\limits f(x) - 1 = \sum\limits \dfrac{x}{m}\cdot f(x-1) + \dfrac{m-x}{m}\cdot \dfrac{1}{n-1} \cdot f(x+1) + \dfrac{m-x}{m}\cdot \dfrac{n-2}{n-1} \cdot f(x)\)

\(1\) 拆成 \(\dfrac{1}{n} \cdot n\),那么就可以钦定 \(\dfrac{x}{m}\cdot f(x-1) + \dfrac{m-x}{m}\cdot \dfrac{1}{n-1} \cdot f(x+1) + (\dfrac{m-x}{m}\cdot \dfrac{n-2}{n-1} - 1) \cdot f(x) + \dfrac{1}{n} = 0\)

答案即为 \(\sum f(c_i) - f(m)\),复杂度 \(O(m)\)

CF850F Rainbow Balls

题目链接

\(\Phi(A_t) = \sum f(a_i)\),其中 \(a_i\) 是每个颜色的球数量,\(m = \sum a_i\)

考虑 \(f(x)\) 的变化,有 \((\dfrac{x(x-1)}{m(m-1)}+\dfrac{(m-x)(m-x-1)}{m(m-1)}) \cdot f(x) + \dfrac{x(m-x)}{m(m-1)} \cdot (f(x+1)+f(x-1))\)

那么钦定 \((\dfrac{x(x-1)}{m(m-1)}+\dfrac{(m-x)(m-x-1)}{m(m-1)} - 1) \cdot f(x) + \dfrac{x(m-x)}{m(m-1)} \cdot (f(x+1)+f(x-1)) + \dfrac{1}{n} = 0\)\(f(m)=0\)

化简可得 \(f(x+1)-2f(x)+f(x-1)=-\dfrac{m(m-1)}{nx(m-x)}\),设 \(g(x)=f(x)-f(x-1)\) 即可快速得到 \(f(m)\)

答案即为 \(\sum f(c_i) - (f(m)+(n-1)\cdot f(0))\),复杂度 \(O(\max a)\)

http://www.jsqmd.com/news/746995/

相关文章:

  • 别再只盯着茅台了!用Supermind双均线策略回测A股其他热门股票,结果让我有点意外
  • 5大创新技术重构多平台直播弹幕实时采集系统
  • 长期使用Taotoken服务在账单清晰度方面的实际反馈
  • 10分钟快速上手DOL-Lyra:中文美化整合包完整使用指南
  • 从SRA到fastq:搞懂10X单细胞测序数据的‘身份证’(Barcode, UMI, Index)
  • 【紧急修复版】Python低代码插件调试失败率下降92.7%的3步诊断法(附自研debug-trace插件源码)
  • 别再折腾编译器了!U-Boot编译报错‘multiple definition of `yylloc‘‘的三种根治方案(附Fedora/Ubuntu实测)
  • 终极星露谷物语模组加载器SMAPI:3分钟学会安装,轻松打造个性化农场
  • 八大网盘直链解析助手:高效获取真实下载地址的完整解决方案
  • 告别Optane后,国产SCM存储卡Xlenstor2 X2900P上手实测:性能真能对标PCM吗?
  • AI智能体安全实战:使用opena2a进行自动化漏洞扫描与防护
  • Steam创意工坊模组下载神器:WorkshopDL 让你在任意平台畅玩Steam模组
  • OBS背景移除插件:无需绿幕的AI实时抠像技术深度解析
  • 老手机焕新记:折腾我那台卡在开机画面的VIVO Y66i,QPST 9008刷机全流程复盘
  • 深入解析:如何通过Atmosphere大气层系统彻底释放Nintendo Switch的隐藏潜力
  • 如何高效提取和转换Wallpaper Engine资源:RePKG工具完全指南
  • 终极指南:5分钟免费解锁Cursor Pro全部功能的完整教程
  • 终极RPG Maker解密指南:三分钟学会提取加密游戏资源
  • 鸣潮自动化工具完整指南:5分钟实现智能后台战斗与声骸管理
  • 智能进化:借助快马平台AI能力打造下一代cmd命令智能助手
  • 科幻小说《月球基底建造》第一章,雨海月面空港建设可行性报告
  • C语言多文件编程实战:用extern关键字优雅共享全局变量和函数(附完整项目示例)
  • Python类型错误总在上线后爆发?掌握这5个实时调试技巧,调试效率提升300%
  • 真理的纯粹性:贾子理论不可动摇的灵魂基石
  • OmenSuperHub终极指南:如何完全掌控惠普暗影精灵的性能与散热
  • Windows数据科学环境搭建避坑指南:从Anaconda安装到Matplotlib出图的全流程记录
  • 事件边界检测技术:原理、优化与应用实践
  • Mac M1芯片上搞定ModelScope:从Anaconda到TensorFlow的完整避坑指南
  • 51单片机串口通信实战:手把手教你用Keil和串口调试助手收发字符串(附完整代码)
  • 根据我的科幻小说《月球基底建造》第一章,雨海地底地堡能源与生态循环体系可行性报告