【算法设计与分析】第7篇:01背包问题的动态规划建模与空间优化
给定一个容量有限的背包和若干件物品,每件物品有各自的重量和价值,每件物品只能选择装入或不装入,问在总重量不超过背包容量的前提下,能获得的最大价值。这就是经典的01背包问题,其名称来源于每件物品的“要么0要么1”的二元选择。
这个问题的暴力枚举需要O(2ⁿ)时间,而动态规划将它压缩到O(nW),其中n为物品数量,W为背包容量。这个跨度,足以说明动态规划在处理组合优化时的威力。
一、二维动态规划建模
状态定义。令dp[i][j]表示从前i件物品中选取若干件,放入容量为j的背包中能获得的最大价值。这里i是物品索引的“考虑范围”,j是背包的“剩余容量”,两者共同构成状态空间的坐标。
最优子结构。考察第i件物品。它只有两种选择:不装入,则问题退化为前i-1件物品在容量j下的最优解dp[i-1][j];装入,则需要在前i-1件物品、容量j-w[i]的基础上增加价值v[i]。只要j≥w[i],我们就在两者之间取较大值。这给出了状态转移方程:
dp[i][j]={dp[i−1][j],j<w[i]max{ dp[i−1][j],dp[i−1][j−w[i]]+v[i] },j≥w[i]dp[i][j]=⎩⎨⎧dp[i−1][j],max{dp[i−1][j],dp[i−1][j−w[i]]+v[i]},j<w[i]j≥w[i]
初始化。dp[0][j]全为0——没有物品可选时,无论背包多大,价值都是零。dp[i][0]全为0——容量为零,装不下任何东西。
填表顺序。外层循环枚举i从1到n,内层循环枚举j从0到W,按行逐格填充。最终答案位于dp[n][W]。时间复杂度Θ(nW),空间复杂度Θ(nW)。
二、滚动数组:从二维到一维的空间优化
观察上面的递推式可以发现一个关键性质:dp[i][j]的值只依赖于上一行dp[i-1]中的两个位置——正上方的dp[i-1][j]和左前方的dp[i-1][j-w[i]]。一旦第i行计算完成,第i-1行就再也不会被用到。
这意味着我们不需要保留整个二维表。只需一个长度为W+1的一维数组,并在每一轮物品迭代中“就地”更新它。但这里有一个容易被忽视的细节——内层循环的方向。
如果j从小到大遍历,那么dp[j-w[i]]在当前这一轮中可能已经被更新过了,代表的是dp[i][j-w[i]]而非我们需要的dp[i-1][j-w[i]],这相当于允许同一件物品被重复使用(变成完全背包)。要避免这一点,j必须从W向w[i]递减遍历,确保dp[j-w[i]]读取到的是上一轮残留的值。
优化后的代码结构异常简洁:一维数组f初始全零,外层遍历物品,内层j从W递减到w[i],执行f[j]=max(f[j], f[j-w[i]]+v[i])。空间复杂度从Θ(nW)降至Θ(W)。
三、背包问题的变形族
01背包是背包家族的基准模型,许多变体只需在转移方程上稍作调整。
完全背包:每件物品可以选无限次。只需将内层j的遍历方向改为从小到大,使同一物品可被反复选取。dp[j] = max(dp[j], dp[j-w[i]]+v[i]),j递增。
多重背包:每件物品有固定的数量上限s[i]。朴素方法是将s[i]个相同物品拆开当成01背包处理,但这样效率低下。更优的做法是二进制拆分:将s[i]分解为1,2,4,...,2ᵏ,剩余数这些“打包”后的新物品,每种最多选一次,转化为01背包求解。更高阶的优化是使用单调队列进行线性处理,但那已经属于进阶专题的范畴。
分组背包:物品被划分为若干组,每组内至多选一件。这需要在01背包的外层增加一个组枚举层,内层对组内物品做决策,循环顺序与01背包类似但需注意j循环在组内物品循环的外面,以保证每组只选一件。
四、为什么“容量”是多项式却不算多项式时间算法
一个值得思考的理论细节:背包问题的动态规划复杂度是O(nW),n是物品数量,W是背包容量。看起来是多项式,但若W以输入中的二进制位数计,W的数值本身就是输入规模的指数。因此背包问题的DP解法实际是伪多项式时间算法,这一问题在NP完全性的讨论中将被再次提及。
从矩阵链乘法到01背包,我们看到的动态规划都是在一个有限的表格中按规则递推。下一篇,我们将面对更具挑战性的字符串场景——最长公共子序列与编辑距离,在那里状态将横跨两个序列,二维表格上的转移方向也会更为丰富。
