当前位置：首页 > news >正文

MATLAB矩阵高效操作：删除全零行列的性能优化与工程实践

news 2026/6/24 21:29:54

1. 问题引入：从一道“简单”的MATLAB谜题说起

最近在整理一些旧的MATLAB代码时，翻到了一个几年前收藏的“Puzzler”（谜题）。题目很简单，就一句话：如何从一个二进制矩阵中，删除所有元素全为0的列和行？乍一看，这有什么难的？不就是用any函数配合逻辑索引吗？比如A(:, ~any(A, 1)) = []删全零列，A(~any(A, 2), :) = []删全零行。我当年也是这么想的，随手写了几行代码就扔到了一边。

直到上周，我需要处理一个来自图像分割后处理的二值掩膜矩阵，这个矩阵大小是5120×5120，里面散布着一些孤立的连通区域，周围是大片的0。我的任务就是把这些孤立的“岛屿”提取出来，同时剔除掉那些完全空白的行和列，相当于给图像做个紧致的裁剪（Cropping）。我下意识地用了上面那个“经典”的两步法。结果，在循环处理几百个这样的矩阵时，我发现程序慢得令人发指，内存使用也出现了异常的波动。

这让我重新审视了这个看似简单的操作。在MATLAB里，对矩阵进行索引赋值A(...) = []来删除行或列，实际上是一个内存重新分配和复制的过程。对于超大型矩阵，连续执行两次这样的操作，其效率可能远低于预期。更关键的是，这个“两步法”在删除行后，列的索引状态已经改变，再删除列时，逻辑判断是基于新矩阵的，这虽然是正确的，但有没有可能一步到位？这个Puzzler背后，其实涉及了MATLAB矩阵操作的核心效率问题、逻辑索引的广播机制，以及如何写出既简洁又高性能的代码。今天，我们就来彻底拆解这个“二进制矩阵行列删除”问题，从最直观的解法开始，一步步深入到性能优化和实际应用场景。

2. 基础解法剖析：逻辑索引与两步删除法

我们先从最基础、最易理解的解法开始。假设我们有一个二进制矩阵A，元素非0即1（在MATLAB逻辑运算中，非零数通常被视为true）。我们的目标是删除所有元素全为0的列和行。

2.1 核心思路与函数选择

解决这个问题的关键在于识别出哪些行和列是“全零”的。MATLAB提供了几个按维度进行逻辑判断的函数：

any(A, dim): 沿维度dim检查，如果该维度的任意元素非零，则返回true。对于删除全零行/列，我们需要的是其反逻辑：全零意味着“没有任何元素非零”。所以，~any(A, dim)就给出了一个逻辑向量，标记了该维度上所有元素均为0的位置。
all(A, dim): 沿维度dim检查，是否所有元素都非零。这不符合我们的需求，因为我们要找的是“所有元素都为0”的行列。

因此，any是我们的首选工具。维度参数dim=1对列操作（检查每列中是否有非零元素），dim=2对行操作（检查每行中是否有非零元素）。

2.2 经典两步法实现

最直接的实现就是分两步走：先删列，再删行，或者顺序反过来。

function B = removeZeroRowsAndColsBasic(A) % 方法1: 先删除全零列，再删除全零行 zeroCols = ~any(A, 1); % 找出全零列，返回一个行向量 A(:, zeroCols) = []; % 删除这些列 zeroRows = ~any(A, 2); % 在删除列后的新矩阵中，找出全零行 A(zeroRows, :) = []; % 删除这些行 B = A; end

或者先删行：

function B = removeZeroRowsAndColsBasic2(A) % 方法2: 先删除全零行，再删除全零列 zeroRows = ~any(A, 2); % 找出全零行，返回一个列向量 A(zeroRows, :) = []; % 删除这些行 zeroCols = ~any(A, 1); % 在删除行后的新矩阵中，找出全零列 A(:, zeroCols) = []; % 删除这些列 B = A; end

这两种方法在逻辑上完全等价，最终结果一致。它们非常直观，易于理解和调试，对于中小型矩阵或者一次性操作来说，完全够用。

2.3 潜在问题与思维陷阱

虽然基础解法有效，但其中隐藏着几个需要留意的点：

性能开销：A(:, zeroCols) = []这个操作并非“原地”删除。MATLAB需要创建一个新的矩阵，其尺寸是原行数 × (原列数-删除列数)，然后将原矩阵中保留的列数据复制到新矩阵中。对于大型矩阵，连续两次这样的内存分配和数据复制，会成为性能瓶颈。我在处理5120×5120矩阵时遇到的卡顿，根源就在于此。
依赖顺序：注意，第二步操作（无论是删行还是删列）依赖于第一步操作完成后的新矩阵A。我们不能同时用原始的zeroRows和zeroCols进行删除，因为删除行后，列的索引并没有变化，但删除列后，行的索引也没有变化。然而，行和列的状态是相互独立的吗？一个全零行，在删除某些列后，它可能就不再是全零行了（如果该行唯一的非零元素在被删除的列上）。等等，这里需要仔细推敲一下。
让我们严格定义一下目标：“删除所有元素全为0的列和行”。这里的“全为0”是指在最终的矩阵中全为0。如果我们先找出原矩阵中的全零列删除，那么原矩阵中的全零行，在删除列后，它依然是全零行（因为整行都是0，删除一些0列，剩下的还是0）。反过来，先删除全零行也一样。所以，删除全零行和全零列的操作顺序不影响最终结果。any(A,1)和any(A,2)在原矩阵上计算出的逻辑向量是各自独立的。这意味着，我们有可能找到一种方法，同时确定最终需要保留的行和列索引，然后一次性通过索引提取出结果矩阵，从而避免中间的内存分配和复制。
输入数据类型：题目说的是“二进制矩阵”（binary matrix）。在MATLAB中，这通常指logical类型的矩阵（元素为true/false）或者数值矩阵（元素为 0/1）。any函数对这两种类型都适用。但如果输入是一个普通的数值矩阵，其中包含非0非1的值（比如2，-1），any也会将其视为true。如果严格限定为二进制，可能需要先进行转换A = A ~= 0。

基础解法为我们建立了正确的逻辑模型。接下来，我们将探索更高效、更优雅的“一步到位”解法。

3. 高效解法探索：利用线性索引与逻辑运算

既然我们已经知道最终需要保留哪些行和列，那么最理想的方式就是直接计算出结果矩阵B，它应该等于原矩阵A的一个子矩阵：B = A(保留的行索引, 保留的列索引)。如果能一次性找出这两个索引向量，就能避免中间删除操作带来的性能损耗。

3.1 计算独立的行列保留标志

首先，我们分别计算需要保留的行和列（即非全零的行和列）。

rowsToKeep = any(A, 2); % 列向量，true表示该行至少有一个非零元素，应保留 colsToKeep = any(A, 1); % 行向量，true表示该列至少有一个非零元素，应保留

rowsToKeep和colsToKeep是基于原始矩阵A独立计算出来的。rowsToKeep(i)为true当且仅当第i行在原始矩阵中非全零。无论我们删除哪些列，只要这一行在原始矩阵中有一个非零元素，那么删除全零列后（这些被删除的列上该行元素本来就是0），这一行在剩下的列上必然至少还有一个非零元素（就是原来那个），因此该行在最终矩阵中依然非全零，应该被保留。反之，如果一行在原始矩阵中全零，那么无论删除哪些列，它都将保持全零，应该被删除。对列的分析同理。

因此，rowsToKeep和colsToKeep直接定义了最终结果矩阵的行和列。

3.2 使用逻辑索引直接提取子矩阵

有了这两个逻辑向量，我们可以直接提取子矩阵：

function B = removeZeroRowsAndColsEfficient(A) rowsToKeep = any(A, 2); colsToKeep = any(A, 1); B = A(rowsToKeep, colsToKeep); end

这个方法非常优雅，它只有一次矩阵索引操作A(rowsToKeep, colsToKeep)。MATLAB内部会高效地处理这种逻辑索引，直接创建目标矩阵B，其大小为nnz(rowsToKeep) × nnz(colsToKeep)。相比于基础解法的两次内存分配和复制，这种方法通常更快，尤其是对于大型矩阵。

3.3 处理极端情况与空矩阵

让我们测试一下这个高效解法在边界情况下的表现：

矩阵全为零：rowsToKeep和colsToKeep将全是false。A(false, false)会返回一个空的0×0矩阵，类型与A相同。这符合预期：删除所有全零行和列后，什么也不剩。
矩阵至少有一个非零元素：至少有一行和一列会被保留，函数正常工作。
行向量或列向量：逻辑同样适用。例如，对于一个行向量A，any(A,2)可能返回标量true或false，any(A,1)会返回一个逻辑行向量。索引操作A(true, logical_vector)仍然有效。

这里有一个重要的编程习惯：在函数开头可以添加对输入矩阵是否为空的检查，虽然MATLAB能处理空矩阵的any操作（返回全false），但提前判断可以使逻辑更清晰。

function B = removeZeroRowsAndColsEfficientRobust(A) if isempty(A) B = A; return; end rowsToKeep = any(A, 2); colsToKeep = any(A, 1); % 进一步确保不会提取出空的索引（虽然any(false)索引会返回空矩阵，但更安全） if ~any(rowsToKeep) || ~any(colsToKeep) B = A([], []); % 显式返回一个与A同类型的空矩阵 else B = A(rowsToKeep, colsToKeep); end end

高效解法在概念和性能上都优于基础解法。然而，故事并没有结束。我们是否还能从其他角度看待这个问题？比如，它本质上是不是在寻找矩阵的“非零支撑”（non-zero support）？

4. 深入原理：连接图像处理中的“边界框”概念

“删除全零行和列”这个操作，在图像处理领域有一个非常直观的对应物：计算二值图像中目标物体的边界框（Bounding Box），并进行裁剪。

假设我们的二进制矩阵A是一幅二值图像（0代表背景，1代表前景物体）。图像中可能有很多离散的前景点，我们想要得到包含所有前景点的最小矩形区域。这个操作就是：

沿着垂直方向（行）投影，找到有前景点的第一行和最后一行。
沿着水平方向（列）投影，找到有前景点的第一列和最后一列。
用这四个索引围成的矩形来裁剪原图像。

这和我们“删除全零行和列”的目标是一致的吗？仔细想想，并不完全一样。删除全零行和列，得到的是一个可能不连续的、剔除了所有外部空白区域的矩阵。而边界框裁剪，得到的是一个连续的矩形区域，这个矩形内部可能仍然包含全零的行或列（如果物体形状不规则，中间有空洞或间隙）。例如：

A = [0 0 0 0 0; 0 1 0 1 0; 0 0 0 0 0; 0 1 1 1 0; 0 0 0 0 0];

我们的删除操作：会删除第1、3、5行（全零），以及第1、5列（全零）。结果是一个2×3的矩阵[1 0 1; 1 1 1]。第2列（全零）被保留了，因为它不是“所有行”上的元素都为0（它所在的行有非零元素）。
边界框裁剪：行方向上的非零索引是2和4，列方向上是2、3、4。所以边界框是A(2:4, 2:4)，得到一个3×3的矩阵，其中包含了一个全零的中心行。

所以，“删除全零行和列”是比“计算边界框”更严格的一种操作。它不仅仅移除外部的空白，还移除内部任何完全空白的行和列，最终得到的矩阵，其每一行和每一列都至少包含一个非零元素。这在某些数学或数据处理的上下文中更有意义，比如当矩阵表示一个系统的关联关系（行和列代表实体，1代表有关联）时，删除全零行/列意味着移除完全孤立的实体。

那么，如何用边界框的思想来实现我们的功能呢？不行，因为目标不同。但是，我们可以从另一个角度思考：我们得到的最终矩阵B，其行和列索引对应于原矩阵A中那些“活跃”的行和列。rowsToKeep和colsToKeep的find结果，就是这些活跃行和列的原始索引。

activeRowIndices = find(rowsToKeep); % 例如 [2, 4] activeColIndices = find(colsToKeep); % 例如 [2, 3, 4] B = A(activeRowIndices, activeColIndices); % 等价于使用逻辑索引

使用find将逻辑索引转换为线性索引，在某些需要知道具体索引数值的后续操作中更方便。

5. 性能实测与进阶技巧

理论分析之后，让我们用实际数据来验证一下不同方法的性能差异，并探讨一些更进阶的场景和技巧。

5.1 性能对比测试

我们构造一个大型的稀疏二进制矩阵来模拟真实场景。

% 生成一个 10000x10000 的稀疏矩阵，非零密度约为0.1% n = 10000; density = 0.001; A = sprand(n, n, density) > 0; % 创建稀疏逻辑矩阵 A = full(A); % 转为满矩阵进行测试，因为删除行列操作对满矩阵和稀疏矩阵影响不同 % 方法1: 基础两步法（先列后行） tic; B1 = removeZeroRowsAndColsBasic(A); time1 = toc; % 方法2: 高效一步法（逻辑索引） tic; B2 = removeZeroRowsAndColsEfficient(A); time2 = toc; % 验证结果一致性 assert(isequal(B1, B2), ‘Results mismatch!’); fprintf(‘基础两步法耗时: %.4f 秒\n’, time1); fprintf(‘高效一步法耗时: %.4f 秒\n’, time2); fprintf(‘高效法速度提升: %.2f 倍\n’, time1/time2);

在我的测试环境（MATLAB R2023a）下，对于一个10000×10000、密度0.1%的矩阵（大约有100万个非零元素，随机分布），高效一步法通常比基础两步法快2到5倍。这个差距随着矩阵增大而变得更加明显。原因正如之前分析的，高效法避免了中间矩阵的创建和复制。

注意：如果矩阵A本身就是稀疏矩阵格式（sparse），情况会有所不同。MATLAB对稀疏矩阵的逻辑索引和维度操作进行了大量优化。对于稀疏矩阵，两种方法的性能差距可能会缩小，甚至基础方法可能在某些情况下表现更佳，因为any(A,1)和any(A,2)对稀疏矩阵的计算效率极高。但在处理满矩阵（full）时，高效一步法的优势是确定的。

5.2 处理特定数值类型与内存优化

我们的函数目前可以处理logical和数值类型的矩阵。如果考虑健壮性，可以做一些优化：

强制二进制化：如果输入可能包含非0非1的值，可以首先将其二值化。
```
if ~islogical(A) A = A ~= 0; % 将非零值转为 true (1)，零值转为 false (0) end
```
这一步会增加一点开销，但保证了逻辑的正确性。
内存考量：对于极大的矩阵，即使一步法，rowsToKeep和colsToKeep这两个逻辑向量也需要占用内存（每个元素1字节）。如果矩阵是100000×100000，这两个向量各需要约100MB内存。在极端内存受限的情况下，我们可以尝试不创建这些中间逻辑向量，而是直接使用find来获取索引，但find(any(A,1))内部很可能还是计算了逻辑向量。一个更节省内存但可能更慢的方法是使用循环或arrayfun来逐行/逐列判断，但这通常不被推荐，因为违背了MATLAB向量化操作的原则。在实践中，对于超大规模数据，可能需要考虑使用块处理（block processing）或迭代方法，但这已经超出了这个简单Puzzler的范畴。

5.3 扩展：删除全为某特定值的行和列

有时问题会变体：删除所有元素全为某个特定值val的行和列（而不仅仅是0）。这也很容易修改我们的高效解法：

function B = removeRowsAndColsOfValue(A, val) % 删除所有元素全等于 val 的行和列 % 对于数值矩阵 rowsToKeep = any(A ~= val, 2); colsToKeep = any(A ~= val, 1); B = A(rowsToKeep, colsToKeep); end

对于二进制矩阵，val通常是0或1。删除全1的行和列，只需将~=改为==，或者调整any的逻辑即可。

6. 实际应用场景与代码集成

这个看似简单的操作，在实际工程和科研中有哪些用途呢？

图像处理中的有效区域裁剪：如前所述，对于二值掩膜，移除四周的纯黑（0）边界。但更常见的是用边界框。我们的操作更适合于“去除图像中完全空白（全零）的扫描线”，这在某些特定的传感器图像或处理后的图像中可能出现。
稀疏数据预处理：在机器学习或数据分析中，我们可能有一个大的特征矩阵，其中某些特征（列）在所有样本中都是0，或者某些样本（行）的所有特征都是0。这些行/列对模型训练没有贡献，甚至可能干扰计算（如导致协方差矩阵奇异）。在构建模型前，将它们删除是一个标准的预处理步骤。
图或网络的邻接矩阵处理：二进制矩阵可以表示一个图的邻接矩阵（无向图通常是对称的，有向图则不一定）。矩阵中的1表示节点间有边连接。如果一个节点的出度和入度都为0（对应一行和一列全为0），那么这个节点就是孤立节点。删除全零行和列，就等于从图中移除了所有孤立节点，得到一个没有孤立节点的子图。这在图分析中是一个常见的预处理。
逻辑电路或状态转移矩阵化简：在某些系统建模中，状态转移矩阵中全零的行/列可能代表无法到达或无效的状态，删除它们可以简化模型。

将我们的函数集成到项目代码中时，建议将其封装成一个健壮的工具函数，并添加帮助文档：

function B = cropZeroPadding(A) % CROPZEROPADDING 删除二进制矩阵中全为零的行和列。 % B = CROPZEROPADDING(A) 输入A是一个数值或逻辑矩阵。函数返回矩阵B， % 它由A删除所有元素全为零的行和列后得到。 % % 示例： % A = [0 0 0; 0 1 0; 0 0 0]; % B = cropZeroPadding(A) % 返回 1 % % 参见： ANY, FIND, SPARSE if isempty(A) B = A; return; end % 确保处理的是二进制逻辑（非零即真） if ~islogical(A) A = A ~= 0; end rowsToKeep = any(A, 2); colsToKeep = any(A, 1); % 处理全矩阵为零的情况 if ~any(rowsToKeep) || ~any(colsToKeep) % 返回一个与A同类型的空矩阵 if islogical(A) B = false(0,0); else B = zeros(0,0, class(A)); end else B = A(rowsToKeep, colsToKeep); end end

7. 总结与思维延伸

回顾这个MATLAB Puzzler，我们从最基础的两步删除法出发，揭示了其潜在的性能问题。通过分析行列删除操作的独立性，我们导出了更高效的一步逻辑索引法。这种方法的核心在于认识到：原始矩阵中某行（列）是否全零，决定了它在最终矩阵中的去留，且这个决定不受其他行（列）删除操作的影响。

这个认识允许我们并行地计算出需要保留的行列掩膜，然后通过一次索引操作完成全部工作。这种方法不仅代码简洁，而且由于减少了中间内存分配和复制，对于大型矩阵性能提升显著。

更进一步，我们将此操作与图像处理的“边界框”概念进行了辨析，明确了二者的区别与联系。最后，我们探讨了其在数据预处理、图论等领域的实际应用，并给出了一个健壮的、生产级的函数封装。

思维延伸：

如果矩阵是稀疏矩阵：MATLAB的稀疏矩阵存储格式（sparse）对于这种any操作和逻辑索引极度优化。直接对稀疏矩阵使用高效一步法即可，无需转换为满矩阵。
多维数组：对于三维及以上的数组，如果想删除所有元素全为零的“页”、“面”或更高维度的切片，原理是相同的。例如，对一个三维数组A，删除所有全零的“行”（第一维）和“列”（第二维），但保留第三维，可以这样操作：
```
rowsToKeep = any(any(A, 3), 2); % 在第二、三维度上检查，结果对第一维 colsToKeep = any(any(A, 3), 1); % 在第一、三维度上检查，结果对第二维 B = A(rowsToKeep, colsToKeep, :);
```
这里any(A,3)沿着第三维压缩，得到一个二维逻辑矩阵，再分别对行和列做any，得到需要保留的一维索引。
反向操作：有时我们可能需要“找到”而不是“删除”这些全零的行列。find(~any(A,1))和find(~any(A,2))给出的就是这些全零行列的索引，这在调试或分析数据时非常有用。

通过深入剖析这样一个简单的问题，我们练习了MATLAB的向量化思维、索引技巧和性能分析。在编程中，很多时候“正确”的代码和“优秀”的代码之间，就差在这一层深入的思考。下次当你写出一个能工作的循环或多次操作时，不妨停下来想想，能否用一句向量化的索引来替代它？这往往是提升MATLAB代码性能和优雅度的关键。

查看全文

http://www.jsqmd.com/news/1074341/