当前位置: 首页 > news >正文

Shell Daily 2025-12-27: 集合运算 (Comm)

Shell Daily 2025-12-27: 集合运算 (Comm)

处理文本数据时,我们经常遇到这种需求:给你两份名单(比如 all_hosts.txtpatched_hosts.txt),请迅速找出哪些主机还没打补丁(即在 A 中但不在 B 中)。

手写 Python 脚本或者用复杂的 grep -v 循环都太慢了。Shell 哲学里有一个专门处理“集合运算”的神器——comm

怎么用

comm 逐行比较两个已排序的文件,默认输出三列:

  1. 仅在文件 A 的行
  2. 仅在文件 B 的行
  3. A 和 B 共有的行

通过参数 -1, -2, -3 可以屏蔽掉对应的列,从而组合出交集、差集。

  • 语法comm [options] file1 file2
  • 关键前提:输入的两个文件必须先经过 sort 排序,否则结果不准确。
  • 兼容性POSIX 通用标准。所有 Unix-like 系统标配。

适用场景

  • 白名单过滤:从全量日志中剔除已知合法的 IP 列表。
  • 版本比对:快速找出两个配置文件的共同配置项或差异项。

示例 1:找出未完成的任务 (差集 A - B)

假设 total.txt 是总任务,finished.txt 是已完成任务。我们要找出剩下的任务:

# 这里的逻辑是:
# -2 屏蔽“仅在 finished.txt”的(没意义)
# -3 屏蔽“两者都有”的(已完成的)
# 剩下的就是 -23:仅在 total.txt 出现的(未完成的)
comm -23 sorted_total.txt sorted_finished.txt

示例 2:找出共同好友 (交集 A ∩ B)

找出两个用户关注列表里的共同关注者:

# -1 屏蔽 user_a 独有的
# -2 屏蔽 user_b 独有的
# 剩下的 -12 就是两者共有的
comm -12 user_a_follows.txt user_b_follows.txt

(注:配合之前讲的进程替换 <(...),你可以直接写 comm -23 <(sort A) <(sort B),连中间文件都不用存,非常丝滑。)

http://www.jsqmd.com/news/149131/

相关文章:

  • 2025天津集装箱租赁厂家口碑排行榜,优质直销服务大揭秘,集成房屋设计/箱式房/网红集装箱,集装箱租赁制造厂推荐排行榜单 - 品牌推荐师
  • 【小白必看】人工智能与大模型术语大全,一篇搞定,建议收藏!
  • AI Agent爆火!三份重磅报告揭秘大模型开发者必备技能,附下载
  • 2025年房屋改造装修公司权威推荐榜单:法式装修风格/美式装修风格/极简风装修源头服务商精选 - 品牌推荐官
  • TensorFlow在考古遗址发现中的遥感图像分析
  • GESP认证C++编程真题解析 | P11250 [GESP202409 八级] 手套配对
  • 2025年杭州实力强的美术艺考集训画室推荐:知名的美术艺考培训画室推荐哪些? - mypinpai
  • 2025最新!8个AI论文工具测评:研究生开题报告神器大公开
  • 2025年AI大模型催生的30+新兴岗位全解析,助你抢占AI风口
  • 【Java毕设源码分享】基于springboot+vue的房屋系统的设计与实现(程序+文档+代码讲解+一条龙定制)
  • 2025年杭州美术艺考集训学校排行榜,新测评精选有实力的美术艺考集训学校推荐 - mypinpai
  • 【大模型开发必备】MCP、ANP、A2A全解析:一文搞懂AI智能体三大连接协议,让你的Agent不再“社恐“!
  • 爬取电影数据并保存至csv文件
  • 2025钢制拖链生产厂TOP5权威推荐:专业服务商技术评测指南 - myqiye
  • 【Java毕设全套源码+文档】基于springboot的金雁在线考试系统设计与实现(丰富项目+远程调试+讲解+定制)
  • 震惊!企业AI落地难?Agentic AI Stack三层九阶模型来救场,代码小白也能秒懂!
  • 为什么顶尖团队都在关注Open-AutoGLM?(背后隐藏的4大技术壁垒)
  • 编程小白一行代码没写,5分钟搞定小游戏开发、部署上线
  • 2025年靠谱金属探测器正规厂商排行榜,新测评精选金属探测器生产企业推荐 - 工业推荐榜
  • 2025年度塑料抗静电剂技术领先厂家TOP5推荐 - 工业品牌热点
  • 大语言模型(LLM)训练与推理的硬件需求差异全解析,建议收藏!
  • Open-AutoGLM遇上Windows系统:常见报错解析与实战避坑手册
  • 2025口碑好的微通风窗户生产厂家TOP5权威推荐 - 工业设备
  • 1.Docker 命令大全
  • 模型推理延迟高?vLLM + Open-AutoGLM方案来了,性能提升8倍真能实现吗?
  • AI Agent卡壳?不是模型不行,而是数据没准备好!AI-ready data全攻略
  • 昇腾RecSDK Torch整体方案介绍
  • 2025年新疆汽车托运公司权威推荐榜单:二手车托运/火车托运汽车/轿车托运源头服务商精选 - 品牌推荐官
  • 【独家】Open-AutoGLM内部架构首次曝光:6层流水线设计颠覆传统GLM
  • 【Open-AutoGLM下载提速全攻略】:揭秘5大卡顿根源与高效解决方案