当前位置: 首页 > news >正文

Shell Daily 2026-01-24: 频次统计 (Uniq Count)

Shell Daily 2026-01-24: 频次统计 (Uniq Count)

在排查生产事故时,我们经常面临这种需求:看着疯狂滚动的日志,想知道“到底是哪个 IP 在疯狂请求?”或者“哪种报错出现的频率最高?”。

如果只用 grep,你只能看到满屏的重复信息。虽然你能感觉到某些行出现的次数很多,但无法量化。此时,你需要的是一条能生成排行榜的命令组合。

怎么用

核心工具是 uniq,但它有一个反直觉的特性:它只去重相邻的行。所以它几乎总是和 sort 绑定使用。

  • uniq -c:在每行前面显示出现的次数 (Count)。
  • 组合拳sort | uniq -c | sort -nr
  1. 先排序,把相同内容聚在一起。
  2. uniq -c 统计每一团内容的数量。
  3. 最后按数量倒序排列 (sort -nr),把“榜一大哥”排在最前面。
  • 兼容性POSIX 标准。Linux/macOS 通用。

适用场景

  • 流量分析:统计 Nginx/Apache 日志中的 Top 10 访问 IP。
  • 异常归类:统计 Application Log 中各类 Exception 的发生次数。
  • 数据清洗:检查 CSV 或数据库导出文件中是否存在重复记录。

示例 1:统计报错类型

想知道日志里哪种错误最严重?

# 1. 提取包含 Error 的行
# 2. 排序并统计
$ grep "Error" application.log | sort | uniq -c15 Connection refused240 NullPointerException  <-- 罪魁祸首2 Timeout

示例 2:生成 Top 5 访问者 (经典连招)

这是运维面试中的必考题,也是实战中的高频操作。

# 假设日志格式第一列是 IP
# awk 提取 IP -> 排序聚类 -> 统计次数 -> 按次数倒序 -> 取前5
$ awk '{print $1}' access.log | sort | uniq -c | sort -nr | head -58920 192.168.1.504501 10.0.0.21200 172.16.0.1...

(注:切记 uniq 必须喂给它排好序的数据,否则它会把不相邻的相同行视为不同的记录。)

http://www.jsqmd.com/news/293287/

相关文章:

  • 2026年1月北京审计公司推荐排行榜单:聚焦科技企业审计服务的五家机构深度
  • 单机多卡TP(Ray)部署架构
  • 亲测好用!10款AI论文写作软件测评,本科生毕业论文必备
  • Pelco KBD300A 模拟器:13.项目pytest自动化测试方案规划
  • 收藏!技术寒冬破局指南:大模型应用开发成程序员小白新出路
  • 收藏级!大语言模型核心原理精讲(含ChatGPT+Transformer+实战路线)
  • 怎么查看电脑型号和配置?这款免费神器,一键看清所有硬件底细!
  • 2026年1月北京审计公司推荐排行榜单:聚焦科技企业审计服务的深度对比与评测
  • 2026年1月北京审计公司推荐排行榜单:聚焦科技企业审计服务的深度对比与客观评测
  • MySQL——存储2(造数据)和 if 结构
  • 『NAS』在绿联部署一个像素风宝可梦同人游戏-pokerogue
  • 『n8n』数据过滤
  • 高精度尘埃粒子计数器优质品牌有哪些?杭州丰控了解一下
  • 2026年宁夏银川核心商圈广告资源推荐,靠谱的高清广告屏排名揭晓!
  • 2026年重庆专业建筑结构加固施工单位推荐,为您的建筑安全护航
  • 2026年纯手工砖生产厂排名,选哪家好给你做推荐
  • 盘点临沂济宁等地美容美妆培训学校推荐,别错过好校
  • 2026年广州精品意大利进口岩板品牌,三星岩(TRE STELLE)值得关注
  • 实用指南:Arbess从基础到高阶(6) - 使用Arbess+GitLab实现Python项目自动化构建并主机部署
  • 实用指南:LLM - Agent Skills 智能体新范式
  • 新书《鸿蒙HarmonyOS 6应用开发:从零基础到App上线》出版啦
  • 高中物理梳理(不定期更新)
  • 探讨成都万通未来高级技工学校的云计算专业好不好
  • See_you_soon の 个人主页
  • Java七种常用设计模式_java设计模式,零基础入门到精通,收藏这篇就够了
  • effective java-类和接口_effective java 类,零基础入门到精通,收藏这篇就够了
  • 如何验证模型加载成功?DeepSeek-R1日志分析技巧
  • 开发者入门必看:集成Qwen儿童图像生成功能的API调用指南
  • SGLang电商推荐系统实战:结构化输出部署全流程
  • 从理论到落地:分层记忆架构在AI Agent中的应用实践