当前位置: 首页 > news >正文

277. Java Stream API - 去重与排序:Stream 中的 distinct() 与 sorted()

文章目录

  • 277. Java Stream API - 去重与排序:Stream 中的 `distinct()` 与 `sorted()`
      • 🎯 目标
    • 🧼 `distinct()` —— 去重利器
      • 📌 定义:
      • 🔍 `distinct()` 的内部原理
      • ✅ 示例:整数去重
      • 🔽 输出:
    • 📊 `sorted()` —— 排序操作
      • 📌 定义:
      • 🧠 工作机制:
      • ✅ 示例 1:自然排序(String 实现了 Comparable)
      • 🔽 输出:
      • ✅ 示例 2:按长度排序(使用 Comparator)
      • 🔽 输出:
    • 🔁 无限流中的表现对比
      • ✅ `distinct()` 适用于无限流
        • 示例:
      • 🔽 输出:
      • ❌ `sorted()` 不适用于无限流
        • 示例(反例):
      • ⚠️ 输出:
    • ✅ 总结对比
    • 🧠 延伸小技巧
      • 🧩 想去重自定义对象?

277. Java Stream API - 去重与排序:Stream 中的distinct()sorted()


🎯 目标

本节将讲解如何使用distinct()去除重复值,使用sorted()对流元素排序,包括:

  • 它们的工作机制
  • 使用示例
  • 注意事项(如可用于无限流与否)
  • 性能影响

🧼distinct()—— 去重利器

📌 定义:

distinct()会移除流中重复的元素,依据是元素的:

  • hashCode()
  • equals()

所以:你使用的对象必须正确实现这两个方法,才能保证去重有效。


🔍distinct()的内部原理

distinct()并不像大多数中间操作那样是“无状态”的:

  • 内部维护一个Set集合来追踪已见过的元素。
  • 每处理一个元素,会尝试把它加入Set
    • ✅ 加入成功:表示是第一次出现,传递下游。
    • ❌ 加入失败:说明是重复的,直接丢弃。

⚠️ 因为要维护状态,所以它会占用内存,但能即时输出结果。


✅ 示例:整数去重

List<Integer>ints=List.of(1,4,2,1,3,3);List<Integer>distincts=ints.stream().distinct().toList();System.out.println("distinct ints: "+distincts);

🔽 输出:

distinct ints:[1,4,2,3]

✅ 说明:重复的13被移除了,且保持原始顺序。


📊sorted()—— 排序操作

📌 定义:

sorted()用于将流中的元素排序。

它有两个重载:

Stream<T>sorted();// 自然顺序(元素必须实现 Comparable)Stream<T>sorted(Comparator<?superT>c);// 自定义顺序

🧠 工作机制:

  • sorted()是有状态的中间操作。
  • 必须读取所有元素后再排序输出
  • 所以它不适用于无限流,会导致挂起或卡死。

✅ 示例 1:自然排序(String 实现了 Comparable)

List<String>strings=List.of("one","two","three","four");List<String>naturalSort=strings.stream().sorted().toList();System.out.println("natural sort: "+naturalSort);

🔽 输出:

natural sort:[four,one,three,two]

👉 字符串按照字典序排序。


✅ 示例 2:按长度排序(使用 Comparator)

List<String>shortestFirst=strings.stream().sorted(Comparator.comparingInt(String::length)).toList();System.out.println("shortest first: "+shortestFirst);

🔽 输出:

shortest first:[one,two,four,three]

👉 按字符串长度升序排序。


🔁 无限流中的表现对比

distinct()适用于无限流

可以边处理边输出,只要有足够的终止条件(如limit()),就不会卡死。

示例:
varints=IntStream.iterate(0,i->i+1).map(i->i/3).distinct().limit(5).toArray();System.out.println("ints = "+Arrays.toString(ints));

🔽 输出:

ints=[0,1,2,3,4]

🌟 它发现新值就会推送给下游,表现非常高效!


sorted()不适用于无限流

因为它必须先收集所有元素再排序,所以当流无限时,它永远等不到结束,程序会卡死或耗尽内存。

示例(反例):
int[]ints=IntStream.iterate(0,i->i+1).map(i->i/3).sorted().limit(5).toArray();System.out.println("ints = "+Arrays.toString(ints));

⚠️ 输出:

<程序将无限等待,永远没有结果>

✅ 总结对比

方法是否有状态是否可用于无限流内部机制
distinct()有状态✅ 支持使用Set去重
sorted()有状态❌ 不支持使用缓冲区收集+排序

🧠 延伸小技巧

🧩 想去重自定义对象?

你的类必须实现正确的:

  • equals()
  • hashCode()

示例:

recordUser(Stringname,intage){}List<User>users=...;users.stream().distinct().toList();// 正常去重

如用的是Comparator排序:

users.stream().sorted(Comparator.comparing(User::age)).toList();
http://www.jsqmd.com/news/164592/

相关文章:

  • 2025年工业/商用/酒店/大型/布草洗衣机权威推荐榜:航星洗涤机械有限公司全系产品解析 - 品牌推荐官
  • 终极指南:使用MuseGAN快速生成多轨道音乐的完整教程
  • Source Han Mono终极安装配置指南:3分钟快速上手
  • 清华镜像源替换脚本:Miniconda国内加速一键设置
  • 全球离线地图数据包:企业级GIS应用的终极解决方案
  • Keycloak零停机升级实战手册:5步实现平滑版本迁移
  • 数字集成电路PPT资源:电路系统与设计第二版完整课件获取指南
  • Miniconda环境导出与共享:确保团队协作一致性
  • 5步搭建高效IT资产管理平台:WeCMDB实战指南
  • 可执行文件布局设计:编译输出结构全面讲解
  • PlotNeuralNet终极指南:5分钟学会用代码绘制专业神经网络图
  • SublimeREPL插件:在Sublime Text中打造无缝Python交互开发体验
  • 杰理之可修改mic的通道【篇】
  • 如何快速掌握Stata:数据分析师的完整实战指南
  • CUDA安装不再难:Miniconda-Python3.9镜像内置兼容配置
  • Surya OCR文本排序技术深度解析:3大核心优势与实战应用指南
  • Unity Spaceship Demo终极指南:打造AAA级太空游戏体验
  • DataGear数据可视化:从零开始的智能分析平台实战指南
  • 终极指南:DropPoint拖放革命,告别窗口切换烦恼
  • Miniconda中安装PyTorch GPU版本的五个坑你踩过吗?
  • Subnautica Nitrox多人联机模组:开启深海协作新纪元
  • Jupyter Notebook如何连接远程Miniconda环境?
  • 使用Miniconda-Python3.9运行HuggingFace大模型实例
  • Async-Http-Client连接池健康检查终极指南:构建高性能HTTP客户端
  • AI智能体 langchain与langgraph 开发核心
  • 5个高效管理DBeaver SQL标签页的实用技巧
  • 电影购票|基于springboot 电影购票系统(源码+数据库+文档)
  • SSH连接Miniconda容器进行远程AI开发的操作指南
  • 东集PDA Android SDK终极开发指南:从入门到精通
  • WWDC应用高效内容管理全攻略:从基础操作到专业配置