当前位置: 首页 > news >正文

每天花两小时刷信息?这个开源项目帮你全自动搞定

你有没有算过每天花多少时间刷信息?

Hacker News 看一眼,Reddit 刷两下,Telegram 频道翻一遍,GitHub Trending 扫一圈,再顺手打开 X——两小时没了。最气人的是,90% 的内容要么是看过的,要么对你毫无价值。

GitHub 上有个叫 Horizon 的项目(2,800+ 星),就是来干这件事的:把"刷信息"自动化掉,只给你看真正重要的东西。

本文提纲

  1. Horizon 是什么?怎么跑起来的?
  2. 七步流水线:从抓取到你手里
  3. AI 打分——"重要"这件事,你来定义
  4. 六大数据源,跨平台去重
  5. 部署起来有多简单?
  6. 适合谁用?

七步流水线:从抓取到你手里

Horizon 的核心是一条七步处理流水线:

Fetch → Deduplicate → Score → Filter → Semantic Dedup → Enrich → Summarize & Deploy

拆开讲:

  1. Fetch — 并发拉取所有配置的数据源,HN、Reddit、RSS、Telegram、GitHub、X,一起来
  2. Deduplicate — 跨源 URL 去重,同一条新闻不会出现两次
  3. Score — AI 对每条内容 0-10 打分
  4. Filter — 保留高于阈值的内容(默认 6.0)
  5. Semantic Dedup — 语义去重,同一事件的不同报道只留最有价值的一条
  6. Enrich — 对高分条目自动搜索背景知识,顺带把社区评论总结进来
  7. Summarize & Deploy — 生成中英双语结构化 Markdown,推送到你指定的渠道

整条链路跑完,你拿到的是一份已经过滤、评分、补充了背景知识的双语简报

AI 打分——"重要"这件事,你来定义

这是 Horizon 最核心的设计。

AI 对每条内容打 0-10 分,标准如下:

分数 等级 含义
9-10 Groundbreaking 重大突破、范式转变
7-8 High Value 重要进展、新工具/库
5-6 Interesting 值得了解但不紧急
3-4 Low Priority 常规内容
0-2 Noise 不相关或低质量

每条内容返回结构化的评分结果:

{
  "score": 8.5,
  "reason": "新开源的 Rust 编译器框架,已获多家公司采用",
  "summary": "一句话摘要",
  "tags": ["rust", "compiler", "open-source"]
}

模型、评分阈值、评分 Prompt 全部可配置。 支持 Claude、GPT-4、Gemini、DeepSeek、豆包、MiniMax、Azure OpenAI——甚至任何兼容 OpenAI API 的服务。

觉得 AI 给的分不准?改 Prompt。觉得太严格?调阈值。什么叫"重要信息",你来定义。

自动补背景——不认识的项目,帮你查

对高分条目,Horizon 会做二次 AI 分析,自动搜索背景知识并生成结构化报告:

  • What's New — 这件事新在哪
  • Why It Matters — 为什么值得关注
  • Key Details — 关键技术细节
  • Background — 前因后果
  • Community Discussion — 社区在讨论什么

每个字段都有中英双语版本。你不需要认识那个公司或项目,Horizon 帮你查清楚,还会把 Reddit 评论、HN 讨论一并总结进来,让你不仅知道发生了什么,还知道大家怎么看。

六大数据源,跨平台去重

数据源 抓什么 评论支持
Hacker News Top stories(按分数过滤)
Reddit Subreddit 帖子 + 用户帖子
RSS / Atom 任意 Feed
Telegram 公开频道消息
GitHub 用户事件 & 仓库 Release
Twitter/X 用户推文 + 回复展开

跨源 URL 去重 + 语义去重,双重保险。同一条新闻不管出现在几个平台上,只看一次。

输出到哪?随你选

生成的简报可以推送到:

  • GitHub Pages — 通过 GitHub Actions 自动部署,开箱即用的静态网站
  • 飞书 / 钉钉 / Slack / Discord — Webhook 推送
  • 邮件 — 内置 SMTP 订阅系统,支持 Subscribe/Unsubscribe
  • MCP — 内置 MCP Server,AI 助手可直接调用
  • 本地文件 — 保存到 data/summaries/

一种或多种渠道同时推,都行。

部署起来有多简单?

三种方式,从简单到自动化:

本地跑

git clone https://github.com/Thysrael/Horizon.git
cd Horizon
uv sync
uv run horizon

Docker

docker-compose run --rm horizon           # 默认拉取最近 24h
docker-compose run --rm horizon --hours 48 # 指定时间范围

GitHub Actions 全自动:Fork 仓库,配好环境变量,Actions 每天定时跑,自动部署到你的 GitHub Pages。

第一次配置有交互式向导:

uv run horizon-wizard

根据你的兴趣推荐数据源,社区还维护了一套预设配置,直接复制就能用。

适合谁?

  • 内容创作者——追热点不用每天刷两小时,AI 帮你筛出值得写的话题,连背景资料都准备好了
  • 技术团队——同步行业动态不用靠群里转发,每天一份简报推到飞书,全团队信息对齐
  • 个人开发者——不想装一堆 App 刷信息,配置好数据源和阈值,每天看一份邮件就够了

项目基于 Python 3.11+,用 Pydantic v2 做数据验证,httpx 做异步 HTTP,代码结构清晰。MIT 协议,2,800+ 星,370 fork,主贡献者 Thysrael 至今保持日更频率。

如果你每天在信息洪流里挣扎,试试 Horizon。让 AI 帮你把信息"噪音"过滤掉,只留真正值得你花时间看的东西。

项目地址:https://github.com/Thysrael/Horizon


作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn(每日分享最前沿的AI新闻和技术)

本文首发于 AI人工智能时代,转载请注明出处。

http://www.jsqmd.com/news/772973/

相关文章:

  • 如何彻底摆脱Windows浏览器劫持?EdgeDeflector让你的选择权回归
  • 打卡信奥刷题(3226)用C++实现信奥题 P8398 [CCC 2022 S4] Good Triplets
  • 3步实现视频PPT智能提取:extract-video-ppt让课件整理自动化
  • AI模型线上部署的A/B测试设计指南
  • 学之思开源考试系统:3步快速搭建专业在线考试平台的完整指南
  • 基于MCP协议的AI编码助手治理平台:跨模型记忆与自动化API检查
  • 苏州装饰公司哪家靠谱?2026年苏州本地高口碑装修公司推荐排名 - 速递信息
  • 08-MLOps与工程落地——模型注册表与模型服务
  • 如何通过3步解锁QQ群聊天记录的隐藏价值:ChatLog完整指南
  • 重构搜索范式:阿里云 Elasticsearch 开启“Agent 原生”时代,打造企业级 AI 记忆湖
  • 【新人专属】OpenClaw 2.6.6 Windows 11 一键部署完整教程(包含安装包)
  • PySide6实战:手把手教你用SQLite+QTableView打造个人数据管理工具(附源码)
  • 3分钟终极指南:qmcdump轻松解锁QQ音乐加密文件,实现音乐自由播放
  • 5分钟搞定AI文本生成:oobabooga一键安装完全指南
  • 终极指南:如何用markdownReader插件彻底改变你的Markdown阅读体验
  • 集团首都公报:继美国谷歌公司、苹果公司之后,世界第三家手机控制系统公司(即     武汉市放飞炬人控制系统有限公司)今天2026年5月6日9点36分获得官方批准。
  • 昆山老房翻新装修公司哪家靠谱?2026年口碑推荐与避坑指南 - 速递信息
  • AI Agent团队数字档案库:用工程化方法管理角色人格与长期记忆
  • 大语言模型结构化剪枝实战:基于LLM-Pruner的模型压缩与部署优化
  • Windows热键冲突终极指南:三步快速定位被占用的快捷键
  • XnConvert v1.111.0 图像格式转换调整
  • 如何在XSLT中将动态字段值(如姓名)安全注入HTML链接的URL参数
  • HTML怎么标注回收估价规则_HTML估价逻辑说明折叠区【指南】
  • Install-TidGi-Windows-x64安装步骤详解(附TidGi知识库搭建教程)
  • 2026年昆山装修公司全包价格性价比最高排行榜推荐与避坑指南 - 速递信息
  • 中国词元:构建自主AI生态的“云-端“协同战略
  • AI_Agent记忆系统设计与实现
  • JavaScript中Object-getOwnPropertySymbols获取方法
  • 别再死记硬背三环了!用Arduino+伺服电机做个机械臂,实战理解位置、速度、力矩模式
  • 血清替代物(人血小板裂解液)从工艺到细胞扩增性能替代FBS的可行性分析