当前位置：首页 > news >正文

数据周刊｜2026年5月第1周：wuphf 的 Agent 共享办公室、5 框架上下文对比、Apache Fluss

news 2026/6/22 3:12:39

本期三件事：开源项目 wuphf 用 Markdown + Git 给多 Agent 搭了一个"共享办公室"，发布几周拿了 769 颗 star；Aparna Dhinakaran 拆开了 5 个主流 Agent 框架的上下文管理设计，给出"内存层级"的演进图谱；Apache Fluss 配 Roaring Bitmap 把实时用户画像的延迟从小时压到秒。一个共同的趋势——Agent 落地的下一道关，不在模型，在 Agent 之间的"协作基建"。

前几期我们聊过 Agent 要做小、做小之后怎么稳定跑生产、再之后怎么把账算清楚。这一周看到的几条主线，开始往更细的地方走——多个 Agent 之间怎么协作？它们的"共享记忆"应该长什么样？上下文管理有哪些已知的最佳实践？实时画像这种状态密集型任务怎么提效？

下面是本期的主要内容。

行业动态

wuphf：用 Markdown + Git 给多 Agent 搭一个"共享办公室"

发布几周时间，wuphf 在 GitHub 上拿了 769 颗 star——这个项目想解决一个具体问题：多个 AI Agent（Claude / Codex / OpenClaw 等）跑在各自的 API 后面，互相不知道对方在做什么，重复劳动、上下文丢失、协作不可见。

wuphf 的解法是搭一个"共享办公室"——所有 Agent 读写同一个结构化知识库。知识库后端可选三种：

Markdown + 本地 Git 仓库（默认）——简单、可审查、可 diff
Nex（知识图谱）——结构化关系
GBrain（带向量搜索 + Embedding）——语义检索

更值得说的是默认选了 Markdown + Git 这件事。这和我们第 2 周周刊讲过的"Markdown 干翻 5000 万美元的向量库"是同一种工程美学——很多场景里，最朴素的存储 + 最朴素的索引就够用，向量库是过度工程。

项目：github.com/nex-crm/wuphf（769 stars · Go 73% / TypeScript 17%）

Aparna Dhinakaran：5 个主流 Agent 框架的上下文管理对比

Arize 联合创始人 Aparna Dhinakaran 在 X 上发了一份对比——她拆开了 5 个主流 Agent 框架（OpenAI Assistants、LangGraph、Anthropic Computer Use、CrewAI、AutoGen）的上下文管理设计，给出一个共同演进方向：从"全量历史塞 prompt"到"分层记忆"。

她的归纳是这样的"内存层级"：

短时记忆（recent turns）——最近几轮对话，全量保留
工作记忆（episodic）——当前任务相关的中期状态
长期记忆（semantic）——需要持久化的事实知识，向量检索召回
元记忆（meta）——Agent 对自己历史决策的索引

这套分层和上一期 Slack 的 Director's Journal 异曲同工——主流 Agent 框架在悄悄收敛到同一种设计。如果你正在搭多 Agent 系统，这是值得参考的"标准件"。

原文：Context Management in Agent Harnesses · Aparna Dhinakaran @ Arize

Apache Fluss + Roaring Bitmap：实时用户画像的"秒级"方案

Giannis Polyzos 在他的 Substack 上写了一份实战复盘——用新晋开源项目 Apache Fluss（实时存储引擎）配上 Roaring Bitmap 编码做用户画像，延迟从小时级压到秒级。

技术细节简单说：

Apache Fluss 是个为实时分析设计的存储引擎，比 Kafka + 流式数据湖的组合更直接面向"实时画像"这种状态密集型任务
Roaring Bitmap 是高效的稀疏布尔编码——表示"用户 X 是否属于群组 Y"这种事，比传统集合压缩百倍

组合起来的效果是——千万级用户的"实时多维标签"可以在秒级响应。这是过去需要专门画像系统才能做到的事，现在用开源组件能搭出来。

原文：From Events To Real-Time Profiles On Apache Fluss · Giannis Polyzos

观点看点

Just Eat：多层数据治理的"组合拳"

英国外卖平台 Just Eat 的工程团队写了一份治理实战——他们没用任何"银弹"，而是搭了一个多层组合：

业务词典（business glossary）——口径定义
数据目录（catalog）——元数据 + 血缘
质量信号（quality signals）——自动监测异常
语义层（semantic layer）——用户访问的统一接口

他们把这套叫做 "Daedalus" ——希腊神话里建造迷宫的工匠。意思很形象——数据治理不是给迷宫画地图，是搭一组导航工具，让每一类用户都能找到自己要走的路。

这种"工具组合"思路对国内大公司有借鉴价值。国内数据治理常见的失败模式是想搞一个"全能平台"——结果什么都做、什么都做不深。Just Eat 这种"小而专"的工具集思路更可持续。

原文：Daedalus and the Data Labyrinth · Just Eat Takeaway

拾穗解读：Agent 协作的"基建配方"正在收敛

把本期几条放一起看，可以看到一个有意思的趋势——多 Agent 协作的"基建配方"，正在悄悄收敛到几个共同模式。

第 3 周周刊讲的 Slack Director's Journal、第 4 周周刊讲的 Monzo 数据契约、本期讲的 wuphf 共享办公室和 Aparna 总结的"内存层级"——这些项目互相不一定知道对方在做什么，但走出的路径惊人地相似：

都意识到"全量历史塞 prompt"不可持续
都在做某种"分层记忆 / 共享记忆"
都把"上下文该剪掉什么"当一等公民
都用"显式契约"代替"隐式约定"

这种多个独立项目自发收敛的现象，往往是一个领域在变成基础设施的信号。就像 5 年前各家数据团队都在自发收敛到 "湖仓一体" 一样。当大家都在解同一个问题、解法又长得很像的时候，意味着这个领域的"标准件"快定型了。

对数据从业者个人来说，这意味着两件具体的事——

第一，"Agent 协作基建"是接下来 12 个月最值得追的方向之一。它不像 RAG 那样卷得已经红海，但又不像更深的研究方向那样和你日常工作距离遥远。正好处于"标准化进行中"的窗口期——早入场的人能享受到设计标准的话语权。

第二，多 Agent 系统的设计能力，会变成新的稀缺技能。不是会调 LangGraph、不是会写 Agent prompt，而是能从架构层面回答：

我的 Agent 们应该怎么共享状态？
哪些信息该共享、哪些该隔离？
上下文剪枝的策略是什么？
长期记忆该用什么后端、什么时候召回？

这些问题没有教程，是我们上周写的"会用模型 5 种能力" 在多 Agent 场景的延伸。

Apache Fluss 那条其实想表达的是另一个旧话题的新版本——实时分析这件事，工具又便宜又好用了。10 年前实时画像是大公司的奢侈品，5 年前是中等公司的难题，今天用开源组件 + 几个工程师能在两周搭出来。国内做用户运营 / 风控 / 营销自动化的团队应该看一眼——你们花在传统画像系统上的钱，可能多花了一个数量级。

最后是 wuphf 给我的一个细节启发——"默认 Markdown + Git"这个选择很有意思。它不是一个技术决定，是个哲学决定——承认大多数 Agent 协作场景的复杂度，没有高到需要图数据库。这种"务实的简朴"，是这一行最稀缺的产品判断。

如果让我给这一期做一句话的收束：Agent 协作的基建已经在收敛，越早学会用"共享记忆 + 显式契约"的人，越早能从"调 prompt"进化到"搭系统"。

说到这里我自己一直在琢磨——如果让我从零搭一个生产级的多 Agent 系统，工程清单上的前 10 件事是什么？ 这是我最近在梳理的下一个题目，有想法的朋友可以加我微信（shisuidata）一起聊。

本周其他值得看的

Mistral Medium 3.5：法国 Mistral 发布 Medium 3.5，主打远程 Agent 场景。和 DeepSeek V4 一起，本周开源 + 开放权重模型市场再次热闹
Doing More With Less: Entity-Level Sentiment at Scale：Meltwater 用单次 Transformer 前向传递提取多实体嵌入，推理成本降 45.5%
Airflow DAG Bundles: Managing DAGs Without Helm Upgrades：S3 后台同步实现 DAG 热重载，30 秒内完成新管道部署
A Benchmark for Deterministic LLM Outputs：Interfaze 推出新基准，专门测 LLM 在结构化输出场景的确定性——和我们前几天讲的 Eval 设计互相呼应

我叫石头，在数据行业里摸爬滚打了十几年，这一轮 AI，我也是边看边想。这里写的，就是这些观察——我觉得值得说出来的那部分。

数据来源：