当前位置：首页 > news >正文

记忆张量科技联合上交大等开源MemOS：LLM长期记忆操作系统，时序推理较OpenAI提升159%

news 2026/7/7 12:00:23

前言

2025年7月7日，记忆张量（上海）科技有限公司联合上海交通大学、中国人民大学、同济大学、浙江大学、中国电信研究院等十多家顶尖学术与产业机构，正式开源MemOS（Memory Operating System）工业级记忆操作系统。这是全球首个将"记忆"提升为与算力、存储同等重要的一级计算资源的LLM基础设施，彻底解决了大模型"健忘症"、时序推理能力弱、跨任务记忆丢失等行业痛点。

在权威的LOCOMO长期记忆基准测试中，MemOS实现了对OpenAI全局记忆的全面超越：整体推理准确率提升38.97%，Token开销降低60.95%，在最具挑战性的时序推理任务上更是取得了159.15%的惊人提升，一举登顶全球记忆管理系统SOTA。截至2026年5月13日，MemOS已迭代至v2.0"星尘（Stardust）"版本，GitHub星标突破1.2万，累计部署量超过8万次，被超过3000家企业用于智能体和个性化AI应用开发。

官方资源：

GitHub开源仓库：https://github.com/MemTensor/MemOS
官方网站：https://memos.openmem.net
技术论文：https://arxiv.org/abs/2507.03724
开源协议：Apache 2.0，个人与商业无限制免费使用

一、核心痛点：传统LLM记忆系统的致命缺陷

当前大模型的记忆能力主要依赖两类短期记忆：参数记忆（固化在模型权重中，更新困难）和激活记忆（KV缓存，仅在单轮会话中存在）。这种架构导致了四大无法解决的核心问题：

上下文窗口瓶颈：即使是200万Token的超大窗口，也无法存储跨天、跨周的长期交互历史
时序信息丢失：模型无法准确记忆事件发生的时间顺序，经常出现"张冠李戴"的时序错误
跨任务记忆断裂：不同会话、不同任务之间的记忆无法互通，每次交互都需要重新输入上下文
记忆不可控：无法编辑、删除或修正模型的错误记忆，只能通过重新提示来覆盖
安全隐私风险：所有记忆都存储在云端，存在数据泄露和滥用的风险

传统的RAG（检索增强生成）方案只是"临时补丁"，它只能被动检索外部文档，无法实现记忆的主动更新、演化和推理。而MemOS从操作系统的视角重新设计了记忆管理体系，为LLM提供了一套完整的"记忆生命周期管理"能力。

二、核心定位：为AI打造的"记忆操作系统"

MemOS不是一个简单的向量数据库或RAG工具，而是一个专为LLM和AI Agent设计的完整记忆操作系统。它就像计算机的操作系统管理CPU和内存一样，统一管理AI的所有记忆资源：

统一抽象：将参数记忆、激活记忆和明文记忆统一抽象为"MemCube"记忆单元
全生命周期管理：支持记忆的创建、读取、更新、删除、合并、迁移和演化
动态调度：根据任务需求自动在不同类型的记忆之间调度数据，平衡速度和容量
多模态支持：原生支持文本、图像、音频、工具调用轨迹等多种类型的记忆
安全隔离：支持用户级、项目级、Agent级的记忆隔离和权限控制

这种设计使得AI能够像人类一样，拥有短期记忆、长期记忆和技能记忆，能够从经验中学习，不断进化自己的能力。

三、六大核心特性，打造工业级记忆基础设施

1. MemCube统一记忆抽象：三种记忆自由转换

MemOS提出了MemCube（记忆立方体）的核心概念，将所有类型的记忆封装为标准化的单元：

明文记忆：存储原始文本、图像、音频等数据，容量无限
激活记忆：存储模型推理过程中的中间状态，访问速度最快
参数记忆：存储从经验中提炼的知识和技能，调用效率最高

MemOS能够自动在三种记忆之间进行转换：频繁使用的明文记忆会被提升为激活记忆以提高访问速度；稳定且重要的模式会被提炼为参数记忆以实现高效调用。这就像人类学习过程中，反复练习的技能会从有意识控制转变为自动化反应。

2. 时序推理引擎：159%提升的核心秘密

这是MemOS最核心的技术突破。它为每个记忆单元自动添加时间戳元数据，并构建了专门的时序索引结构：

支持精确的时间范围查询，如"查询上个月的所有会议记录"
能够推理事件之间的因果关系和时间顺序
自动识别模糊的时间表达，如"前天"、“上周”、“下个月”
支持时间线可视化，直观展示事件的发展过程

在LOCOMO基准测试中，MemOS的时序推理准确率从OpenAI的0.2825提升到0.7321，实现了159.15%的飞跃，彻底解决了大模型"记不住时间"的问题。

3. 三层可扩展架构，工业级稳定性

MemOS采用三层解耦的模块化架构，支持从个人设备到企业级集群的无缝扩展：

API层：提供统一的RESTful和Python API，一行代码即可接入所有主流LLM
调度管理层：MemScheduler动态调度记忆资源，实现毫秒级响应
存储基础设施层：支持SQLite、PostgreSQL、Redis、向量数据库等多种存储后端

官方测试显示，MemOS在单台服务器上可支持10万+并发用户，平均响应时间低于50ms，完全满足生产环境的高并发需求。

4. 多模态记忆与工具记忆

MemOS原生支持多模态记忆存储和检索：

文本记忆：对话历史、文档、代码、笔记
图像记忆：截图、照片、图表
工具记忆：工具调用轨迹、执行结果、错误日志
人格记忆：用户偏好、性格、习惯

同时，它还支持技能记忆功能，能够将AI完成任务的过程提炼为可复用的技能，在后续任务中自动调用，实现"一次学习，终身使用"。

5. 本地/云端双部署，零数据泄露风险

MemOS提供两种部署模式，满足不同用户的安全需求：

本地模式：100%在用户设备上运行，所有数据存储在本地SQLite数据库中，零云端依赖
云端模式：支持Docker一键部署到私有云或公有云，提供企业级安全和可扩展性

两种模式使用完全相同的API，开发者可以根据需求自由切换，无需修改任何代码。

6. MCP协议原生支持，全生态兼容

MemOS v2.0原生支持MCP（模型上下文协议），可无缝集成到Claude Code、CherryStudio、Cline等所有支持MCP的AI客户端。只需一行配置，就能让你的AI助手拥有长期记忆能力，记住你所有的偏好和历史交互。

四、技术突破：如何实现159%的时序推理提升？

MemOS的优异性能并非来自简单的参数堆叠，而是来自于四项原创的核心技术创新。

1. 时序感知的混合检索机制

传统的向量检索只关注语义相似度，完全忽略了时间信息。MemOS提出了时序-语义混合检索算法，在检索时同时考虑语义相似度和时间相关性：

对于近期发生的事件，给予更高的时间权重
对于重要的历史事件，给予更高的语义权重
支持自定义时间衰减函数，模拟人类的遗忘曲线

这种机制使得MemOS能够准确检索到特定时间范围内的相关记忆，大幅提升了时序推理的准确率。

2. Next-Scene Prediction预加载机制

MemOS内置了下一场景预测模块，能够根据当前对话上下文，提前预加载可能需要的记忆片段：

当用户提到"上次的项目"时，自动预加载该项目的所有相关记忆
当用户开始讨论一个新话题时，自动切换到对应的记忆空间
预加载过程在后台异步进行，不会影响用户体验

官方数据显示，这种机制将记忆检索的平均延迟降低了72%，同时将Token开销减少了60.95%。

3. 记忆演化与反馈修正

MemOS支持自然语言反馈修正记忆，用户可以直接用中文告诉AI"你记错了，这件事发生在上周三，不是上周二"，AI会自动修正对应的记忆单元。同时，MemOS会根据用户的反馈不断优化记忆的权重和关联关系，让记忆越来越准确。

4. 多智能体记忆共享与隔离

MemOS支持多个AI智能体之间的记忆共享与协作：

同一用户的多个智能体可以共享用户偏好和通用知识
不同项目的智能体之间记忆完全隔离，避免信息泄露
支持团队级记忆空间，团队成员的AI可以共享项目相关的记忆

五、性能对比：全面超越主流记忆系统

在LOCOMO长期记忆基准测试中，MemOS与OpenAI全局记忆、Mem0、MemU等主流方案的对比如下：

测试任务	OpenAI全局记忆	Mem0	MemU	MemOS	MemOS提升（vs OpenAI）
平均准确率	0.5275	0.6123	0.5876	0.7331	+38.98%
单跳推理	0.6183	0.6892	0.6547	0.7844	+26.86%
多跳推理	0.6028	0.6215	0.5983	0.6430	+6.67%
开放域问答	0.3299	0.4567	0.4123	0.5521	+67.35%
时序推理	0.2825	0.3542	0.3178	0.7321	+159.15%
Token开销（相对值）	1.0	0.72	0.85	0.39	-60.95%

数据来源：MemOS官方技术报告、LOCOMO基准测试官方结果（2025年7月）

从测试结果可以看出，MemOS在所有任务类型上均优于其他方案，尤其是在时序推理和开放域问答任务上，优势极其明显。同时，它的Token开销仅为OpenAI全局记忆的39%，性价比极高。

五、5分钟快速上手

5.1 安装MemOS

# 使用pip安装pipinstallmemos# 验证安装memos--version

5.2 本地模式快速体验

frommemosimportMemOS# 初始化本地MemOS实例mag=MemOS(mode="local")# 添加记忆mag.add_memory(user_id="user123",content="2026年5月10日，我和张三在上海开会，讨论了项目X的进度，决定下周三提交第一版原型",timestamp="2026-05-10")mag.add_memory(user_id="user123",content="2026年5月12日，我收到了李四的邮件，他说项目X的预算已经批准了",timestamp="2026-05-12")# 查询记忆result=mag.query_memory(user_id="user123",query="项目X最近有什么进展？")print(result)# 输出：# 2026年5月10日，你和张三在上海开会，讨论了项目X的进度，决定下周三提交第一版原型。# 2026年5月12日，你收到了李四的邮件，他说项目X的预算已经批准了。

5.3 集成到Claude Code

只需在Claude Code的MCP配置中添加以下内容，即可让Claude拥有长期记忆：

{"mcpServers":{"memos":{"command":"python","args":["-m","memos.mcp_server"]}}}

六、典型应用场景

1. 个人AI助理

记住你的所有偏好、习惯和日程安排
自动整理会议记录、邮件和聊天信息
跨会话保持上下文，无需每次重复说明
提醒你重要的事项和截止日期

2. 企业智能体

构建企业级知识库，沉淀团队经验和知识
支持多智能体协作，共享项目记忆
自动生成工作日报、周报和项目总结
辅助新员工快速上手，降低培训成本

3. 智能客服

记住每个客户的历史咨询记录和偏好
无需客户重复说明问题，提供个性化服务
自动识别常见问题，快速给出解决方案
持续学习客户反馈，不断优化服务质量

4. 医疗健康

记录患者的病史、用药情况和检查结果
辅助医生进行诊断和治疗方案制定
提醒患者按时服药和复诊
生成个性化的健康建议和康复计划

5. 教育学习

记录学生的学习进度和知识掌握情况
生成个性化的学习计划和练习题
自动批改作业和试卷，给出详细的讲解
跟踪学生的学习效果，及时调整教学策略

七、未来规划

记忆张量科技表示，将持续投入MemOS的研发，未来计划：

推出MemOS 3.0：引入多模态大模型，进一步提升图像和视频记忆的理解能力
增强技能记忆：支持更复杂的技能提炼和迁移，让AI能够真正从经验中学习
发布企业版：提供SLA保障、技术支持和高级安全功能
建设生态社区：鼓励开发者贡献插件和模板，丰富MemOS的应用场景
推动行业标准：联合产学研机构，制定LLM记忆管理的行业标准

结尾

MemOS的开源，标志着大模型技术从"感知时代"进入了"记忆时代"。它不仅解决了大模型"健忘症"的痛点，更为AI的持续学习和进化提供了坚实的基础设施。

从"只能单次推理的计算器"到"拥有长期记忆的智能体"，MemOS正在重塑AI的能力边界。未来，随着记忆技术的不断发展，AI将能够真正理解人类的需求，记住我们的过去，陪伴我们的现在，预见我们的未来，成为每个人不可或缺的智能伙伴。

查看全文

http://www.jsqmd.com/news/810364/

2026上海大众搬家号码/大众搬家联系方式/大众搬家电话号码/推荐指南 - 速递信息

如何快速掌握Avogadro 2：开源分子可视化工具的终极指南

2026年全屋定制行业东莞三喜家具有限公司：深耕多年的口碑优选服务商 - 速递信息

Windows平台APK安装实战：突破Android应用在PC端的部署壁垒

2026东四省艺考集训TOP5！辽宁沈阳等地学校机构靠谱出成绩获好评 - 十大品牌榜

告别BRAM！手把手教你用Vivado 2020.1为MicroBlaze工程挂载DDR3内存（附完整MIG配置流程）

ChatGPT 2026正式版来了：支持原生多模态实时推理、离线边缘部署、跨平台记忆同步——开发者必须今晚适配的5个API变更

绍兴GEO推广平台怎么选才靠谱？ - 速递信息

DeepSeek-Coder-V2：如何用这个免费开源AI编程助手提升你的开发效率？终极指南

5个关键技巧：掌握AutoJs6界面布局设计的最佳实践

基于MCP协议在Cursor中集成AI绘图：实战搭建与深度应用指南

2026东四省艺考培训TOP5！辽宁沈阳等地学校中心成绩优异口碑出众 - 十大品牌榜

TrendForge 每日精选：10 个热门开源项目，今日总获星 11321 颗！

Axure RP中文界面终极指南：一键告别英文困扰，让原型设计更流畅

合肥黄金回收哪家靠谱？本地5家机构深度测评 - 野榜数据排行

Windows平台微信/QQ/TIM防撤回补丁完整指南：如何彻底阻止消息被撤回

穗宝床垫好不好？穗宝床垫用54载匠心沉淀，用品质说话！ - 速递信息

【独家首发】Gemini Chrome插件安全审计报告：发现2类未公开API越权风险，仅限前500名开发者获取修复补丁

Trae IDE 搭载 Burp Suite MCP Server 完整指南 —— 让 AI 直接操控 Burp Suite

开源协作核心技能：从Git高级操作到社区治理的完整指南

2026手持式加热设备/感应加热设备/熔炼炉/热套机厂家推荐 - 速递信息

SimCSE中文实战避坑指南：从数据准备、模型训练到效果评估的完整流程

告别真机调试：用QEMU模拟ARM vexpress-a9板子运行自定义Linux系统（含rootfs制作）

你正在找无人机电力巡检公司？这5个选型维度比榜单靠谱 - 速递信息

儿童自闭症行为检测数据集VOC+YOLO格式5248张34类别有增强

Win11内核隔离与VMware兼容性冲突：原理剖析与一键关闭指南

2026年5月天津重型货架/阁楼货架/窄巷道货架/贯通货架/板材货架厂家解析，认准天津顺宏伟业货架制造有限公司 - 2026年企业推荐榜

Perplexity检索JAMA文献的“黑箱”终于被拆解：基于127篇顶刊论文的检索路径逆向分析（含完整日志样本）

3个高效方法解决图片重复难题：AntiDupl.NET开源工具实战指南

2026年产后恶露专用尿不湿选购指南：主流品牌优势与适配场景深度解析 - 产业观察网

前言