
由UCSD和NYU团队领导的新系统Mirix将重新定义AI内存。在过去的十年中,我们目睹了从写作助理到代码生成器的主要语言模型,可以做到一切。但是,即使是最强大的模型仍然有一个主要的弱点:他们不记得你。为了应对这种情况,王王是加利福尼亚大学圣地亚哥分校(UCSD)的医生学生,纽约大学的教授Xi Chen共同推出和开放式Mirix,这是第一个真正的多模式,多模式的AI Memory System。 Paper Title: Mirix: Multi-Agent Memory System for LLM based on link agents link: https://arxiv.org/abs/2507.07957 Official website: https://mirix.io/open source warehouse: https://github.com/mirix-ia In the Screenshotvqa, the ISThe challenging benchmark that requires deep multimodal understanding, Mirix的准确性比传统的抹布方法高35%,储存开销降低了99.9%,比410%高410%长文本方法,开销降低了93.3%。在Locomo Long对话的工作中,Mirix显着超过了所有标志85.4%的现有理由,并设定了新的性能基准。不仅如此,团队还推出了MAC端应用程序产品。使用此开箱即用的应用程序,任何人都可以让AI看到您看到的内容,了解您在做什么,并制作所有电子记忆。一个完全多样化的范式评估了过去三年中AI进化的历史,我们将看到:大型推理模型的极限:Skyrock参数×计算功率飙升;矢量搜索紧急情况:抹布剪接片段; “短期记忆”是在线:对话历史记录有限的评论。但是所有这些都不是一个“心理系统”。 Mirix首先制作:支持多模式输入:不仅可以理解文本,而且还可以使用多源数据(例如高分辨率屏幕截图,对话日志等)开发全局内存。它具有六种主要类型的HU类型MAN内存系统:每个内存模块都有一个独家数据结构,生命周期管理方法和独立的提取路线。内置的多代理协作:通用控制由元内存管理器进行,六个内存代理并行更新,并获得了分裂的劳动力,并且统一联系人是通过对话代理传递的。主题和分层搜索的主动生成:与“首先检查然后回答”不同,Mirix将首先查看用户的目标,自动生成主题嵌入,然后匹配适当的内存类型以进行多层搜索。生产实施:该团队已经开发了个人助理的应用程序,该应用程序用Mac完成,您可以在官方网站上下载并体验它。这不再是填写“嵌入式空间”知识,而是以结构化的多渠道和新兴的方式建立认知基础。为什么它应该是AI的“序言”?Mirix有六种类型的基本记忆,并且可以共享认知论文:核心记忆:AI的“个性”存储和长期用户偏好:Asdialogue样式,偏好设置和识别信息。数据存在于永久性KV对中,优先级最高,任何答案都会自动加载。情节记忆:“人类事件日志,其中包含时间戳,事件类型,主题,简短描述和细节,可以监视用户历史记录中的所有操作。语义记忆:每个音符都包含“名称,含义,含义,详细描述,资源的详细说明,资源”。会议,用户上传的用户网页快照:保存敏感信息,例如密码,API键,ID号,并配备了多层次的访问和加密机制。过去,抹布只能“在旅途中检查其中一堆”。 Mirix将首先了解需求,然后决定要搜索哪些内存,然后结合答案。换句话说:它认为“我想记住的东西”而不是机械索引。多代理流向现代AI系统,用于长期内存,模型应使用实时,结构化任务指令和大型多模式信息(例如屏幕截图或文件)来处理极其动态和异质的用户触点输入。在确保一致性,可伸缩性和良好获取的同时,管理如此多样化的数据远非足够。直到今天,团队都建议进行模块化的多古体系结构,其中一些特殊组件共同使用,以完成统一的调度机制下的输入处理,内存更新和信息提取。整个系统包括:元内存管理器,内存管理器和聊天代理。当系统收到新输入时(这样作为用户提供的用户提供的知情事件,上传文件),它将处理如下:初步搜索:系统将首先对现有内存库进行自动搜索,以便查看一下将其存储在与输入内容非常相似的记录中。此步骤有助于防止冗余存储,并根据需要更新现有条目。评估和分析:所获得的信息将传递给具有输入的原始内容的Metamemory Manager,并欣赏内容,提取元数据(例如时间戳,资源类型,触摸标记),并确定需要更新哪些内存组件。并行更新:Metamemory Manager向每个相关的内存管理器分发输入。每个经理都能够团结以下操作:(1)i -xtract结构化字段(例如摘要,详细信息,事件参与者)(2)重复数据删除或结合相似的记录(3)更新索引和扣除表示搜索中的ComputationRMA使用:当所有相关的内存管理器都完成更新时,它们会馈入元符号更新状态,并且系统发送外部确认,表明更新内存结束。在交互式对话方案中查找对话聊天工作流的过程,搜索过程主要分为以下步骤:粗略搜索:收到用户查询时,对话代理将对所有六个内存组件进行粗略的谷物搜索,这将返回高级的摘要或元数据信息以判断内存分配。目标搜索选择:根据粗略的搜索结果和查询内容进行审查的对话代理。例如,如果问题是一个操作过程(例如“如何提交补偿形式?”),请重点关注程序的内存;如果问题是现实评论,则主要关注情节记忆或语义记忆。精细搜索:对于目标内存的指定组件,系统将我们e更准确的搜索技术,包括:基于垂直向量的搜索相似性; BM25文本相关排序;关键字。答案的结果和几代:使用用户的问题搜索模型的模型,最终答案将开发模型。对应的内存管理器以完成Operacyon更新。此过程确保系统的答案不仅相同,而且还可以根据最新的动态知识进行调整。突破使玻璃和其他记忆系统粉碎了。在ScreenShotVQA中,新型的多模式建造的多模式工作,Mirix存储工作比RAG低99.9%,但准确率比RAG高35%。与上下文的全部推理相比,存储量减少了93.3%,准确性率提高了410%!在多轮的机车推理活动中,全面的准确率达到了85.4%,拥有多种现有型号,包括备忘录,我M0等;多跳的问题主要是开放资源基础。全面的性能几乎与整个上下文模型接近(性能Nits G Lokomo几乎是上限,因为GPT-4.1-Mini具有1M上下文窗口)。它不仅是“更好”,而且与Mirixa团队完全不同,“获得一代增强是一个暂时的补丁。对于真正的记忆,让AI在时间的大小上成长。”这是大型模型模型的新循环:从“对话的产生”到“长期思维驱动驱动的思想”。此外,Mirix不仅仅是一张纸。 Mirix团队同时启动了个人助理应用程序的桌面版本,该应用程序可以实现即时多模式数据收集,视觉内存管理和存储在本地SQLITE的存储器,以保护隐私,立即安装它,并在第一个中体验AI”。