FluxMem: Ký ức là đồ thị-topology dị thể liên tục tiến hóa

arXiv: 2605.28773 · 2026-05-31
Jizhan Fang, Buqiang Xu, Zhixian Wang et al. · 浙江大學 + 阿里巴巴 + MemTensor + 同濟大學

Bộ nhớ không nên là kho lưu trữ tĩnh——FluxMem đưa bộ nhớ tác tử LLM lên SOTA trên ba chuẩn mực bằng tiến hóa đồ thị dị hợp ba giai đoạn.
記憶不該是靜態倉庫——FluxMem 用三階段異質圖演化將 LLM 代理記憶推上三個基準 SOTA。

Tóm tắt

Zhejiang University hợp tác với Alibaba đề xuất FluxMem, mô hình hóa bộ nhớ của tác tử LLM dưới dạng topo đồ thị đa tạp, liên tục phát triển qua ba giai đoạn: thiết lập kết nối ban đầu → tinh chỉnh dựa trên phản hồi → cố định hóa lâu dài, đạt kết quả SOTA trên ba benchmark: LoCoMo (95.06 so với 81.23), Mind2Web (8.1%), GAIA (+12.73%).
浙江大學與阿里巴巴聯合提出 FluxMem ,把 LLM 代理記憶建模為 異質圖拓撲 ,透過初始連線建立 → 回饋驅動精煉 → 長期固化三階段持續演化,在 LoCoMo(95.06 vs 81.23)、Mind2Web(8.1%)、GAIA(+12.73%)三基準達到 SOTA。

Dữ liệu chính

Dự án Dữ liệu Tác giả/Tổ chức Đại học Chiết Giang + Alibaba + MemTensor + Đại học Đồng Tế Kiến trúc lõi Top đồ thị phi tuyến + Pipeline ba giai đoạn tiến hóa LoCoMo Đối thoại dài hạn Độ chính xác 95.06 (Full Context chỉ đạt 81.23) Mind2Web Đại lý web Tỷ lệ thành công Cross-Task 8.1% (không lọc yếu tố thủ công) GAIA Trợ lý tổng quát Tăng tuyệt đối +12.73% Chỉ số độ trưởng thành tiến hóa Một chỉ số duy nhất đồng thời đo lường khả năng tổng quát và độ trưởng thành tiến hóa
項目 數據 作者/機構 浙江大學 + 阿里巴巴 + MemTensor + 同濟大學 核心架構 異質圖拓撲 + 三階段演化管線 LoCoMo 長期對話 95.06 準確率(Full Context 僅 81.23) Mind2Web 網頁代理 Cross-Task 成功率 8.1%(無人工元素過濾) GAIA 通用助手 絕對提升 +12.73% 演化成熟度指標 單一指標同時衡量泛化性與演化成熟度

Cơ chế

Mô hình hóa bộ nhớ đồ thị dị thể: Lưu trữ bộ nhớ dưới dạng các nút dị thể (thực thể, sự kiện, kỹ năng, tóm tắt) và các cạnh đa loại (thứ tự thời gian, nhân quả, tương đồng ngữ nghĩa, đồng xuất hiện), vượt qua giới hạn schema cố định. Giai đoạn 1: Hình thành kết nối ban đầu: Khi kỷ niệm mới được tiếp nhận, nó tự động thiết lập liên kết sơ bộ với các nút hiện có (dựa trên tương đồng ngữ nghĩa + sự gần gũi về thời gian). Giai đoạn 2: Tinh chỉnh do phản hồi thúc đẩy: Tín hiệu thành bại từ nhiệm vụ thúc đẩy điều chỉnh topology đồ thị—sửa chữa kết nối bị thiếu, cắt bỏ các cạnh gây nhiễu, hiệu chỉnh độ chi tiết khái quát hóa. Giai đoạn 3: Thép hóa dài hạn: Chưng cất các quỹ đạo thành công lặp lại thành các mạch procedural circuits có thể tái sử dụng, tạo thành đơn vị bộ nhớ cấp kỹ năng.
異質圖記憶建模 :將記憶存為異質節點(實體、事件、技能、摘要)與多類型邊(時序、因果、語義相似、共現),打破固定 schema 限制。 第一階段:初始連線形成 :新記憶進入時自動與現有節點建立初步連結(語義相似度 + 時間鄰近性)。 第二階段:回饋驅動精煉 :任務成敗訊號驅動圖拓撲調整——修復缺失連結、修剪干擾邊、校準抽象粒度。 第三階段:長期固化 :將反覆成功的軌跡蒸餾為 可重用的程序性電路(procedural circuits) ,形成技能級記憶單元。

Ứng dụng

Đối chiếu Củng cố giấc ngủ của Hermes: Giai đoạn thứ ba của FluxMem - "Chưng cất quỹ đạo thành công → Mạch quy trình" - có sự liên kết chặt chẽ với phương pháp củng cố giấc ngủ của Hermes (phân tích N=3 chu kỳ → tạo kỹ năng mới). Có thể引入 quan điểm topo đồ để đánh giá chất lượng liên kết giữa các ký ức. Lộ trình nâng cấp fact_store: Hiện tại, fact_store là dạng key-value phẳng. Có thể đối chiếu với đồ thị dị thể của FluxMem, thiết lập các cạnh ngữ nghĩa/thời gian/nguyên nhân giữa các sự kiện, giúp điểm trust score không còn được tính toán một cách cô lập. Chiến lược Tinh chế BỘ NHỚ: Phương pháp tinh chế dựa trên phản hồi của FluxMem có thể được sử dụng để cải thiện logic dọn dẹp điểm trust score hiện tại - không chỉ xóa các sự kiện có độ tin cậy thấp, mà còn sửa chữa các liên kết đứt gãy hoặc hợp nhất các nút trùng lặp. Chỉ số Maturity: Giới thiệu các chỉ số độ trưởng thành để giám sát sức khỏe bộ nhớ của Hermes, thay thế phương pháp đánh giá hiện tại vốn chỉ phụ thuộc vào mức sử dụng BỘ NHỚ.
Hermes 睡眠固化對標 :FluxMem 的第三階段「蒸餾成功軌跡→程序性電路」與 Hermes 睡眠固化(N=3 循環分析→新建 skill)高度對齊,可引入圖拓撲視角來評估記憶間連結品質。 fact_store 升級路徑 :目前 fact_store 是扁平 key-value,可對標 FluxMem 的異質圖,對事實間建立語義/時序/因果邊,讓 trust score 不再孤立計算。 MEMORY 精煉策略 :FluxMem 的回饋驅動精煉可以用來改進現有的 trust score 清理邏輯——不只刪除低信任事實,而是修復斷裂的連結或合併冗餘節點。 成熟度指標 :引入演化成熟度指標來監控 Hermes 記憶健康度,取代目前純粹依賴 MEMORY 使用率的評估方式。