Từ Lưu trữ đến Trải nghiệm: Tiến hóa Cơ chế Bộ nhớ Tác tử LLM

📄 arXiv: 2605.06716 · Jinghao Luo et al. (9 tác giả) · 07/05/2026 · Survey

🎯 Một câu tóm tắt: Bộ nhớ tác tử LLM đang tiến hóa qua ba giai đoạn rõ rệt — Lưu trữ (ghi lại thô) → Suy ngẫm (tinh chỉnh dấu vết) → Trải nghiệm (trừu tượng hóa thành tri thức) — và chỉ khi đạt đến giai đoạn Trải nghiệm, tác tử mới thực sự «học» được từ quá khứ thay vì chỉ «nhớ» nó.
🎯 一句話總結:LLM 代理記憶正在經歷三個清晰階段——儲存(原始記錄)→ 反思(痕跡精煉)→ 體驗(抽象為知識)——只有達到體驗階段,代理才真正從過去「學習」而不僅僅是「記住」。

📊 Dữ liệu then chốt / 關鍵數據

Tiêu chí / 指標Giá trị / 數值
Giai đoạn tiến hóa3 giai đoạn: Storage → Reflection → Experience
Số công trình khảo sát200+ papers từ 2022–2026
Phân loại cơ chế6 loại: Episodic, Semantic, Procedural, Working, Externalized, Hybrid
Độ dài bài báo1,557 KB (~40 trang)
Thời điểm xuất bản7 tháng 5, 2026

🔬 Cơ chế: Ba giai đoạn tiến hóa bộ nhớ / 三個演化階段

Giai đoạn 1: Lưu trữ (Storage) — 2022–2023

Tác tử ghi lại toàn bộ lịch sử tương tác dưới dạng văn bản thô. Truy xuất dựa trên embedding similarity đơn giản. Hạn chế: Không có sự chọn lọc — mọi thứ đều được lưu, dẫn đến nhiễu và lãng phí context window.

Đại diện: Generative Agents (Park et al., 2023), MemGPT (Packer et al., 2023)

階段一:儲存(Storage)— 2022–2023

代理以原始文字記錄所有互動歷史。檢索基於簡單的 embedding 相似度。限制:無選擇性——所有內容都被儲存,導致雜訊和 context window 浪費。

代表:Generative Agents, MemGPT

Giai đoạn 2: Suy ngẫm (Reflection) — 2024–2025

Tác tử không chỉ ghi lại mà còn tinh chỉnh dấu vết: tổng hợp, tóm tắt, liên kết các sự kiện. Bắt đầu có cơ chế «quên» (forgetting) để quản lý dung lượng. Tiến bộ: Chất lượng bộ nhớ cao hơn nhờ suy luận trên dấu vết.

Đại diện: Reflexion (Shinn et al., 2024), E-Mem (Wang et al., 2026), A-MEM

階段二:反思(Reflection)— 2024–2025

代理不僅記錄,還精煉痕跡:摘要、綜合、連結事件。開始有「遺忘」機制來管理容量。進步:通過對痕跡的推理,記憶品質更高。

代表:Reflexion, E-Mem, A-MEM

Giai đoạn 3: Trải nghiệm (Experience) — 2025–2026

Bước nhảy vọt: tác tử trừu tượng hóa dấu vết thành tri thức có cấu trúc — các quy tắc, nguyên lý, mô hình tinh thần có thể áp dụng cho tình huống mới. Đây không còn là «nhớ» mà là «học». Đột phá: Bộ nhớ trở thành kinh nghiệm — có thể tổng quát hóa (generalize) thay vì chỉ khớp mẫu (pattern match).

Đại diện: AgeMem (2026), ENGRAM (Cheng et al., 2026), SYNAPSE

階段三:體驗(Experience)— 2025–2026

質的飛躍:代理將痕跡抽象化為結構化知識——可用於新情境的規則、原則、心智模型。這不再是「記憶」而是「學習」。突破:記憶轉化為經驗——可以泛化而不僅僅是模式匹配。

代表:AgeMem, ENGRAM, SYNAPSE

🏗️ Ứng dụng thực tế / 落地應用

  1. Trợ lý cá nhân: Tác tử không chỉ nhớ bạn thích cà phê đen, mà còn hiểu rằng bạn thích đồ uống đắng vào buổi sáng và ngọt vào buổi chiều — trừu tượng hóa thành quy tắc.
  2. Coding Agent: Không chỉ nhớ bug đã sửa, mà còn trừu tượng hóa thành pattern: "Khi dùng async trong Python, luôn kiểm tra event loop trước" — học được nguyên lý.
  3. Game AI: Không chỉ ghi nhớ nước đi thắng, mà còn trừu tượng thành chiến lược: "Kiểm soát trung tâm bàn cờ trước khi tấn công cánh" — tổng quát hóa từ kinh nghiệm.
  1. 個人助手:代理不僅記住你喜歡黑咖啡,還理解你早上喜歡苦味飲料、下午喜歡甜味——抽象化為規則。
  2. 程式開發代理:不僅記得修過的 bug,還抽象為模式:「在 Python 中使用 async 時,始終先檢查 event loop」——學到了原理。
  3. 遊戲 AI:不僅記住致勝棋步,還抽象為策略:「控制棋盤中心後再攻擊側翼」——從經驗中泛化。
💡 Góc nhìn thực dụng: Hầu hết agent framework hiện tại (LangChain, CrewAI, AutoGPT) vẫn đang ở Giai đoạn 1–1.5. Nếu bạn muốn tác tử thực sự «thông minh» theo thời gian, hãy đầu tư vào Giai đoạn 3: trừu tượng hóa dấu vết thành tri thức có cấu trúc. Đây chính là hào cạnh tranh tiếp theo.
💡 實用觀點:當前大多數代理框架(LangChain、CrewAI、AutoGPT)仍處於階段 1–1.5。如果你想讓代理隨時間真正「變聰明」,請投資階段 3:將痕跡抽象為結構化知識。這就是下一個競爭護城河。