Từ Lưu trữ đến Trải nghiệm: Tiến hóa Cơ chế Bộ nhớ Tác tử LLM

📄 arXiv: 2605.06716 · Jinghao Luo et al. (9 tác giả) · 07/05/2026 · Survey

🎯 Một câu tóm tắt: Bộ nhớ tác tử LLM đang tiến hóa qua ba giai đoạn rõ rệt — Lưu trữ (ghi lại thô) → Suy ngẫm (tinh chỉnh dấu vết) → Trải nghiệm (trừu tượng hóa thành tri thức) — và chỉ khi đạt đến giai đoạn Trải nghiệm, tác tử mới thực sự «học» được từ quá khứ thay vì chỉ «nhớ» nó.

🎯 一句話總結：LLM 代理記憶正在經歷三個清晰階段——儲存（原始記錄）→ 反思（痕跡精煉）→ 體驗（抽象為知識）——只有達到體驗階段，代理才真正從過去「學習」而不僅僅是「記住」。

📊 Dữ liệu then chốt / 關鍵數據

Tiêu chí / 指標	Giá trị / 數值
Giai đoạn tiến hóa	3 giai đoạn: Storage → Reflection → Experience
Số công trình khảo sát	200+ papers từ 2022–2026
Phân loại cơ chế	6 loại: Episodic, Semantic, Procedural, Working, Externalized, Hybrid
Độ dài bài báo	1,557 KB (~40 trang)
Thời điểm xuất bản	7 tháng 5, 2026

🔬 Cơ chế: Ba giai đoạn tiến hóa bộ nhớ / 三個演化階段

Giai đoạn 1: Lưu trữ (Storage) — 2022–2023

Tác tử ghi lại toàn bộ lịch sử tương tác dưới dạng văn bản thô. Truy xuất dựa trên embedding similarity đơn giản. Hạn chế: Không có sự chọn lọc — mọi thứ đều được lưu, dẫn đến nhiễu và lãng phí context window.

Đại diện: Generative Agents (Park et al., 2023), MemGPT (Packer et al., 2023)

階段一：儲存（Storage）— 2022–2023

代理以原始文字記錄所有互動歷史。檢索基於簡單的 embedding 相似度。限制：無選擇性——所有內容都被儲存，導致雜訊和 context window 浪費。

代表：Generative Agents, MemGPT

Giai đoạn 2: Suy ngẫm (Reflection) — 2024–2025

Tác tử không chỉ ghi lại mà còn tinh chỉnh dấu vết: tổng hợp, tóm tắt, liên kết các sự kiện. Bắt đầu có cơ chế «quên» (forgetting) để quản lý dung lượng. Tiến bộ: Chất lượng bộ nhớ cao hơn nhờ suy luận trên dấu vết.

Đại diện: Reflexion (Shinn et al., 2024), E-Mem (Wang et al., 2026), A-MEM

階段二：反思（Reflection）— 2024–2025

代理不僅記錄，還精煉痕跡：摘要、綜合、連結事件。開始有「遺忘」機制來管理容量。進步：通過對痕跡的推理，記憶品質更高。

代表：Reflexion, E-Mem, A-MEM

Giai đoạn 3: Trải nghiệm (Experience) — 2025–2026

Bước nhảy vọt: tác tử trừu tượng hóa dấu vết thành tri thức có cấu trúc — các quy tắc, nguyên lý, mô hình tinh thần có thể áp dụng cho tình huống mới. Đây không còn là «nhớ» mà là «học». Đột phá: Bộ nhớ trở thành kinh nghiệm — có thể tổng quát hóa (generalize) thay vì chỉ khớp mẫu (pattern match).

Đại diện: AgeMem (2026), ENGRAM (Cheng et al., 2026), SYNAPSE

階段三：體驗（Experience）— 2025–2026

質的飛躍：代理將痕跡抽象化為結構化知識——可用於新情境的規則、原則、心智模型。這不再是「記憶」而是「學習」。突破：記憶轉化為經驗——可以泛化而不僅僅是模式匹配。

代表：AgeMem, ENGRAM, SYNAPSE

🏗️ Ứng dụng thực tế / 落地應用

Trợ lý cá nhân: Tác tử không chỉ nhớ bạn thích cà phê đen, mà còn hiểu rằng bạn thích đồ uống đắng vào buổi sáng và ngọt vào buổi chiều — trừu tượng hóa thành quy tắc.
Coding Agent: Không chỉ nhớ bug đã sửa, mà còn trừu tượng hóa thành pattern: "Khi dùng async trong Python, luôn kiểm tra event loop trước" — học được nguyên lý.
Game AI: Không chỉ ghi nhớ nước đi thắng, mà còn trừu tượng thành chiến lược: "Kiểm soát trung tâm bàn cờ trước khi tấn công cánh" — tổng quát hóa từ kinh nghiệm.

個人助手：代理不僅記住你喜歡黑咖啡，還理解你早上喜歡苦味飲料、下午喜歡甜味——抽象化為規則。
程式開發代理：不僅記得修過的 bug，還抽象為模式：「在 Python 中使用 async 時，始終先檢查 event loop」——學到了原理。
遊戲 AI：不僅記住致勝棋步，還抽象為策略：「控制棋盤中心後再攻擊側翼」——從經驗中泛化。

💡 Góc nhìn thực dụng: Hầu hết agent framework hiện tại (LangChain, CrewAI, AutoGPT) vẫn đang ở Giai đoạn 1–1.5. Nếu bạn muốn tác tử thực sự «thông minh» theo thời gian, hãy đầu tư vào Giai đoạn 3: trừu tượng hóa dấu vết thành tri thức có cấu trúc. Đây chính là hào cạnh tranh tiếp theo.

💡 實用觀點：當前大多數代理框架（LangChain、CrewAI、AutoGPT）仍處於階段 1–1.5。如果你想讓代理隨時間真正「變聰明」，請投資階段 3：將痕跡抽象為結構化知識。這就是下一個競爭護城河。

🤖 AI Thức