Biên Dịch Agentic Workflow Vào Trọng Số LLM

Tóm tắt: Các framework điều phối agent (LangGraph, CrewAI, Google ADK, OpenAI Agents SDK...) hiện có hơn 290.000 sao GitHub, nhưng tất cả đều dùng chung một kiến trúc: orchestrator bên ngoài treo trên LLM, mỗi lượt đều phải bơm instruction và route decision. Nhóm tác giả đề xuất một hướng đi khác: biên dịch thẳng workflow vào trọng số của mô hình nhỏ thông qua fine-tuning — tạo ra "subterranean agent" (tác nhân ngầm). Kết quả: chất lượng gần frontier, chi phí thấp hơn hai bậc độ lớn.

摘要：LangGraph、CrewAI 等 Agent 編排框架合計 29 萬 GitHub 星，但架構都一樣——外部編排器掛在 LLM 上。作者提出另一條路：把 workflow 直接 fine-tune 進小模型權重，創造 subterranean agent。結果：近前沿品質，成本降百倍。

Vấn Đề: Orchestrator Đang Thống Trị

Tất cả các framework phổ biến đều theo mô hình orchestrator bên ngoài: một chương trình Python/Node.js ngồi giữa user và LLM, mỗi lượt inject system prompt, parse output, rồi route sang node tiếp theo. Cách này có ba vấn đề: (1) ngốn context window, (2) mỗi cuộc hội thoại đều cần frontier model — rất đắt, (3) quy trình độc quyền bị lộ cho bên thứ ba.

所有主流框架都是外部編排器模型：一個 Python/Node.js 程式坐在 user 和 LLM 之間，每回合注入 system prompt、解析輸出、路由下一步。三個問題：吃 context、每次都要前沿模型、私有流程曝露給第三方 API。

Giải Pháp: Subterranean Agent

Thay vì orchestrator bên ngoài, fine-tune workflow thẳng vào trọng số mô hình nhỏ. Mô hình sau khi fine-tune đã "biết" toàn bộ quy trình — không cần system prompt dài, không cần orchestrator, không cần frontier model. Các công trình trước (SimpleTOD, FireAct, SynTOD, WorkflowLLM, Agent Lumos) đã chứng minh kỹ thuật này hoạt động, nhưng cộng đồng developer vẫn chuộng orchestration.

解法：把 workflow fine-tune 進小模型權重，模型自己就知道整套流程——不需要長 system prompt、不需要 orchestrator、不需要前沿模型。之前已有 SimpleTOD、FireAct 等證明可行，但開發者仍偏好 orchestration。

Ba Rào Cản & Cách Giải Quyết

Nhóm tác giả xác định ba rào cản khiến cộng đồng chưa áp dụng rộng rãi, và kiểm chứng thực nghiệm trên ba lĩnh vực:

作者指出三個障礙導致社群未廣泛採用，並在三個領域實證解決：

So Sánh Ba Kiến Trúc

Ý Nghĩa Thực Tiễn

Lĩnh Vực	Độ Phức Tạp	Đặc Điểm
Travel Booking（旅行預訂）	14 nodes	Tác vụ thủ tục thuần túy
Zoom Support（客服支援）	14 nodes	Cần kiến thức đặc thù sản phẩm
Insurance Claims（保險理賠）	55 nodes, 6 decision hubs	Rất phức tạp, nhiều nhánh quyết định

Kiến Trúc	Cách Làm	Vấn Đề
Orchestration Framework	Chương trình ngoài điều khiển LLM	Phức tạp, trễ, tốn kém
System Prompt Dài	Nhét workflow vào prompt frontier model	Ăn context, đắt, lộ quy trình
Subterranean Agent	Fine-tune workflow vào mô hình nhỏ	← Không có vấn đề nào ở trên

Bài báo này đặt ra câu hỏi quan trọng: có thực sự cần một orchestrator phức tạp cho mọi agent workflow？ Với các tác vụ có tính thủ tục cao (như travel booking, insurance claims — đúng là phần lớn ứng dụng doanh nghiệp), fine-tuning một mô hình nhỏ cho chất lượng tương đương frontier model nhưng chi phí thấp hơn 100 lần, không lộ quy trình, không phụ thuộc bên thứ ba.

這篇論文提出關鍵問題：每個 agent workflow 真的需要複雜的 orchestrator 嗎？對高程序性任務（旅行預訂、保險理賠——正是大多數企業應用場景），fine-tune 一個小模型就能達到近前沿品質，成本降百倍，不曝露流程，不依賴第三方。

Hạn chế: Phương pháp này phù hợp nhất với workflow có cấu trúc rõ ràng. Với tác vụ sáng tạo, mở (như viết code tự do, nghiên cứu), orchestration vẫn có ưu thế về linh hoạt. Subterranean agent và Loop Engineering (Osmani, 2026) là hai cách tiếp cận bổ sung cho nhau, không loại trừ.

限制：此方法最適合結構明確的 workflow。對開放式創作任務（自由寫 code、研究），orchestration 仍有靈活優勢。Subterranean agent 和 Loop Engineering 是互補而非互斥的兩條路徑。

Tác giả	Simon Dennis, Rivaan Patil, Kevin Shabahang, Hao Guo
Ngày	21/05/2026
License	CC BY 4.0
arXiv	2605.22502 · PDF

Biên Dịch Agentic Workflow Vào Trọng Số LLM: Chất Lượng Gần Frontier, Chi Phí Giảm 100 Lần

Vấn Đề: Orchestrator Đang Thống Trị

Giải Pháp: Subterranean Agent

Ba Rào Cản & Cách Giải Quyết

So Sánh Ba Kiến Trúc

Ý Nghĩa Thực Tiễn

Metadata