Tối Ưu Hóa Hệ Thống Multi-Agent: Hướng Dẫn Xây Dựng MCP Server Tinh Gọn Theo Nguyên Lý Micro-scoped — Case Study NotebookLM
Tác giả: Khúc Ngọc Tuyên
The Succesful Investor (TSI – Nhà Đầu Tư Thành Công) | SSI Times City |
twainkhux@gmail.com | 0989.591.288 (Zalo/Phone) | Tầng 3 Century Tower – KĐT Times City – Vĩnh Tuy – Hà Nội
Tóm tắt: Bài báo này trình bày phương pháp tối ưu hóa hiệu suất và giảm tải tài nguyên cho các tác nhân trí tuệ nhân tạo (AI Agents) thông qua việc áp dụng nguyên lý Micro-scoped MCP (Model Context Protocol). Bằng cách thu gọn tập hợp công cụ (tools) của NotebookLM MCP server từ 35 công cụ xuống còn 17 công cụ cốt lõi, hệ thống đã tiết kiệm được đáng kể tài nguyên ngữ cảnh, đồng thời duy trì toàn bộ khả năng xử lý nghiệp vụ thiết yếu.
1. Giới Thiệu Vấn Đề
Trong quá trình xây dựng và vận hành các hệ thống đa tác nhân (Multi-Agent Systems), một trong những thách thức lớn nhất là quản lý không gian ngữ cảnh (context budget). Mỗi công cụ được tích hợp vào hệ thống đều tiêu tốn một lượng token nhất định để tác nhân AI có thể đọc, hiểu và sử dụng.
Khi triển khai NotebookLM MCP Server bản gốc, chúng tôi nhận thấy máy chủ này cung cấp đến 35 công cụ. Với giới hạn bộ nhớ ngữ cảnh của tác nhân, việc nạp toàn bộ 35 công cụ này chiếm khoảng 35% ngân sách khả dụng (tương đương 35 trên 100 khe cắm – slots). Việc “phơi nhiễm” quá nhiều công cụ không cần thiết không chỉ gây lãng phí tài nguyên (tiêu thụ khoảng 8.750 token mỗi phiên), mà còn làm giảm khả năng tập trung của tác nhân AI, dẫn đến tình trạng “ảo giác” (hallucination) trong việc lựa chọn công cụ thực thi.
2. Phương Pháp Giải Quyết
Để giải quyết vấn đề trên, chúng tôi áp dụng nguyên lý Micro-scoped MCP. Mục tiêu là thu gọn số lượng công cụ xuống mức tối thiểu nhưng vẫn đảm bảo 100% khả năng phục vụ các luồng công việc (workflows) quan trọng.
2.1. Phân Loại Công Cụ
Thay vì giữ nguyên toàn bộ, chúng tôi tiến hành phân loại 35 công cụ thành 3 nhóm dựa trên mức độ thiết yếu:
- Nhóm Cốt lõi (Core): Gồm 17 công cụ phục vụ trực tiếp cho các nghiệp vụ chính như quản lý tài liệu (Notebooks, Sources), thực hiện truy vấn AI (Chat, Research) và tạo lập sản phẩm (Studio).
- Nhóm Hỗ trợ (Utility): Gồm các công cụ mang tính chất tiện ích mở rộng, không thường xuyên sử dụng.
- Nhóm Loại trừ (Excluded): Gồm 18 công cụ có mức độ rủi ro cao (như xóa tài liệu), hoặc ít có giá trị đối với hệ thống hiện tại.
2.2. Chiến Lược Kỹ Thuật
Máy chủ NotebookLM MCP mặc định không hỗ trợ cờ lọc (ví dụ: cờ --tools) như một số hệ thống khác. Thay vì viết lại toàn bộ mã nguồn, chúng tôi chọn phương pháp “Minimal Fork”. Bằng cách can thiệp vào tệp khởi tạo (server.py), chúng tôi xây dựng một danh sách trắng (whitelist) chứa tên 17 công cụ Cốt lõi. Quá trình đăng ký công cụ với FastMCP sẽ được lọc qua danh sách này. Giải pháp này giúp loại bỏ sự cồng kềnh mà không làm hỏng cấu trúc mã gốc của ứng dụng.
3. Kết Quả Và Đánh Giá
Việc áp dụng chiến lược Micro-scoped đã mang lại những cải thiện rõ rệt:
- Tối ưu khe cắm (Slots): Giảm từ 35 xuống 17 công cụ (tỷ lệ phơi nhiễm 53%), giải phóng 18 khe cắm MCP cho các máy chủ khác.
- Tiết kiệm Token: Lượng token tiêu thụ giảm từ khoảng 8.750 token xuống chỉ còn 4.250 token cho mỗi phiên. Điều này đặc biệt có ý nghĩa về mặt chi phí vận hành ở quy mô lớn.
- Độ ổn định: Mọi quy trình công việc quan trọng liên quan đến đọc hiểu, truy vấn tài liệu đa nguồn và nghiên cứu chuyên sâu đều hoạt động trơn tru. Sự cắt giảm không làm mất đi giá trị hệ thống mà còn giúp các tác nhân AI định tuyến yêu cầu chính xác hơn.
4. Kết Luận
Thiết kế hệ thống AI theo nguyên lý Micro-scoped MCP là một bước đi thiết thực và mang lại hiệu quả cao. Việc kiểm soát số lượng công cụ được cấp cho các tác nhân AI không chỉ tiết kiệm chi phí mà còn gia tăng sự tập trung và độ chính xác trong vận hành. Cách tiếp cận trên NotebookLM MCP Server hoàn toàn có thể được dùng làm khuôn mẫu (template) để nhân rộng cho các máy chủ MCP nội bộ và bên thứ ba khác trong tương lai.
TSI | The Successful Investors (Nhà Đầu Tư Thành Công) | L/H 0989591288 | www.nhadaututhanhcong.com

