Trong bối cảnh chuyển đổi số mạnh mẽ hiện nay, Trí tuệ Nhân tạo (AI) đang trở thành một công cụ không thể thiếu, giúp doanh nghiệp tối ưu hóa vận hành và tạo ra lợi thế cạnh tranh. Tuy nhiên, để khai thác tối đa sức mạnh của các tác nhân AI (AI Agents), chúng ta cần hiểu rõ và làm chủ một khái niệm then chốt: Kỹ thuật Ngữ cảnh (Context Engineering). [[1]](//www.appa-lytics.com/vi/ky-thuat-ngu-canh-ai-cho-tre/)[[2]](//cesglobal.com.vn/context-engineering-huong-dan-toi-uu-ngu-canh)
Kỹ thuật Ngữ cảnh là gì và tại sao nó lại quan trọng?
Hãy hình dung mô hình ngôn ngữ lớn (LLM) của AI như bộ xử lý trung tâm (CPU) của một máy tính, và cửa sổ ngữ cảnh (context window) của nó chính là bộ nhớ làm việc (working memory). [[3]](//www.youtube.com/watch?v=-QeuUc-Ck-Y) Nhiệm vụ của chúng ta là nạp vào bộ nhớ đó một cách chính xác sự kết hợp giữa mã lệnh, dữ liệu và hướng dẫn cần thiết để mô hình có thể hoàn thành tác vụ một cách hiệu quả nhất. [[3]](//www.youtube.com/watch?v=-QeuUc-Ck-Y)
Kỹ thuật ngữ cảnh không chỉ đơn thuần là việc viết các câu lệnh (prompts) thông minh. [[1]](//www.appa-lytics.com/vi/ky-thuat-ngu-canh-ai-cho-tre/) Nó là một nghệ thuật tinh chỉnh thông tin đầu vào, đảm bảo AI nhận được đúng thông tin, vào đúng thời điểm nó cần. [[1]](//www.appa-lytics.com/vi/ky-thuat-ngu-canh-ai-cho-tre/) Điều này bao gồm các chỉ dẫn, ví dụ, dữ liệu, công cụ và cả những tương tác trước đó, tất cả được đóng gói vào ngữ cảnh đầu vào của mô hình trong quá trình chạy. [[2]](//cesglobal.com.vn/context-engineering-huong-dan-toi-uu-ngu-canh)[[4]](//mn.com.vn/hoc-chatgpt/ngu-canh-context-trong-chatgpt-ai-la-cai-gi/) Ngữ cảnh này có thể đến từ nhiều nguồn khác nhau: truy vấn của người dùng, hướng dẫn cấp hệ thống, kết quả tìm kiếm, đầu ra từ các công cụ khác, hoặc tóm tắt các bước trước đó. [[4]](//mn.com.vn/hoc-chatgpt/ngu-canh-context-trong-chatgpt-ai-la-cai-gi/)[[5]](//tuyendung.evotek.vn/ai-agent-roadmap-huong-dan-ve-cua-so-ngu-canh-va-do-dai-toi-da-trong-llm/)
Mục tiêu của kỹ thuật ngữ cảnh là tổng hợp tất cả các mảnh ghép thông tin này thành một đầu vào mạch lạc, không phải là một câu lệnh tĩnh mà là một cấu trúc được lắp ráp theo thời gian thực dựa trên yêu cầu của tác vụ. [[2]](//cesglobal.com.vn/context-engineering-huong-dan-toi-uu-ngu-canh) Một prompt AI hiệu quả cần có cấu trúc, bao gồm mô tả nhiệm vụ, ngữ cảnh, vai trò, yêu cầu, giới hạn và thậm chí là lý luận. [[6]](//phongvu.vn/cong-nghe/cach-viet-prompt-ai-cho-nguoi-moi-bat-dau/)
Cửa sổ ngữ cảnh lớn: Lời hứa và những thách thức tiềm ẩn
Gần đây, sự xuất hiện của các cửa sổ ngữ cảnh cực lớn, có thể xử lý tới hàng triệu token, đã tạo ra một làn sóng phấn khích. [[5]](//tuyendung.evotek.vn/ai-agent-roadmap-huong-dan-ve-cua-so-ngu-canh-va-do-dai-toi-da-trong-llm/)[[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Nhiều người tin rằng đây chính là chìa khóa để mở ra kỷ nguyên của các tác nhân AI thông minh, tự chủ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Ý tưởng rất đơn giản: nếu cửa sổ ngữ cảnh đủ lớn, chỉ cần nạp tất cả mọi thứ vào đó – công cụ, tài liệu, nhật ký, hướng dẫn, lịch sử tương tác – và để mô hình tự tìm ra cách giải quyết. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Tuy nhiên, lời hứa về cửa sổ ngữ cảnh lớn cũng đi kèm với những vấn đề mới, được gọi là lỗi ngữ cảnh (context failure). [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Khi AI phải xử lý một lượng lớn thông tin trong cửa sổ ngữ cảnh, hiệu suất của mô hình có thể suy giảm, và chi phí cũng tăng lên đáng kể. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Các lỗi ngữ cảnh phổ biến mà chúng ta thường gặp trong quy trình làm việc của tác nhân AI bao gồm:
- Nhầm lẫn ngữ cảnh (Context confusion): Dẫn đến việc sử dụng công cụ kém hiệu quả và nội dung không liên quan.
- Xung đột ngữ cảnh (Context clash): Phá vỡ logic suy luận do các mâu thuẫn nội bộ.
- Nhiễm độc ngữ cảnh (Context poisoning): Khóa chặt thông tin sai lệch.
- Phân tâm ngữ cảnh (Context distraction): Khiến tác nhân lặp lại hành động thay vì suy luận.
Những vấn đề này đặc biệt nổi bật ở các tác nhân AI, bởi vì chúng thường xây dựng các ngữ cảnh dài và phức tạp theo thời gian, thu thập đầu vào từ nhiều nguồn, sử dụng công cụ theo trình tự và cố gắng suy luận qua nhiều bước. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)[[8]](//fpt.ai/vi/bai-viet/ai-agent/)
Hiểu rõ về Xung đột Ngữ cảnh (Context Clash)
Xung đột ngữ cảnh xảy ra khi thông tin mới được thêm vào ngữ cảnh mâu thuẫn với nội dung đã có trước đó. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Khác với nhầm lẫn ngữ cảnh (khi thông tin thừa thãi chỉ là không liên quan), ở đây, các phần của ngữ cảnh chủ động đối kháng lẫn nhau. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Điều này thường thấy rõ trong các quy trình làm việc nhiều bước (multi-turn workflows). [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Các phản hồi ban đầu, các phỏng đoán, hoặc đầu ra của công cụ có thể sau này được chứng minh là sai, nhưng chúng vẫn tồn tại trong ngữ cảnh và ảnh hưởng đến các phản hồi trong tương lai. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Mô hình không phải lúc nào cũng bỏ qua các bước lỗi thời hoặc không chính xác; nó vẫn xem chúng là hợp lệ, dẫn đến các kết luận sai lầm. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Đây là một lỗi phổ biến ở các tác nhân AI thu thập thông tin từ nhiều công cụ, tài liệu hoặc đầu ra của mô hình khác nhau. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Khi các nguồn này mâu thuẫn, mô hình có thể không biết nên tin tưởng nguồn nào, và khả năng suy luận của nó có thể bị phá vỡ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Một nghiên cứu gần đây của Microsoft và Salesforce đã chỉ ra rằng, khi các câu lệnh được chia thành nhiều lượt trò chuyện, hiệu suất của mô hình giảm đáng kể, ngay cả khi tổng lượng thông tin là như nhau. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Vấn đề không phải là thiếu dữ liệu, mà là do các giả định ban đầu. Mô hình cố gắng trả lời quá sớm, và những phỏng đoán ban đầu không chính xác đó vẫn tồn tại trong ngữ cảnh. Khi các thông điệp sau đó bổ sung thêm các dữ kiện còn thiếu, mô hình vẫn dựa vào suy nghĩ ban đầu của nó. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Giải pháp: Cách ly Ngữ cảnh (Context Quarantine)
Tin tốt là có những cách hiệu quả để xử lý xung đột ngữ cảnh. Một trong những phương pháp phổ biến nhất là cách ly ngữ cảnh (context quarantine). [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Đây là kỹ thuật mà chúng ta phân tách các phần của một tác vụ thành các luồng riêng biệt. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Mỗi luồng có cửa sổ ngữ cảnh riêng và có thể được xử lý bởi một hoặc nhiều mô hình ngôn ngữ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Điều này giúp ngăn chặn các phần khác nhau can thiệp lẫn nhau. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Tại sao cách ly ngữ cảnh lại hữu ích?
Xung đột ngữ cảnh xảy ra khi một cửa sổ ngữ cảnh bị quá tải với thông tin mâu thuẫn. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Điều này thường xảy ra khi chúng ta cố gắng giải quyết các tác vụ phụ khác nhau trong cùng một cửa sổ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Bằng cách tách các tác vụ phụ thành các ngữ cảnh riêng biệt, chúng ta giảm thiểu khả năng một phần gây ra mâu thuẫn cho phần khác. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Cách ly ngữ cảnh cũng giúp tránh tình trạng phân tâm ngữ cảnh, khi các ngữ cảnh lớn khiến mô hình quá tập trung vào những gì có trong cửa sổ và bỏ qua những gì nó đã học trong quá trình đào tạo. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Việc giữ mỗi tác vụ phụ trong một cửa sổ nhỏ hơn, riêng biệt giúp giảm thiểu rủi ro này và làm cho mô hình hiệu quả hơn. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Cách ly ngữ cảnh trong thực tế: Hệ thống đa tác nhân
Các nghiên cứu về hệ thống đa tác nhân của Anthropic đã chứng minh rằng việc sử dụng các ngữ cảnh riêng biệt cho các tác nhân phụ có thể cải thiện hiệu suất đáng kể. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Các tác nhân phụ này hoạt động song song, mỗi tác nhân có cửa sổ ngữ cảnh riêng và tập trung vào các khía cạnh khác nhau của tác vụ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Thiết lập này đã dẫn đến cải thiện 90.2% so với các hệ thống tác nhân đơn lẻ trong một số trường hợp. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Tuy nhiên, cũng có những thách thức. Việc sử dụng nhiều tác nhân đồng nghĩa với việc tiêu tốn nhiều token hơn, đôi khi gấp 15 lần. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Do đó, cần có kỹ thuật prompt engineering và lập kế hoạch cẩn thận để phân công công việc phù hợp cho từng tác nhân. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Một mối lo ngại lớn là sự phối hợp. Nếu nhiều tác nhân được phép viết các phần của đầu ra cuối cùng, chúng có thể mâu thuẫn với nhau. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Hầu hết các nghiên cứu về đa tác nhân cho đến nay đều tập trung vào các tác vụ “chỉ đọc” (read-only), nơi các tác nhân chỉ thu thập thông tin mà không tự mình tạo ra phần đầu ra cuối cùng. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)[[9]](//aichatbot.com.vn/suc-manh-cua-he-thong-ai-da-tac-nhan/)
Xây dựng Tác nhân Giám sát (Supervisor Agent)
Để triển khai cách ly ngữ cảnh hiệu quả trong hệ thống đa tác nhân, chúng ta có thể sử dụng một Tác nhân Giám sát (Supervisor Agent). Tác nhân giám sát có vai trò điều phối, không tự mình thực hiện tác vụ mà ủy quyền cho các tác nhân chuyên biệt. Ví dụ, một tác nhân giám sát có thể được cấu hình để:
- Xác định loại tác vụ.
- Gửi các tác vụ nghiên cứu đến tác nhân chuyên gia nghiên cứu.
- Gửi các tác vụ phân tích số liệu đến tác nhân chuyên gia toán học.
- Phối hợp giữa chúng nếu cả hai đều cần thiết.
Bằng cách này, tác nhân giám sát sẽ phân chia tác vụ, ví dụ: gửi yêu cầu truy xuất dữ liệu dân số cho tác nhân nghiên cứu, và gửi các giá trị dân số cho tác nhân toán học để tính toán trung bình. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Điều này đảm bảo không có xung đột giữa logic nghiên cứu và logic toán học, vì ngữ cảnh của mỗi tác nhân được cô lập. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Kết quả là, các ngữ cảnh được cách ly cho từng tác nhân chuyên biệt, giúp quá trình làm việc mạch lạc và chính xác hơn. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Build Supervisor Agent
supervisor_prompt = “””You manage two agents: a research expert and a math expert.
Your job is to:
– Identify the type of task
– Send research tasks to the research expert
– Send numeric analysis tasks to the math expert
– Coordinate between them if both are needed
Do not perform any task yourself. Always delegate.
“””
supervisor = create_supervisor(
agents=[research_agent, math_agent],
model=llm,
prompt=supervisor_prompt
)
Kết luận
Chúng ta đã thấy cách xử lý xung đột ngữ cảnh một cách hiệu quả trong các quy trình làm việc của tác nhân AI bằng phương pháp cách ly ngữ cảnh. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Mỗi tác nhân làm việc trong cửa sổ ngữ cảnh riêng, giảm thiểu rủi ro mâu thuẫn và giúp mô hình tập trung vào tác vụ. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Bằng cách phân tách các tác vụ nghiên cứu và tính toán thành các tác nhân khác nhau, chúng ta tránh trộn lẫn thông tin mâu thuẫn hoặc lỗi thời. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Tác nhân giám sát điều phối quá trình, đảm bảo mỗi tác vụ phụ được xử lý bởi đúng tác nhân, vào đúng thời điểm, với một ngữ cảnh rõ ràng. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus) Thiết lập này không chỉ giảm lượng dữ liệu không cần thiết trong cửa sổ ngữ cảnh mà còn cải thiện khả năng suy luận của mô hình, đặc biệt hữu ích trong các quy trình làm việc dài hoặc nhiều bước, nơi các đầu ra ban đầu có thể dẫn đến các quyết định sai lầm sau này. [[7]](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
Việc áp dụng kỹ thuật ngữ cảnh, đặc biệt là cách ly ngữ cảnh, là một bước tiến quan trọng để xây dựng các tác nhân AI đáng tin cậy, hiệu quả và mạnh mẽ, mang lại giá trị thực sự cho doanh nghiệp của quý vị. [[10]](//aichatbot.com.vn/ai-agent-cach-khac-phuc-nhung-han-che-cua-llm/)
—
Learn more:
1. [Kỹ Thuật Ngữ Cảnh AI: Biến Trò Chuyện Thành Khoảnh Khắc Kỳ Diệu – Appa-lytics](//www.appa-lytics.com/vi/ky-thuat-ngu-canh-ai-cho-tre/)
2. [Context Engineering: Hướng dẫn tối ưu ngữ cảnh cho AI – CES GLOBAL](//cesglobal.com.vn/context-engineering-huong-dan-toi-uu-ngu-canh)
3. [Bình dân học AI – Bài 26: Cửa sổ ngữ cảnh AI: Bí kíp giữ cho trợ lý số luôn tỉnh táo](//www.youtube.com/watch?v=-QeuUc-Ck-Y)
4. [Ngữ cảnh (Context) trong ChatGPT, AI là cái gì? – MN](//mn.com.vn/hoc-chatgpt/ngu-canh-context-trong-chatgpt-ai-la-cai-gi/)
5. [AI Agent Roadmap: Hướng dẫn về Cửa sổ Ngữ cảnh và Độ dài Tối đa trong LLM](//tuyendung.evotek.vn/ai-agent-roadmap-huong-dan-ve-cua-so-ngu-canh-va-do-dai-toi-da-trong-llm/)
6. [Prompt là gì? Cách viết prompt AI cho người mới bắt đầu – PhongVu](//phongvu.vn/cong-nghe/cach-viet-prompt-ai-cho-nguoi-moi-bat-dau/)
7. [Kỹ thuật ngữ cảnh cho các tác nhân AI: Bài học từ việc xây dựng Manus](//manus.im/vi/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus)
8. [AI Agents Là Gì? Ứng Dụng, Ví Dụ Các Loại AI Agents](//fpt.ai/vi/bai-viet/ai-agent/)
9. [Sức mạnh của hệ thống AI đa tác nhân – AI chatbot](//aichatbot.com.vn/suc-manh-cua-he-thong-ai-da-tac-nhan/)
10. [AI Agent: Khắc phục những hạn chế của LLM – AI chatbot](//aichatbot.com.vn/ai-agent-cach-khac-phuc-nhung-han-che-cua-llm/)
Tham khảo: medium.com

Bài viết liên quan: