Thiết kế điều phối tác nhân AI

Nội dung

Tìm hiểu cách thức điều phối hoạt động để nâng cao khả năng của tác nhân AI một cách đáng kể.

Nhìn chung, có 2 loại kiến trúc tác nhân AI.

Kiến trúc tác nhân đơn lẻ
Kiến trúc đa tác nhân

Kiến trúc tác nhân đơn lẻ

Kiến trúc tác nhân đơn lẻ đúng như tên gọi của nó:một hệ thống khép kín với một đơn vị tự chủ duy nhất.

Thiết kế điều phối tác nhân AI

Nó bao gồm mộttác nhân duy nhấtchịu trách nhiệm thực hiện tất cả công việc.
Nó có mô hình trí tuệ nhân tạoriêng (bộ não),bộ nhớ/khả năng quản lý ngữ cảnh(để ghi nhớ các tương tác trong quá khứ) và một bộcông cụ(như máy tính hoặc trình duyệt web) để tương tác với thế giới và thu thập dữ liệu.
Tác nhân này tương tác trực tiếp vớimôi trườngxung quanh và tự xử lýviệc ra quyết định, lập kế hoạch và thực hiệnmà không cần dựa vào các tác nhân khác.
Nó lý tưởng cho các quy trình làm việc đơn giản,trong đó nhiệm vụ được xác định rõ ràng, tuần tự và không yêu cầu kiến thức chuyên môn từ nhiều lĩnh vực khác nhau.
Ví dụ: Một chatbot chăm sóc khách hàng chuyên dụng trả lời các câu hỏi thường gặp về một dòng sản phẩm cụ thể chỉ dựa trên cơ sở kiến thức được xác định trước.

Kiến trúc đa tác tử:

Hệthống đa tác tử (MAS)điều phốinhiều tác tử chuyên biệtđể giải quyết một vấn đề phức tạp mà một tác tử đơn lẻ, đơn khối khó có thể xử lý được.

Nguyên tắc cốt lõi rất đơn giản:chia để trị.
Mục tiêu lớn được chia nhỏ thành các nhiệm vụ phụ nhỏ hơn, và mỗi nhiệm vụ phụ được giao cho một chuyên viên cụ thể với bộ kỹ năng riêng.
Sau đó, các tác nhân này tương tác với nhau thông quacác mô hình điều phốiđược thiết kế cẩn thận để đạt được mục tiêu cuối cùng.
Mô hình đa tác tử cung cấpthiết kế dạng mô-đun, giúp cải thiện đáng kểkhả năng mở rộng, độ tin cậy và khả năng bảo trìcủa toàn bộ hệ thống so với một tác tử đơn lẻ, quá phức tạp.

Quá trình thiết kế sự tương tác giữa các tác nhân này được gọi làPHỐI KHÍ.

Và mô hình điều phối mà bạn chọn cho tác nhân AI của mình sẽ quyết định hiệu quả và hiệu suất của hệ thống.

Không có danh sách tiêu chuẩn nào quy định tất cả các mẫu thiết kế này vì đây không phải là một khái niệm quá mới, nhưng nhiều công ty đã xác định được các mẫu thiết kế cốt lõi có thể được xem xét khi thiết kế trợ lý AI tiếp theo của bạn.

Khi nào nên sử dụng hệ thống đa tác tử?

Hệ thống đa tác tử lý tưởng cho các môi trường bao gồm:

Nhiệm vụ phức tạp, phân tán
Cần có sự chuyên môn hóa ở các thành phần khác nhau.
Hợp tác để giải quyết các vấn đề khó khăn

Ví dụ bao gồm các nền tảng giao dịch tài chính, điều tra an ninh mạng hoặc các dự án nghiên cứu trí tuệ nhân tạo hợp tác.

Ngược lại, các hệ thống tác tử đơn giản hơn và phù hợp hơn với các nhiệm vụ được xác định rõ ràng. Tuy nhiên, các hệ thống đa tác tử cung cấp khả năng cộng tác, song song hóa, khả năng mở rộng và khả năng phục hồi, khiến chúng trở thành lựa chọn ưu tiên cho các môi trường phức tạp và năng động.

Hãy cùng tìm hiểu sâu hơn về những mô hình cốt lõi này.

1. Phối khí tuần tự

Đây là một quy trình làm việc của tác nhân, thực thi một loạt các tác nhân chuyên biệt theo mộttrình tự tuyến tính được xác định trước. Điểm mấu chốt làđầu ra của một tác nhân đóng vai trò là đầu vào trực tiếp cho tác nhân tiếp theo, tạo ra một quy trình xử lý rõ ràng.

Thiết kế điều phối tác nhân AI

Mô hình này có thể được sử dụng cho các quy trình có cấu trúc cao, có thể lặp lại, trong đó trình tự các thao tác là không đổi và mỗi bước phụ thuộc vào bước trước đó (ví dụ: các đường dẫn chuyển đổi dữ liệu, các giai đoạn xử lý tài liệu).

Ví dụ: Hãy tưởng tượng việc tự động hóa quy trình làm việc của một công ty tiếp thị kỹ thuật số chuyên sản xuất và đăng tải bài viết blog cho khách hàng. Quy trình thủ công sẽ trông như thế này:

Người viết nội dung: Soạn thảo bài đăng blog ban đầu dựa trên yêu cầu.
Biên tập viên: Xem xét bản thảo về ngữ pháp, văn phong, giọng điệu và tính mạch lạc, sau đó chỉnh sửa.
Chuyên viên SEO: Tối ưu hóa bài viết đã chỉnh sửa cho công cụ tìm kiếm bằng cách thêm từ khóa, mô tả meta và văn bản thay thế (alt text).
Người biên tập: Lên lịch và đăng tải bài viết cuối cùng, đã được tối ưu hóa, lên trang web của khách hàng.

Biên tập viên không thể bắt đầu xem xét cho đến khi người viết nội dung cung cấp bản nháp. Chuyên gia SEO cần văn bản cuối cùng để tối ưu hóa hiệu quả, và nhà xuất bản chỉ có thể hành động sau khi bài viết được chuẩn bị hoàn chỉnh.

Mô hình điều phối tuần tự sẽ là lựa chọn phù hợp nhất trong trường hợp này.

Một tác nhân xuất bản blog tuân theo mô hình điều phối tuần tự giữa nhiều tác nhân phụ AI sẽ trông giống như có 4 tác nhân phụ như bên dưới:

Đại lý viết nội dung
Biên tập viên phụ tá
Đại lý phụ trách SEO
Đại lý phụ của nhà xuất bản

Thiết kế điều phối tác nhân AI

2. Điều phối đồng thời

Trong mô hình này, nhiều tác nhân phụ chuyên biệt thực hiện cùng một nhiệm vụ hoặc các nhiệm vụ phụ khác nhau một cách độc lập và đồng thời . Sau đó, đầu ra của chúng được kết hợp bởi một tác nhân cuối cùng để cho ra kết quả cuối cùng.

Thiết kế điều phối tác nhân AI

Xử lý song song theo mô hình này giúp giảm đáng kể thời gian chạy tổng thể (độ trễ thấp) và đảm bảo vấn đề được phân tích từ nhiều góc độ đa dạng (ví dụ: kỹ thuật, tài chính, sáng tạo).

Mô hình này lý tưởng cho các tình huống và nhiệm vụ cần xử lý nhanh chóng, những nhiệm vụ cần nhiều góc nhìn độc lập (ví dụ: động não, suy luận nhóm, quyết định dựa trên đa số).

Ví dụ: Hãy tưởng tượng một công ty cần đưa ra một quyết định đầu tư quan trọng, cần thực hiện trong thời gian ngắn, về một loại cổ phiếu cụ thể .

Để tự động hóa kịch bản này và nhận được phân tích theo thời gian thực, chúng ta cần một hệ thống phản hồi trong thời gian ngắn nhất có thể. Chúng ta có thể chia nhỏ hệ thống này thành nhiều tác nhân phụ để phân tích các khu vực khác nhau của cổ phiếu ngay lập tức và độc lập:

Chuyên viên phân tích cơ bản: Xem xét báo cáo tài chính, doanh thu và giá trị nội tại của công ty.
Nhân viên phân tích kỹ thuật : Nghiên cứu biểu đồ giá cổ phiếu, khối lượng giao dịch và các chỉ báo động lượng.
Chuyên viên phân tích tâm lý thị trường : Rà soát tin tức và mạng xã hội để nắm bắt dư luận và niềm tin thị trường.
Chuyên viên phân tích ESG (phụ trách quản trị doanh nghiệp) : Đánh giá các hoạt động bền vững và quản trị của công ty.

Thiết kế điều phối tác nhân AI

Cả bốn chuyên gia đều làm việc đồng thời . Họ không trao đổi với nhau. Sau khi hoàn thành báo cáo cá nhân, họ gửi chúng cho chuyên viên phân tích chứng khoán chính , người sẽ tổng hợp các thông tin khác nhau thành một khuyến nghị cuối cùng.

3. Mẫu vòng lặp

Mô hình tác nhân vòng lặp là một quy trình làm việc cơ bản của trí tuệ nhân tạo, trong đó một tác nhân liên tục thực thi một chuỗi các tác nhân con chuyên biệt cho đến khi đạt được một điều kiện kết thúc cụ thể (ví dụ: số lần lặp tối đa, ngưỡng chất lượng hoặc kết quả kiểm tra thành công).

Mô hình này được quản lý bởi một tác nhân điều khiển quy trình vòng lặp trung tâm và lý tưởng cho các tác vụ yêu cầu:

Phản hồi liên tục và tự điều chỉnh: Hệ thống học hỏi và điều chỉnh phương pháp tiếp cận của mình trong thời gian thực.
Cải tiến chất lượng liên tục: Sản phẩm được tinh chỉnh lặp đi lặp lại để đáp ứng tiêu chuẩn cao.
Các nhiệm vụ đòi hỏi sự tinh chỉnh lặp đi lặp lại để lập kế hoạch phức tạp, tối ưu hóa hoặc tạo/phê bình nội dung.

Thiết kế điều phối tác nhân AI

Mô hình Vòng lặp có hai mô hình con chính: Xem xét và Phê bình, và Cải tiến lặp đi lặp lại .

— Mô hình đánh giá và phê bình (Người tạo/Người phê bình)

Thiết kế điều phối tác nhân AI

Mô hình này tập trung vào việc nâng cao chất lượng và độ tin cậy của nội dung thông qua một chu trình tạo và đánh giá theo lượt, bài bản.

Một tác nhân tạo nội dung (Generator Agent) tạo ra nội dung (ví dụ: mã lập trình, tóm tắt, thiết kế tiếp thị). Một tác nhân phê bình (Critic Agent) đánh giá kết quả đầu ra đó dựa trên các tiêu chí đã được xác định trước (ví dụ: độ chính xác về mặt thực tế, tuân thủ quy định về thương hiệu).
Tác nhân phê bình sẽ chấp thuận kết quả đầu ra hoặc trả lại kết quả kèm phản hồi cho Tác nhân tạo để chỉnh sửa.
Chu trình này lặp lại cho đến khi người phê bình chấp thuận kết quả hoặc đạt đến số lần sửa đổi tối đa.
Trường hợp sử dụng lý tưởng: Các nhiệm vụ mà chất lượng chủ quan hoặc tuân thủ các tiêu chí/hướng dẫn phức tạp là điều thiết yếu.

Ví dụ: Hãy xem xét một công ty quảng cáo sáng tạo đang thiết kế một chiến dịch quảng cáo mới:

Thiết kế điều phối tác nhân AI

Nhà thiết kế sáng tạo (Người tạo ý tưởng): Phát triển ý tưởng và bản phác thảo ban đầu.
Chuyên gia chiến lược tiếp thị (Người phê bình): Xem xét thiết kế dựa trên mục tiêu chiến dịch, hướng dẫn thương hiệu và mức độ thu hút đối tượng mục tiêu.
Chu trình: Nếu chuyên gia chiến lược phát hiện ra lỗi, họ sẽ cung cấp phản hồi chi tiết cho nhà thiết kế. Nhà thiết kế sẽ chỉnh sửa chiến dịch, và chu kỳ xem xét lặp lại cho đến khi chuyên gia chiến lược phê duyệt thiết kế cuối cùng.

— Mô hình tinh chỉnh lặp đi lặp lại
Mô hình này tập trung vào việc dần dần sửa đổi một đối tượng bền vững để hội tụ về một giải pháp thỏa mãn một thước đo định lượng.

Thiết kế điều phối tác nhân AI

Một hoặc nhiều tác nhân chuyên biệt hoạt động trong một vòng lặp để liên tục sửa đổi một đầu ra bền vững (được lưu trữ trong Trạng thái Phiên ) qua nhiều chu kỳ. Mục tiêu là cải thiện một chỉ số duy nhất, có thể định lượng được sau mỗi lần lặp.
Các tác nhân sửa đổi đối tượng bền vững, một chỉ số được kiểm tra, và quy trình lặp lại dựa trên kết quả kiểm tra.
Trường hợp sử dụng lý tưởng: Giải quyết các vấn đề cần hội tụ bằng phương pháp thử và sai , chẳng hạn như sửa lỗi mã dựa trên các lỗi kiểm thử hoặc điều chỉnh tham số cho đến khi đạt được chỉ số mục tiêu. Phương pháp này đảm bảo kết quả cuối cùng được xác minh đầy đủ.

Ví dụ: Các tác nhân AI như Windsurf, Cursor được sử dụng để tự động tìm và triển khai giải pháp khắc phục cho một lỗi phức tạp:

Công cụ chỉnh sửa mã: Chỉnh sửa mã của hàm (kết quả được lưu trữ trong Trạng thái phiên) để cố gắng khắc phục sự cố.
Công cụ chạy thử nghiệm: Thực thi một bài kiểm thử đơn vị cụ thể đối với mã mới và trả về kết quả đạt/không đạt đơn giản (chỉ số định lượng).
Chuyên viên tinh chỉnh: Phân tích báo cáo lỗi kiểm thử và đề xuất phương pháp tiếp cận mới hoặc điều chỉnh mã cụ thể.
Vòng lặp: Mã đã sửa đổi được lưu lại vào Trạng thái Phiên, và chu kỳ lặp lại cho đến khi bài kiểm tra đơn vị thành công (điều kiện kết thúc). Kết quả cuối cùng là mã đã được sửa lỗi và sẵn sàng cho môi trường sản xuất.

4. Mẫu phối hợp

Mô hình Điều phối viên sử dụng một Tác nhân Điều phối trung tâm để quản lý và định tuyến các yêu cầu một cách linh hoạt, giúp việc thực thi quy trình công việc trở nên linh hoạt và phù hợp với ngữ cảnh

Thiết kế điều phối tác nhân AI

Một tác nhân điều phối trung tâm nhận yêu cầu, phân tích và chia nhỏ yêu cầu đó thành các nhiệm vụ phụ bằng trí tuệ nhân tạo, và phân công mỗi nhiệm vụ phụ cho tác nhân chuyên trách phù hợp nhất.

Cung cấp khả năng định tuyến động dựa trên ngữ cảnh tức thời của yêu cầu, giúp nó linh hoạt hơn nhiều so với các mẫu cố định, được mã hóa cứng (như quy trình làm việc Tuần tự hoặc Đồng thời).
Trường hợp sử dụng lý tưởng : Khi trình tự các bước tối ưu hoặc tác nhân chuyên biệt phù hợp nhất không được biết trước và phải được xác định trong quá trình hoạt động bởi trí tuệ nhân tạo.

Ví dụ: Hãy tưởng tượng một hệ thống nhân sự xử lý các nhiệm vụ tuyển dụng nhân viên mới với quy trình khác nhau tùy theo vai trò và địa điểm.

Quản lý Nhân sự (Điều phối viên): Nhận được yêu cầu “Tuyển dụng nhân viên mới” (ví dụ: Vị trí: Kỹ sư phần mềm , Địa điểm: Làm việc từ xa ). Điều phối viên sẽ phân tích thông tin này một cách thông minh.
Đối với kỹ sư làm việc từ xa, Điều phối viên đồng thời phân công nhiệm vụ cho Chuyên viên Cung cấp CNTT (về máy tính xách tay/VPN) và Chuyên viên Phúc lợi (về các biểu mẫu y tế).
Nếu vị trí đó là Nhân viên bán hàng , Điều phối viên sẽ chuyển nhiệm vụ cho Chuyên viên CRM thay vì chuyên viên CNTT.
Điều phối viên theo dõi tất cả các nhiệm vụ đang diễn ra đồng thời, đảm bảo hoàn thành trước khi báo hiệu kết thúc quy trình.

— Mô hình phân chia nhiệm vụ theo thứ bậc

Mô hình phân rã nhiệm vụ theo cấp bậc (Hierarchical Task Decomposition Pattern) là sự phát triển của mô hình điều phối viên (Coordinator pattern), được thiết kế cho các vấn đề quá lớn hoặc quá phức tạp đối với một thực thể điều phối duy nhất.
Thay vì dựa vào một điều phối viên duy nhất, mô hình này phân bổ trách nhiệm trong một hệ thống phân cấp có cấu trúc.
Nó rất phù hợp cho các dự án lớn, phức tạp đòi hỏi kiến thức chuyên môn, thực thi song song và phối hợp chặt chẽ ở nhiều cấp độ.

Thiết kế điều phối tác nhân AI

Ví dụ: Hãy tưởng tượng một tổ chức triển khai hệ thống tác nhân AI để tự động hóa việc ra mắt một sản phẩm hỗ trợ khách hàng mới . Mục tiêu này rất rộng, không rõ ràng và đòi hỏi nhiều khả năng khác nhau phải phối hợp hoạt động.

Tác nhân điều phối (Tác nhân gốc)
nhận mục tiêu cấp cao: “Khởi chạy hệ thống hỗ trợ khách hàng dựa trên trí tuệ nhân tạo”.
Vai trò của nó mang tính chiến lược, không tập trung vào thực thi. Nó phân tích mục tiêu thành các luồng công việc chính như Khả năng mô hình , Tích hợp hệ thống và Chất lượng & An toàn , và giao mỗi luồng cho các tác nhân chuyên trách.
Agent năng lực (Agent cấp trung)
chịu trách nhiệm cải thiện hành vi của AI. Nó chia nhiệm vụ của mình thành các công việc như Phân loại ý định , Tạo phản hồi và Giữ lại ngữ cảnh , rồi phân công chúng cho người khác.
Agent tích hợp (Agent cấp trung)
tập trung vào việc đảm bảo hệ thống hoạt động từ đầu đến cuối. Mục tiêu của nó được chia thành ba giai đoạn: Kết nối API , Thiết lập đường dẫn dữ liệu và Tự động hóa triển khai .
Các tác nhân thực thi (Lớp thực thi)

— Trình xử lý ngôn ngữ tự nhiên (NLP Agent) tinh chỉnh các mô hình phát hiện ý định.

— Trình xử lý kỹ thuật Prompt tối ưu hóa chất lượng phản hồi.

— Pipeline Agent xây dựng các quy trình thu thập và tiền xử lý dữ liệu.

— Trình quản lý triển khai cấu hình các chiến lược CI/CD và triển khai.

6. Mô hình bầy đàn

Hãy coi Mô hình Bầy đàn như là sự đối lập với mô hình lãnh đạo từ trên xuống.

Nếu mô hình Điều phối viên giống như một CEO phân công nhiệm vụ và đưa ra quyết định cuối cùng, thì mô hình Bầy đàn giống như một nhóm chuyên gia ngồi quanh bàn, cùng nhau suy nghĩ và thảo luận. Không có một “ông chủ” duy nhất chỉ đạo công việc. Thay vào đó, mỗi tác nhân đều tham gia bình đẳng.

Mỗi thành viên đóng góp quan điểm riêng, thách thức ý tưởng của người khác và cải thiện đề xuất thông qua thảo luận. Theo thời gian, nhóm sẽ tự nhiên đi đến một giải pháp tối ưu.

Thiết kế điều phối tác nhân AI

Điều quan trọng cần nhớ là:
tiến bộ đến từ sự tương tác, chứ không phải từ sự hướng dẫn.

Ví dụ: Hãy tưởng tượng một công ty đang cố gắng thiết kế một sản phẩm hoàn toàn mới — chẳng hạn, một máy bay không người lái điện nhỏ gọn để giao hàng. Đây không phải là một vấn đề có câu trả lời đúng rõ ràng. Có rất nhiều sự đánh đổi: chi phí, tầm bay, tải trọng và kỳ vọng của khách hàng đều cạnh tranh với nhau.

Thay vì bổ nhiệm một người lãnh đạo, công ty tập hợp một nhóm nhỏ các chuyên gia:

Kỹ sư tư vấn
tập trung vào tính khả thi về mặt kỹ thuật và đề xuất hệ thống động cơ và pin hiệu suất cao.
Chuyên viên mô hình tài chính
đánh giá đề xuất và chỉ ra rằng các thành phần được đề xuất sẽ làm cho sản phẩm trở nên quá đắt.
Chuyên viên nghiên cứu thị trường
bổ sung thêm bối cảnh bên ngoài bằng cách chia sẻ sở thích của khách hàng và giá cả của đối thủ cạnh tranh.

Những người này không báo cáo cho người ra quyết định trung tâm. Họ trao đổi trực tiếp với nhau. Kỹ sư điều chỉnh thiết kế dựa trên phản hồi về chi phí. Chuyên viên tài chính điều chỉnh các giả định sau khi xem xét dữ liệu thị trường. Nhà nghiên cứu thị trường phản ứng với các ràng buộc kỹ thuật được cập nhật.

Chu trình này lặp đi lặp lại — đề xuất, phê bình, tinh chỉnh — cho đến khi nhóm thống nhất được một thiết kế cân bằng giữa hiệu suất, chi phí và sự phù hợp với thị trường.

7. Mô hình lý luận và hành động (ReAct)

Hãy tưởng tượng một nhà nghiên cứu duy nhất, có kỷ luật cao, đang làm việc một mình để giải quyết một vấn đề khó khăn. Vấn đề này không thể giải quyết chỉ bằng suy nghĩ đơn thuần — nó đòi hỏi phải tra cứu thông tin, thực hiện các phép tính hoặc tương tác với môi trường xung quanh.

Đây chính xác là những gì mà mô hình ReAct thể hiện .

ReAct là viết tắt của Reasoning + Acting (Lý luận + Hành động) , mô tả cách một tác nhân AI luân phiên giữa việc suy nghĩ, sử dụng công cụ và học hỏi từ kết quả.

Vòng lặp phản ứng cốt lõi
Cốt lõi của ReAct là một chu trình đơn giản, lặp đi lặp lại:

1. Tư duy (Lý luận)
Nhân viên tạm dừng và suy nghĩ về nhiệm vụ:

Mục tiêu là gì?
Tôi đã có đủ thông tin chưa?
Bước tiếp theo hợp lý là gì?
Công cụ nào, nếu có, sẽ giúp tôi tiến lên phía trước?

Bước này liên quan đến việc lập kế hoạch và ra quyết định .

2. Hành động (Sử dụng công cụ)
Dựa trên lập luận của mình, tác nhân thực hiện một hành động:

Nếu cần thông tin cập nhật, nó sẽ thực hiện tìm kiếm trên web.
Nếu cần kết quả dạng số, nó sẽ sử dụng máy tính.
Nếu nó tương tác với môi trường (như robot), nó sẽ thực hiện một chuyển động hoặc mệnh lệnh.

Điểm mấu chốt là tác nhân không hành động một cách ngẫu nhiên — nó hành động dựa trên lý luận của nó .

3. Quan sát (Kết quả)
Người đại lý nhận được phản hồi từ hành động:

Kết quả tìm kiếm
Giá trị được tính toán
Một trạng thái môi trường mới

Thông tin này được lưu trữ và trở thành một phần trong sự hiểu biết của nhân viên về vấn đề.

4. Vòng lặp
Hệ thống sẽ đưa quan sát mới này trở lại quá trình suy luận của mình và đặt câu hỏi lại:

Câu trả lời này có giải đáp được thắc mắc không?
Tôi có cần thêm thông tin gì nữa không?
Tôi nên làm gì tiếp theo?

Chu trình này lặp lại cho đến khi nhiệm vụ hoàn thành, đạt đến điều kiện dừng hoặc xảy ra lỗi.

Sơ đồ sau đây thể hiện cái nhìn tổng quan về mô hình ReAct:

Thiết kế điều phối tác nhân AI

Hãy sử dụng mô hình ReAct cho các nhiệm vụ phức tạp, năng động, đòi hỏi lập kế hoạch và thích ứng liên tục.

Ví dụ: Hãy xem xét một robot di chuyển từ điểm xuất phát đến điểm đích:

Suy nghĩ: “Con đường nào an toàn và nhanh nhất để đạt được mục tiêu?”
Hành động: Di chuyển tiếp theo trên đoạn đường đã lên kế hoạch.
Quan sát: Phát hiện vị trí hiện tại và các chướng ngại vật gần đó.
Suy nghĩ: “Lại xuất hiện một trở ngại mới. Mình cần phải lên kế hoạch lại.”

Robot liên tục cập nhật kế hoạch của mình dựa trên những gì nó quan sát được, cho phép nó xử lý các môi trường năng động.

Vòng lặp này cho phép tác nhân tuân thủ các ràng buộc động, chẳng hạn như tránh chướng ngại vật mới hoặc tuân theo quy định giao thông, bằng cách liên tục cập nhật kế hoạch dựa trên các quan sát mới. Tác nhân tiếp tục vòng lặp cho đến khi đạt được mục tiêu hoặc gặp lỗi.

Liệu mô hình ReAct có khác với mô hình Iterative không?
Mặc dù mô hình ReAct có tính chất lặp đi lặp lại, nhưng nó không giống với một vòng lặp thông thường.

Lặp lại đơn giản có nghĩa là lặp đi lặp lại các bước cho đến khi một điều kiện được đáp ứng, thường theo một quy trình cố định.
Ngược lại, ReAct là một vòng lặp dựa trên suy luận . Ở mỗi bước, tác nhân chủ động suy nghĩ về những gì nó biết, quyết định hành động tiếp theo tốt nhất, sử dụng công cụ nếu cần thiết, và sau đó điều chỉnh kế hoạch dựa trên kết quả.
Tóm lại, phương pháp lặp lại (iteration) chỉ đơn thuần lặp lại công việc, trong khi ReAct liên tục đánh giá lại những việc cần làm tiếp theo, điều này giúp nó linh hoạt hơn nhiều và phù hợp hơn với các vấn đề năng động, không chắc chắn.

8. Mô hình có sự tham gia của con người

Mô hình Human-in-the-Loop (HITL) đưa ra các điểm tạm dừng có chủ đích trong quy trình làm việc tự động, nơi con người phải xem xét, phê duyệt hoặc can thiệp trước khi hệ thống có thể tiếp tục. Hãy coi đó như một bước ký xác nhận bắt buộc được thiết kế để đảm bảo sự tin tưởng, an toàn và trách nhiệm giải trình — đặc biệt là trong các tình huống rủi ro cao.

Sơ đồ sau đây thể hiện cái nhìn tổng quan về mô hình có sự tham gia của con người:

Thiết kế điều phối tác nhân AI

Khi nào nên sử dụng mẫu HITL?
Hãy sử dụng mẫu này bất cứ khi nào:

Các quyết định đều có những hệ lụy về mặt pháp lý, đạo đức hoặc an toàn.
Cần có sự đánh giá chủ quan.
Trách nhiệm của con người là bắt buộc.

Ví dụ: Hãy tưởng tượng một hệ thống tuân thủ quy định trong một ngân hàng toàn cầu xử lý các giao dịch chuyển tiền giá trị cao. Hệ thống này sử dụng các tác nhân AI để tự động hóa phần lớn các bước kiểm tra, nhưng trách nhiệm pháp lý và đạo đức vẫn là yếu tố tối quan trọng.

Công cụ sàng lọc: Tự động đối chiếu giao dịch với các cơ sở dữ liệu chống gian lận tiêu chuẩn và danh sách trừng phạt cơ bản.
Cảnh báo rủi ro: Nếu đích đến, số tiền hoặc nguồn giao dịch kích hoạt một cảnh báo rủi ro phức tạp, không phải là nhị phân (ví dụ: “khớp không rõ ràng” với danh sách trừng phạt), quy trình sẽ tạm dừng .
Chuyên viên tuân thủ con người: Nhân viên sẽ chuyển toàn bộ hồ sơ vụ việc và các phát hiện ban đầu cho một chuyên gia con người. Chuyên gia này sẽ xem xét các chi tiết phức tạp mà AI không thể đánh giá (rủi ro, tiền lệ pháp lý và tác động đến quan hệ công chúng).
Tiếp theo: Người dùng nhập quyết định cuối cùng ( Phê duyệt/Ghi đè hoặc Giữ lại/Chuyển tiếp ). Chỉ tín hiệu từ người dùng này mới cho phép quy trình tự động tiếp tục chuyển giao (hoặc thực hiện thao tác giữ lại).

Mô hình này là không thể thương lượng đối với các quy trình có tính rủi ro cao, đảm bảo rằng trách nhiệm pháp lý và đạo đức cuối cùng luôn thuộc về một cá nhân.

9. Mô hình điều phối trò chuyện nhóm

Nếu mô hình Swarm Pattern giống như hình thức động não tự do, thì Group Chat Orchestration là một cuộc thảo luận có cấu trúc và được điều phối. Nhiều người tham gia cộng tác trong một cuộc trò chuyện chung, nhưng người quản lý cuộc trò chuyện sẽ kiểm soát luồng thông tin — quyết định ai sẽ nói tiếp, đảm bảo lượt nói luân phiên và hướng dẫn nhóm đi đến quyết định.

Thiết kế điều phối tác nhân AI

Khi nào nên sử dụng tính năng điều phối nhóm trò chuyện?
Mô hình này hoạt động hiệu quả nhất khi:

Việc đưa ra quyết định đòi hỏi phải có sự thảo luận, xác nhận hoặc đồng thuận.
Tính minh bạch và khả năng kiểm toán rất quan trọng.
Cần có các vòng lặp kiểm tra-thử nghiệm hoặc đánh giá.

Phương pháp này đặc biệt hiệu quả trong các quy trình làm việc có sự tham gia của con người, nơi mà sự giám sát và hợp tác đều rất cần thiết.

Ví dụ: Hãy tưởng tượng một công ty truyền thông cần phê duyệt một nội dung trước khi phát hành. Việc này đòi hỏi sự chấp thuận từ nhiều bộ phận trong một cuộc thảo luận có cấu trúc.

Người soạn thảo: Đăng bản nháp nội dung ban đầu vào luồng trò chuyện.
Đại diện pháp lý: Rà soát các vấn đề về bản quyền và tuân thủ pháp luật.
Chuyên viên biên tập: Đánh giá về giọng điệu thương hiệu và tiêu chuẩn chất lượng.
Người điều hành cuộc trò chuyện (Người điều phối): Kiểm soát diễn đàn. Người điều hành có thể sử dụng trình tự luân phiên (Round Robin) hoặc chủ động gọi chuyên gia phù hợp nhất. Ví dụ, nếu chuyên viên pháp lý phát hiện vấn đề, người điều hành sẽ chuyển lượt tiếp theo cho chuyên viên soạn thảo để sửa chữa.

Quy trình này minh bạch, với tất cả thông tin liên lạc được hiển thị trong một luồng duy nhất. Một người thật cũng có thể tham gia với vai trò Quản lý trò chuyện để hướng dẫn kết quả hoặc phê duyệt cuối cùng.

Mô hình này hoạt động tốt trong các tình huống có sự tham gia của con người, nơi con người có thể tùy chọn đảm nhận trách nhiệm quản lý cuộc trò chuyện năng động và hướng dẫn các cuộc hội thoại đến kết quả hiệu quả. Trong mô hình điều phối này, các nhân viên thường ở chế độ chỉ đọc . Họ không sử dụng các công cụ để thực hiện thay đổi trong hệ thống đang hoạt động.

10. Mẫu logic tùy chỉnh

Mô hình Logic Tùy chỉnh cung cấp tính linh hoạt tối đa bằng cách cho phép bạn định nghĩa các quy tắc điều phối riêng của mình bằng mã. Thay vì tuân theo một mô hình được định sẵn, bạn kiểm soát rõ ràng việc phân nhánh, trình tự và tính song song.

Khi nào nên sử dụng logic tùy chỉnh?
Hãy chọn mẫu này khi:

Quy trình làm việc của bạn không tuân theo các khuôn mẫu tiêu chuẩn.
Bạn cần kiểm soát chi tiết các đường dẫn thực thi.
Logic điều kiện phức tạp là điều không thể tránh khỏi.

Nhược điểm là sự phức tạp trong phát triển và bảo trì tăng lên, vì bạn phải chịu trách nhiệm thiết kế và gỡ lỗi toàn bộ quy trình.

Ví dụ về quy trình hoàn tiền cho khách hàng: Đầu tiên, một nhân viên sẽ thực hiện các kiểm tra song song để xác minh giao dịch mua hàng và điều kiện được hoàn tiền. Dựa trên kết quả, nhân viên sẽ định tuyến yêu cầu một cách có điều kiện theo một trong hai luồng khác nhau — hoặc hoàn tiền hoặc cung cấp tín dụng cửa hàng. Quy trình này kết hợp thực thi song song, phân nhánh có điều kiện và các bước tuần tự, do đó không phù hợp với các mô hình điều phối đơn giản hơn.

Người dùng gửi yêu cầu đến nhân viên hoàn tiền của khách hàng, người này đóng vai trò là điều phối viên.
Logic tùy chỉnh của điều phối viên trước tiên gọi một tác nhân xác minh song song, tác nhân này đồng thời điều động hai tác nhân phụ: tác nhân xác minh người mua và tác nhân xác định điều kiện hoàn tiền.
Sau khi thu thập kết quả, nhân viên điều phối sẽ thực thi một công cụ để kiểm tra xem yêu cầu đó có đủ điều kiện được hoàn tiền hay không.
Nếu người dùng đủ điều kiện, điều phối viên sẽ chuyển nhiệm vụ cho một nhân viên xử lý hoàn tiền, người này sẽ gọi process_refundcông cụ đó.
Nếu người dùng không đủ điều kiện, thì điều phối viên sẽ chuyển nhiệm vụ đến một quy trình tuần tự riêng biệt, bắt đầu từ nhân viên xử lý tín dụng cửa hàng và nhân viên ra quyết định về tín dụng.
Kết quả từ bất kỳ đường dẫn nào được chọn sẽ được gửi đến tác nhân phản hồi cuối cùng để đưa ra câu trả lời cho người dùng.

Sơ đồ sau đây minh họa một ví dụ về việc sử dụng mẫu logic tùy chỉnh để mô phỏng quy trình hoàn tiền.

Thiết kế điều phối tác nhân AI

Những thách thức của hệ thống đa tác tử

Phối hợp và Truyền thông:
Truyền thông hiệu quả giữa các tác nhân là rất quan trọng nhưng có thể phức tạp. Các tác nhân phải chia sẻ thông tin và phối hợp hành động để tránh trùng lặp, quyết định mâu thuẫn hoặc xung đột tài nguyên. Nếu không được quản lý cẩn thận, hệ thống đa tác nhân có thể trở nên hỗn loạn và kém hiệu quả.
Sự phức tạp gia tăng:
Mặc dù hệ thống đa tác tử rất mạnh mẽ, nhưng chúng cũng khó thiết kế, phát triển và bảo trì hơn. Chúng đòi hỏi các giao thức truyền thông, chiến lược phối hợp và cơ chế đồng bộ hóa, làm tăng thêm nhiều lớp phức tạp cho kiến trúc hệ thống.
Các vấn đề tiềm ẩn về hiệu quả:
Hệ thống đa tác tử đôi khi tiêu tốn nhiều tài nguyên hơn hệ thống đơn tác tử. Việc giao tiếp và phối hợp thường xuyên giữa các tác tử có thể làm tăng nhu cầu xử lý, làm chậm quá trình hoàn thành nhiệm vụ và làm tăng chi phí tính toán. Do đó, quản lý tài nguyên hiệu quả là rất quan trọng để duy trì hiệu suất.

Giờ chúng ta đã tìm hiểu về các mô hình điều phối, tiếp theo tìm hiểu các khung công tác giúp xây dựng các hệ thống tác nhân này một cách thiết thực và có khả năng mở rộng.

Kiến thức

Kiến trúc tác nhân đơn lẻ