Xây dựng các Tác nhân Dữ liệu dựa trên Sự kiện với BigQuery, Pub/Sub và ADK
Dữ liệu chỉ thực sự mang lại giá trị khi bạn có khả năng hành động dựa trên nó ngay lập tức. Trong môi trường doanh nghiệp hiện đại, việc phản ứng với các sự kiện sau vài giờ hoặc thậm chí vài phút thường đã là quá muộn. Cho dù bạn đang đối phó với gian lận tài chính hay những gián đoạn bất ngờ trong chuỗi cung ứng, mỗi giây trôi qua đều vô cùng quý giá.
Tuy nhiên, rất nhiều hệ thống hiện nay vẫn dựa vào các công việc xử lý hàng loạt theo lịch trình chậm chạp hoặc các dịch vụ nhỏ lẻ mong manh vốn luôn phải kiểm tra thay đổi liên tục. Đến khi một vấn đề lộ diện, thiệt hại thường đã xảy ra. Điều đó khiến các chuyên gia điều tra phải vất vả tìm kiếm thông tin qua hàng đống nhật ký và truy vấn cơ sở dữ liệu. Đây là một quy trình chậm chạp, mệt mỏi và hoàn toàn không thể mở rộng quy mô một cách hiệu quả.
Sự ra đời của các Tác nhân Dữ liệu dựa trên Sự kiện
Sẽ ra sao nếu thay vì chờ đợi các quy trình chậm chạp và phân loại thủ công, nền tảng dữ liệu của bạn có thể ngay lập tức gửi cảnh báo ngay khi phát hiện ra điểm bất thường, đồng thời kích hoạt một tác nhân trí tuệ nhân tạo (AI) tự trị để điều tra và giải quyết vấn đề đó?
Đây chính là lời hứa từ kiến trúc Tác nhân Dữ liệu dựa trên Sự kiện. Bằng cách kết hợp các truy vấn liên tục của BigQuery, dịch vụ điều phối tin nhắn Pub/Sub và các tác nhân ADK trên Công cụ Tác nhân Vertex AI, bạn có thể xây dựng một hệ thống phân loại các sự kiện trong thời gian thực và tự động điều tra chúng. Tác nhân này sử dụng khả năng lập luận nâng cao để thu thập bối cảnh, phân tích dữ liệu và tự giải quyết vấn đề ngay tại chỗ hoặc chuyển tiếp cho con người khi cần can thiệp trực tiếp.
Kiến trúc kết hợp: Cách thức hoạt động
Quy trình dựa trên sự kiện này tận dụng ba thành phần cốt lõi sau đây:
- Phát hiện: Các truy vấn liên tục trong BigQuery theo dõi luồng dữ liệu trực tiếp và phát hiện các điểm bất thường bằng công cụ dựa trên quy tắc.
- Điều hướng: Pub/Sub chuyển giao các sự kiện này một cách tin cậy, sử dụng các bước chuyển đổi thông điệp đơn để định dạng lại dữ liệu sao cho phù hợp với mong đợi của tác nhân AI, từ đó kích hoạt quá trình điều tra.
- Giải quyết: Một tác nhân Vertex AI (được xây dựng bằng bộ công cụ ADK) nhận sự kiện, tiến hành điều tra bằng các công cụ tùy chỉnh và ghi lại quyết định của mình.
Hãy cùng đi sâu vào từng thành phần qua một trường hợp cụ thể: phát hiện và điều tra các giao dịch tài chính gian lận trong thời gian thực.
Phần 1: Truy vấn liên tục trong BigQuery
Truy vấn liên tục trong BigQuery cho phép bạn xây dựng các luồng sự kiện thời gian thực bằng ngôn ngữ SQL tiêu chuẩn. Đây là những truy vấn chạy bền bỉ, liên tục phân tích dữ liệu nạp vào và xuất kết quả ngay lập tức đến các đích đến như Pub/Sub.
Việc chuyển đổi từ cơ chế lấy dữ liệu sang cơ chế đẩy dữ liệu trực tiếp trong BigQuery có nghĩa là bạn có thể phát hiện các điểm bất thường phức tạp, chẳng hạn như một người dùng thực hiện giao dịch ở hai quốc gia khác nhau trong một khoảng thời gian ngắn, ngay bên trong kho dữ liệu của mình. Bạn không cần phải di chuyển dữ liệu sang một công cụ phân tích luồng riêng biệt.
Khả năng này giúp dân chủ hóa việc xử lý luồng dữ liệu cho bất kỳ người dùng SQL nào, loại bỏ nhu cầu về các công cụ bên ngoài chuyên dụng hay chuyên môn sâu về khoa học dữ liệu. Cách tiếp cận này cũng giúp quản lý chi phí cho các mô hình ngôn ngữ lớn (LLM); bằng cách sử dụng SQL để lọc các điểm bất thường cụ thể, bạn đảm bảo rằng các tác nhân AI chỉ xử lý đúng bối cảnh cần thiết thay vì bị choáng ngợp bởi dữ liệu thô.
Phần 2: Pub/Sub và Chuyển đổi Thông điệp Đơn (SMT)
Dữ liệu sự kiện được xuất từ truy vấn liên tục sẽ được gửi trực tiếp đến một chủ đề trong Pub/Sub. Trước khi dữ liệu thô này có thể được tác nhân AI sử dụng, nó cần được chuyển đổi để phù hợp với cấu trúc mà tác nhân yêu cầu.
Thay vì phải triển khai một dịch vụ trung gian phức tạp để định dạng lại tin nhắn, bạn có thể xử lý việc này hoàn toàn trong Pub/Sub bằng cách sử dụng Chuyển đổi Thông điệp Đơn (SMT). SMT cho phép bạn chạy các đoạn mã JavaScript nhỏ gọn ngay trong Pub/Sub để ánh xạ, định hình lại hoặc làm sạch dữ liệu trong tích tắc.
Sau khi cấu hình quy trình điều hướng, Pub/Sub sẽ tự động đẩy mọi sự kiện đã được chuyển đổi trực tiếp đến điểm cuối của tác nhân AI để xử lý ngay lập tức.
Phần 3: ADK và Công cụ Tác nhân Vertex AI
Đây chính là bộ não của toàn bộ hoạt động. Khi một tác nhân được triển khai trên Công cụ Tác nhân Vertex AI, nền tảng sẽ tự động cung cấp một điểm cuối an toàn được thiết kế riêng để tiếp nhận các sự kiện đến.
Với các chỉ dẫn cụ thể và bộ công cụ tùy chỉnh, tác nhân AI sẽ tự chủ điều tra cảnh báo bằng cách tích cực thu thập bối cảnh từ bên ngoài. Nó có thể truy vấn lịch sử giao dịch của người dùng trong BigQuery, phân tích các dữ liệu không cấu trúc như hóa đơn, hoặc đối chiếu thông tin với Google Tìm kiếm để xác minh uy tín của một cửa hàng. Cuối cùng, nó sẽ phân loại giao dịch là an toàn hoặc đánh dấu là cần con người can thiệp.
Lợi thế từ sự kết hợp với con người
Cách tiếp cận này là yếu tố then chốt để mở rộng quy mô. Bằng cách lọc bỏ các nhiễu thông tin một cách hiệu quả, hệ thống giúp giảm đáng kể gánh nặng vận hành và đảm bảo rằng các điều tra viên chỉ dành thời gian cho những trường hợp phức tạp nhất. Bạn có thể để tác nhân tự động hóa hoàn toàn quy trình hoặc giữ vai trò giám sát để can thiệp khi cần thiết.
Kết nối tất cả lại: Phân tích Tác nhân
Khi quy trình đã đi vào hoạt động, công việc sẽ chuyển từ xây dựng sang giám sát. Vì các tác nhân AI hoạt động âm thầm phía sau, việc có cái nhìn sâu sắc về những gì chúng đang làm, thời gian thực hiện bao lâu và chi phí ra sao là cực kỳ quan trọng.
Bằng cách sử dụng các tiện ích phân tích, hệ thống sẽ tự động ghi lại toàn bộ dữ liệu dấu vết, việc sử dụng công cụ và độ trễ thực thi trực tiếp vào BigQuery. Điều này cho phép bạn xây dựng các bảng điều khiển động và thiết lập các cảnh báo tùy chỉnh để theo dõi đội ngũ AI của mình trong thời gian thực.
Lời kết
Sự hội tụ giữa luồng dữ liệu thời gian thực và AI tác nhân đang thay đổi cách chúng ta xử lý các cảnh báo vận hành. Quy trình bốn bước này bao gồm Phát hiện thời gian thực, Chuyển đổi và Điều hướng thông minh, Điều tra tự chủ và cuối cùng là Phân tích chuyên sâu.
Kiến trúc này cho phép bạn xây dựng một đội ngũ làm việc chủ động, có khả năng xử lý các điểm bất thường ngay khi chúng xảy ra, tất cả nằm trong một môi trường Google Cloud được quản trị tốt và linh hoạt.
MagicFlow | TechData.AI
