Một thông tin cảnh báo nghiêm trọng vừa được công bố đã khiến giới công nghệ và an ninh mạng toàn cầu không khỏi lo ngại. Theo hãng trí tuệ nhân tạo Anthropic có trụ sở tại Mỹ, họ đã kịp thời phát hiện và ngăn chặn một chiến dịch tấn công mạng quy mô lớn do một nhóm tin tặc nước ngoài đứng sau. Điều đặc biệt và gây chấn động ở đây là phần lớn quá trình xâm nhập hệ thống không do con người trực tiếp điều khiển, mà được thực hiện gần như hoàn toàn bởi trí tuệ nhân tạo.
Cụ thể, Anthropic cho biết vào tháng 9 vừa qua, nhóm tin tặc đã khai thác công cụ lập trình Claude Code – một sản phẩm AI do chính hãng phát triển – để tiến hành các hoạt động tấn công. Mục tiêu của chiến dịch này là khoảng 30 tổ chức, bao gồm nhiều định chế tài chính và cơ quan chính phủ tại nhiều quốc gia khác nhau. Mặc dù số vụ xâm nhập thành công chỉ ở mức hạn chế, song điều khiến các chuyên gia lo ngại là có tới 80–90% các bước trong quy trình tấn công được AI tự động hóa. Đây được xem là trường hợp đầu tiên được ghi nhận về một chiến dịch hack gần như không cần sự can thiệp trực tiếp của con người.

Hiện tại, Anthropic chưa tiết lộ danh tính các tổ chức bị nhắm tới, nhưng xác nhận rằng tin tặc đã thu thập được một phần dữ liệu nội bộ. Đáng chú ý hơn, trong quá trình bị lợi dụng, hệ thống AI đôi khi tạo ra những thông tin không chính xác, thậm chí khẳng định đã tìm thấy dữ liệu nhạy cảm, trong khi thực chất đó chỉ là các nguồn thông tin công khai, ai cũng có thể truy cập. Điều này cho thấy những hạn chế và rủi ro tiềm ẩn khi AI bị đặt vào các tình huống vượt ngoài mục đích ban đầu.
Anthropic khẳng định họ đã triển khai nhiều tầng bảo vệ nhằm ngăn chặn việc lạm dụng AI cho các hoạt động phi pháp. Tuy nhiên, nhóm tin tặc được cho là đã vượt qua các rào cản này bằng một phương thức khá đơn giản nhưng hiệu quả: yêu cầu AI nhập vai một chuyên gia an ninh mạng đang tiến hành kiểm thử hợp pháp hệ thống.
Dù vậy, không phải tất cả chuyên gia đều đánh giá vụ việc ở mức báo động cao nhất. Một số ý kiến cho rằng đây thực chất chỉ là một hình thức tự động hóa nâng cao, chứ chưa thể coi là trí tuệ nhân tạo có khả năng tự tư duy và ra quyết định độc lập.
Tuy nhiên, theo nhận định từ giới chuyên gia WhiteHat, AI đang tiến rất nhanh đến ngưỡng có thể tự động hóa hoàn toàn các cuộc tấn công mạng. Nếu xu hướng này không được kiểm soát và giám sát chặt chẽ, nguy cơ xuất hiện thêm nhiều vụ việc tương tự với quy mô lớn hơn và thiệt hại nghiêm trọng hơn trong tương lai là điều khó tránh khỏi.