Cựu Giám Đốc AI Của Databricks Muốn Cắt Giảm Hóa Đơn Tiền Điện Của AI Xuống 1.000 Lần
Cuộc đua tìm kiếm những đột phá tiếp theo trong lĩnh vực trí tuệ nhân tạo đã mở đường cho nhiều dự án đầy tham vọng. Tuy nhiên, có một doanh nghiệp đặc biệt đang coi đây là cơ hội vàng để tái cấu trúc hoàn toàn nền tảng điện toán truyền thống từ vạch xuất phát.
Được dẫn dắt bởi Naveen Rao, cựu giám đốc mảng trí tuệ nhân tạo tại Databricks, công ty khởi nghiệp Unconventional AI đang mang đến một lời hứa vô cùng táo bạo: tối ưu hóa hiệu suất tiêu thụ năng lượng của quá trình xử lý suy luận AI lên một tầm cao mới. Vũ khí bí mật giúp họ hiện thực hóa điều này chính là một kiến trúc máy tính hoàn toàn mới hoạt động dựa trên bộ dao động.
Khởi đầu của một cuộc cách mạng phần cứng mới
Vừa qua, công ty đã chính thức ra mắt mô hình trí tuệ nhân tạo đầu tiên mang tên Un-0. Đây là một công cụ tạo hình ảnh độc đáo, lần đầu tiên chứng minh cách công nghệ của họ có thể tái hiện và vận hành mượt mà các hệ thống AI thông thường. Trong báo cáo nghiên cứu đi kèm, đội ngũ chuyên gia của Unconventional AI đã trình bày chi tiết cách họ xây dựng thành công một mô hình tạo ảnh hoàn chỉnh bằng cách giả lập phần mềm cho kiến trúc phần cứng mới này. Kết quả thực tế cho thấy mô hình hoạt động hiệu quả không kém cạnh các mô hình khuếch tán tiên tiến nhất hiện nay trên thị trường.
Naveen Rao chia sẻ rằng đây chính là lời chào thế giới của một thế hệ máy tính hoàn toàn mới. Ông cũng tiết lộ rằng trong vòng một năm tới, công chúng sẽ liên tục được đón nhận thêm nhiều thông tin vô cùng thú vị xoay quanh công nghệ này.
Sức mạnh vượt trội đằng sau cơ chế giả lập
Những sản phẩm đầu ra từ mô hình Un-0 có chất lượng tương đương với các mô hình tạo ảnh phổ biến hiện nay như Stable Diffusion hay hệ thống GPT của OpenAI. Tuy nhiên, điều kỳ diệu thực sự nằm ở cách thức hệ thống này vận hành để đi đến kết quả cuối cùng. Thay vì sử dụng các dòng chip điện toán truyền thống đang cung cấp năng lượng cho các mô hình ngôn ngữ lớn hiện tại, Un-0 được xây dựng trên cấu trúc dựa trên bộ dao động khác biệt hoàn toàn. Mặc dù các nguyên lý kỹ thuật của phương pháp này vô cùng phức tạp, Rao tin tưởng chắc chắn rằng nó có thể giảm thiểu lượng điện năng tiêu thụ lên tới 1.000 lần khi được hoàn thiện hoàn toàn trên thực tế.
Từng bước xây dựng hệ thống vật lý
Hiện tại, phần lớn cơ sở hạ tầng phục vụ cho mục tiêu này vẫn đang trong quá trình phát triển. Phiên bản Un-0 hiện thời đang chạy trên phần mềm giả lập chip dao động của Unconventional AI, nhưng doanh nghiệp đã có kế hoạch sớm công bố sơ đồ thiết kế cho một con chip vật lý thực tế trong thời gian ngắn sắp tới. Từ nền tảng đó, họ hướng đến xây dựng toàn bộ hệ thống xử lý suy luận từ gốc, giúp Unconventional AI có thể cung cấp năng lượng điện toán mạnh mẽ như bất kỳ nhà cung cấp dịch vụ đám mây lớn nào khác.
Mục tiêu của họ là tạo ra một hệ thống phần cứng mới được cấu thành từ chính những con chip tự phát triển. Khách hàng chỉ cần gửi yêu cầu đầu vào qua đường truyền mạng và nhận lại kết quả suy luận AI một cách nhanh chóng, nhưng toàn bộ quá trình đó lại chỉ tiêu tốn một phần nghìn năng lượng so với thông thường.
Giải bài toán giới hạn năng lượng toàn cầu
Đây là một mục tiêu vô cùng to lớn và đầy thử thách, đặc biệt là đối với một doanh nghiệp có quy mô nhân sự dưới 50 người. Thế nhưng, trước bối cảnh cơ sở hạ tầng trí tuệ nhân tạo toàn cầu đang phình to và chi phí năng lượng ngày một đắt đỏ, nỗ lực đột phá này có thể là chiếc chìa khóa duy nhất giải quyết triệt để gốc rễ của vấn đề lớn này.
Naveen Rao nhận định rằng việc mở rộng quy mô trí tuệ nhân tạo đang gặp trở ngại lớn nhất từ nguồn năng lượng. Đây sẽ là giới hạn cơ bản trong những năm tới và chúng ta không thể vượt qua nếu không có sự thay đổi mang tính cách mạng. Đến cuối cùng, bài toán phát triển công nghệ sẽ quay về câu chuyện tối ưu hóa năng lượng, và Unconventional AI tự hào là một trong số ít những dự án tiên phong dám đối mặt và giải quyết thách thức này từ gốc rễ phần cứng.
MagicFlow | TechData.AI
