Elon Musk đã chính thức công bố việc bắt đầu đào tạo GROK 3 tại cơ sở siêu máy tính Memphis, được trang bị GPU H100 thế hệ hiện tại của NVIDIA. Cơ sở này, được Musk gọi là ‘cụm đào tạo AI mạnh nhất thế giới’, đã bắt đầu hoạt động vào thứ Hai với sự hỗ trợ của 100.000 GPU H100 làm mát bằng chất lỏng trên một nền tảng RDMA duy nhất.
Vị tỷ phú tuyên bố rằng “AI tiên tiến nhất” thế giới có thể được phát triển vào tháng 12 năm nay, đồng thời ca ngợi các nhóm từ xAI, X và NVIDIA vì công việc tuyệt vời của họ.
Nice work by @xAI team, @X team, @Nvidia & supporting companies getting Memphis Supercluster training started at ~4:20am local time.
With 100k liquid-cooled H100s on a single RDMA fabric, it’s the most powerful AI training cluster in the world!
— Elon Musk (@elonmusk) July 22, 2024
Thông báo này được đưa ra sau khi thỏa thuận máy chủ trị giá 10 tỷ đô la giữa xAI và Oracle bị hủy bỏ gần đây. Musk cho biết xAI Gigafactory of Compute, ban đầu dự kiến đi vào hoạt động vào mùa thu năm 2025, đã bắt đầu hoạt động sớm hơn dự kiến.
xAI trước đó đã thuê ngoài chip AI từ Oracle nhưng quyết định tách ra để phát triển siêu máy tính tiên tiến của riêng mình. Dự án hiện có kế hoạch khai thác tiềm năng của GPU H100 hiện đại có giá khoảng 30.000 đô la mỗi chiếc. GROK 2 sử dụng 20.000 GPU và GROK 3 cần gấp năm lần số GPU đó để xây dựng một chatbot AI tinh vi hơn.
Điều này khá đáng ngạc nhiên, đặc biệt là vì NVIDIA vừa mới công bố bản phát hành sắp tới của GPU H200, dựa trên kiến trúc Hopper. GPU H200, đã đi vào sản xuất hàng loạt vào quý 2, hứa hẹn sẽ cải thiện hiệu suất đáng kể, nhưng trọng tâm trước mắt của xAI là tận dụng cơ sở hạ tầng H100 hiện có để đạt được các mục tiêu đầy tham vọng của mình.
Dylan Patel, một chuyên gia về AI và chất bán dẫn, ban đầu đã nêu lên mối lo ngại về vấn đề điện năng khi vận hành Memphis Supercluster. Ông chỉ ra rằng nguồn cung cấp lưới điện hiện tại là 7 megawatt chỉ có thể duy trì khoảng 4.000 GPU. Tennessee Valley Authority (TVA) dự kiến sẽ cung cấp 50 MW cho cơ sở này theo một thỏa thuận dự kiến sẽ được ký kết vào ngày 1 tháng 8. Tuy nhiên, trạm biến áp cần thiết để đáp ứng toàn bộ nhu cầu điện sẽ chỉ được hoàn thành vào cuối năm 2024.
Khi phân tích hình ảnh vệ tinh, Patel lưu ý rằng Musk đã sử dụng 14 máy phát điện di động VoltaGrid, mỗi máy có thể sản xuất 2,5 megawatt. Tổng cộng, các máy phát điện này sản xuất 35 megawatt điện. Ngoài 8MW từ lưới điện, tổng cộng là 43MW, đủ để cung cấp điện cho khoảng 32.000 GPU H100 với một số giới hạn công suất.
Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn
Theo dõi Twitter (X): https://twitter.com/tapchibtc_io
Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin
- Elon Musk cảnh báo nước Mỹ sắp phá sản, xu hướng “mắt laser” lên ngôi
- Lý do Elon Musk chuyển trụ sở của X và SpaceX khỏi California
Itadori
Theo Cryptopolitan