"Bom hạt nhân" 2,5 tấn tại CES 2026: cách NVIDIA định hình lại tương lai của AI với Vera Rubin

Tại CES 2026, Jensen Huang đã mang lên sân khấu một điều bất ngờ: không phải một card đồ họa dành cho người tiêu dùng, mà là một rack server AI nặng 2,5 tấn. Hành động mang tính biểu tượng này giới thiệu thứ có thể gọi là “bom nguyên tử” thực sự của sự kiện: nền tảng tính toán Vera Rubin, một hệ sinh thái phần cứng hoàn toàn được thiết kế lại để thúc đẩy quá trình huấn luyện các mô hình AI thế hệ mới.

Sáu chip, một tầm nhìn duy nhất: kiến trúc thách thức sự chậm lại của Moore

Vera Rubin đại diện cho một bước ngoặt so với quá khứ của NVIDIA. Trong khi truyền thống mỗi thế hệ bộ xử lý chỉ nâng cấp 1-2 chip, lần này công ty đã thiết kế lại đồng thời 6 thành phần khác nhau, tất cả đều đã trong sản xuất.

Lý do rất đơn giản nhưng sâu sắc: luật Moore đã không còn đủ nữa. Các mô hình AI tăng gấp 10 lần mỗi năm, nhưng các cải tiến truyền thống về hiệu năng không theo kịp. NVIDIA đã chọn hướng đi đổi mới “đồng bộ ở mọi cấp độ” của nền tảng.

Sáu trụ cột của “bom nguyên tử” công nghệ:

CPU Vera tích hợp 88 lõi Olympus tùy chỉnh, hỗ trợ 176 luồng nhờ công nghệ đa luồng không gian NVIDIA, và cung cấp bộ nhớ hệ thống 1,5 TB—gấp ba lần thế hệ Grace trước đó. Băng thông NVLink đạt 1,8 TB/s.

GPU Rubin là ngôi sao thực sự: với khả năng suy luận NVFP4 50 PFLOPS (5 lần mạnh hơn Blackwell), chứa 336 tỷ transistor và bao gồm bộ động cơ Transformer thứ ba điều chỉnh độ chính xác theo nhu cầu.

Card mạng ConnectX-9 hỗ trợ Ethernet 800 Gb/s với RDMA lập trình được, trong khi BlueField-4 DPU được thiết kế đặc biệt để xử lý các kiến trúc lưu trữ AI mới, kết hợp CPU Grace 64 lõi với 126 tỷ transistor.

Switch NVLink-6 kết nối tới 18 nút tính toán, cho phép 72 GPU Rubin hoạt động như một máy duy nhất thống nhất, với băng thông tất cả các hướng 3,6 TB/s cho mỗi GPU. Cuối cùng, switch quang Spectrum-6 sử dụng 512 kênh 200Gbps mỗi kênh, tích hợp silicon photonics.

Hiệu năng thay đổi cuộc chơi: từ 3,5x đến 10x cải thiện

Trong hệ thống Vera Rubin NVL72, sự tăng trưởng về hiệu năng so với Blackwell là rõ rệt. Suy luận NVFP4 đạt 3,6 EFLOPS (+5x), trong khi huấn luyện đạt 2,5 EFLOPS (+3,5x). Bộ nhớ khả dụng gần như gấp ba: 54TB LPDDR5X và 20,7TB HBM.

Nhưng dữ liệu ấn tượng nhất là về hiệu quả. Mặc dù số transistor chỉ tăng 1,7 lần (đạt 220 nghìn tỷ ), năng suất đo bằng token AI trên watt trên dollar tăng gấp 10 lần. Đối với một trung tâm dữ liệu trị giá 50 tỷ đô và công suất 1 gigawatt, điều này có nghĩa là tăng gấp đôi khả năng sinh lợi trực tiếp.

Về mặt thực tế: để huấn luyện một mô hình 100 nghìn tỷ tham số, Vera Rubin chỉ cần 1/4 hệ thống Blackwell, và chi phí để tạo ra một token giảm xuống còn khoảng 1/10 so với trước.

Kỹ thuật cách mạng: từ lắp ráp đến làm mát

“Bom nguyên tử” phần cứng không chỉ là sức mạnh thuần túy. Kỹ thuật của Vera Rubin giải quyết các vấn đề thực tế từng gây khó khăn cho các hệ thống trước đó. Các nút siêu máy tính cũ cần tới 43 cáp và 2 giờ lắp ráp thủ công; các nút Vera không dùng cáp, chỉ cần 6 ống làm mát chất lỏng, và lắp trong 5 phút.

Phía sau rack chứa gần 3,2 km cáp đồng: 5.000 cáp tạo thành xương sống NVLink 400Gbps. Như Jensen Huang đã đùa: “Chúng có thể nặng vài trăm pound—bạn cần là một CEO khỏe mạnh để làm việc này”.

Vấn đề bộ nhớ ngữ cảnh: giải pháp BlueField-4

AI hiện đại đối mặt với một nút thắt quan trọng: “KV Cache” (bộ nhớ làm việc của AI) tăng theo các cuộc hội thoại dài hơn và mô hình lớn hơn. Vera Rubin giải quyết điều này bằng các bộ xử lý BlueField-4 tích hợp trong rack, mỗi bộ có 150TB bộ nhớ ngữ cảnh.

Mỗi nút có 4 BlueField-4, phân phối bộ nhớ cho GPU: mỗi GPU nhận thêm 16TB bộ nhớ ngoài 1TB nội tại, duy trì băng thông 200Gbps mà không giảm tốc độ.

Spectrum-X: mạng thiết kế cho AI sáng tạo

Để hàng chục rack và hàng nghìn GPU hoạt động như một bộ nhớ phân tán duy nhất, mạng phải “lớn, nhanh và ổn định”. Spectrum-X là nền tảng Ethernet đầu tiên trên thế giới được thiết kế đặc biệt cho AI sáng tạo.

Phiên bản mới nhất sử dụng quy trình COOP của TSMC và silicon photonics, với 512 kênh 200Gbps mỗi kênh. Tầm nhìn của Jensen Huang thuyết phục: tăng năng suất 25%, tương đương tiết kiệm 5 tỷ đô trên một trung tâm dữ liệu 50 tỷ đô. “Có thể nói hệ thống mạng này gần như miễn phí”, ông nhấn mạnh.

Từ lý thuyết đến hành động: AI vật lý, robot và tự hành

Tập trung của “bom nguyên tử” không chỉ là phần cứng. Jensen Huang nhấn mạnh khoảng 10 nghìn tỷ đô tài nguyên tính toán tích tụ trong thập kỷ qua đang được hiện đại hóa toàn diện, không chỉ phần cứng—mà còn là một bước ngoặt phần mềm.

Kiến trúc của “ba máy tính” cho AI vật lý:

Máy huấn luyện dựa trên GPU như kiến trúc GB300. Máy suy luận, “não bộ” thực hiện quyết định theo thời gian thực trên robot và thiết bị biên. Máy mô phỏng (Omniverse và Cosmos) tạo ra các môi trường ảo nơi AI học hỏi phản hồi vật lý.

Alpamayo: tự hành với khả năng lý luận

Trên nền tảng kiến trúc này, NVIDIA giới thiệu Alpamayo, hệ thống tự hành đầu tiên có khả năng lý luận thực sự. Khác với các hệ thống truyền thống, Alpamayo hoàn toàn end-to-end và giải quyết “vấn đề đuôi dài”—khi đối mặt với các tình huống đường phố chưa từng gặp, nó không chỉ chạy mã cơ học, mà còn suy luận như một người lái xe.

Mercedes CLA trang bị Alpamayo sẽ ra mắt tại Mỹ trong quý 1 năm 2026, tiếp theo là châu Âu và châu Á. Hệ thống đã nhận đánh giá NCAP là xe an toàn nhất thế giới, nhờ “lưới an toàn kép” của NVIDIA: khi mô hình AI thiếu tự tin, hệ thống lập tức chuyển sang chế độ an toàn truyền thống.

Chiến lược robot: từ Boston Dynamics đến Disney

NVIDIA đã cho thấy chín công ty lớn về AI và phần cứng đều mở rộng sang lĩnh vực robot. Mỗi robot sẽ sử dụng máy tính Jetson, được huấn luyện trong trình giả lập Isaac của Omniverse, và công nghệ sẽ tích hợp vào các hệ thống công nghiệp của Synopsys, Cadence, Siemens và các hãng khác.

Jensen Huang mời các robot người và bốn chân của các công ty như Boston Dynamics và Agility, nhấn mạnh một viễn cảnh hấp dẫn: robot lớn nhất chính là nhà máy. Tầm nhìn là thiết kế chip, hệ thống và mô phỏng nhà máy đều sẽ được thúc đẩy bởi AI vật lý.

Tại sao “bom nguyên tử” này lại xuất hiện đúng thời điểm?

Trong bối cảnh ngày càng có nhiều hoài nghi về một “bong bóng AI” giả định, Jensen Huang không chỉ tập trung vào sức mạnh tính toán thuần túy, mà còn vào các ứng dụng thực tế. “Bom nguyên tử” nặng 2,5 tấn vừa là biểu tượng, vừa là lời hứa: chứng minh AI thực sự có thể biến đổi cả thế giới số lẫn thế giới vật lý.

NVIDIA, trước đây bán “cây xẻng cho thợ đào vàng”, nay đã bước vào thị trường nơi cạnh tranh khốc liệt hơn—AI vật lý, robot, tự hành. Như Huang đã gợi ý: “Khi chiến tranh đang diễn ra, bạn vẫn có thể tiếp tục bán vũ khí”.

Nhưng đổi mới thực sự của Vera Rubin không phải là xây dựng một “bom nguyên tử” phần cứng mạnh hơn—mà là chứng minh rằng bằng cách đồng bộ đổi mới ở mọi cấp độ của nền tảng, các giới hạn truyền thống có thể bị vượt qua.

TOKEN-2,77%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim