Революція масового обчислення: як "ядерна бомба" Вери Рубін переосмислює хід розвитку ШІ

Виклик, який не можна ігнорувати: Закон Мура сповільнюється, попит на ШІ вибухає

Індустрія стикається з незручним парадоксом: у той час як швидкість покращення кремнію сповільнюється, моделі штучного інтелекту вимагають експоненційного зростання продуктивності щороку. Для дата-центру потужністю 1 ГВт, вартістю 50 мільярдів доларів, різниця між старою та новою архітектурою може означати безпосереднє подвоєння їхньої здатності генерувати дохід.

Дженсен Хуанг, генеральний директор одного з світових технологічних лідерів, відкрито визнає цю дилему: традиційні методи оптимізації вже не можуть йти в ногу. Тому цього разу вони зробили ставку на повний редизайн 6 ключових компонентів платформи обчислень Vera Rubin, яка вже знаходиться на стадії масового виробництва.

Vera Rubin: архітектура, що переписує правила гри

Настоящий герой цього циклу — не звичайна відеокарта, а цілісна екосистема обробки. Vera Rubin, названий на честь астронома, який відкрив темну матерію, уособлює зміну менталітету: одночасно інновувати на всіх рівнях платформи.

6 опор цієї архітектури:

Vera CPU забезпечує інтелект і координацію. Оснащена 88 персоналізованими ядрами Olympus, підтримує 176 потоків одночасно завдяки технології мульти-потокового простору. Пропускна здатність NVLink C2C 1.8 Тб/с і системна пам’ять 1.5 Тб (втричі більше за попереднє покоління) гарантують відсутність вузьких місць у базових операціях. З 227 мільярдами транзисторів вона інтегрує необхідну обчислювальну потужність для координації масових операцій.

Rubin GPU, обчислювальне ядро, досягає 50 PFLOPS потужності інференції з зменшеною точністю, у п’ять разів перевищуючи архітектуру Blackwell. З 336 мільярдами транзисторів, вона включає третє покоління трансформерних двигунів, які динамічно регулюють точність відповідно до потреб моделі.

Мережева карта ConnectX-9 забезпечує ультра швидке з’єднання з Ethernet 800 Гбіт/с на основі технології PAM4 200G. Вона включає програмований RDMA і прискорювач маршрутизації даних, а також сертифікації безпеки CNSA і FIPS з 23 мільярдами транзисторів.

BlueField-4 DPU виступає як спеціалізований процесор для зберігання даних ШІ нового покоління. З пропускною здатністю 800 Гбіт/с SmartNIC, поєднує CPU Grace з 64 ядрами та ConnectX-9, інтегруючи 126 мільярдів транзисторів, присвячених цій критичній функції.

NVLink-6 — це комутатор мережі, що керує внутрішньою мережею. Може з’єднувати 18 обчислювальних вузлів і координувати до 72 GPU Rubin, працюючи як єдина цілісна система. З архітектурою NVLink 6, кожна GPU досягає 3.6 Тбіт/с пропускної здатності all-to-all, що дозволяє надзвичайно швидкий колективний обмін даними всередині мережі.

Нарешті, оптичний комутатор Spectrum-6 обробля 512 каналів по 200 Гбіт/с кожен для передачі даних, що перевищують звичайні швидкості. Виготовлений за технологією інтегрованого фотонного кремнію через TSMC COOP, він має 352 мільярди транзисторів, присвячених оптичній міжмережевій інтерконнекції у пакеті.

Числа, що говорять: безпрецедентні покращення продуктивності

Отримана система NVL72, що базується на глибокій інтеграції, встановлює нові стандарти. У задачах з інференцією з зменшеною точністю вона досягає 3.6 EFLOPS, у п’ять разів перевищуючи попереднє покоління. Для тренування — 2.5 EFLOPS, що в 3.5 рази більше.

Доступна пам’ять утричі більша: 54 ТБ LPDDR5X у головній системі проти 20.7 ТБ високопродуктивної HBM. Пропускна здатність HBM4 становить 1.6 ПБ/с (в 2.8 рази більше), тоді як пропускна здатність Scale-Up досягає 260 ТБ/с, удвічі більше за попереднє покоління.

Найважливіше: ці прориви у продуктивності досягнуті всього з 1.7 разом більшою кількістю транзисторів (2.2 трильйони всього), що доводить, що інновації в архітектурі так само важливі, як і щільність кремнію.

Від цифрового до фізичного: наступна межа

Хоча ці числа вражають, їх справжній вплив — у застосуваннях. ШІ тепер має перейти від цифрового світу до фізичного. Для цього потрібні три типи інтегрованих обчислень:

Обчислювальна машина для тренування на базі архітектур, таких як GB300, що генерують базові моделі. Машина для інференції — “мозок”, що працює в роботах або автономних транспортних засобах у реальному часі. І машина для симуляції, включаючи платформи Omniverse і Cosmos, що створюють віртуальні середовища, де ШІ навчається фізичним зворотнім зв’язкам перед роботою у реальному світі.

Alpamayo: автономне керування, що раціоналізує

На основі цієї архітектури з трьома комп’ютерами з’являється Alpamayo — перша система автономного керування з справжніми можливостями раціоналізації. На відміну від традиційних систем, що виконують жорсткі інструкції, Alpamayo раціоналізує, як людський водій. Він може пояснити, що зробить далі і чому саме так.

Мерседес CLA, обладнаний цією технологією, офіційно запустять у США у першому кварталі цього року, а згодом — у Європі та Азії. Цей автомобіль був визнаний NCAP найбезпечнішим у світі завдяки архітектурі “подвійного рівня безпеки”, яка чергує між системою ШІ від краю до краю та традиційними протоколами безпеки, коли довіра знижується.

Робототехніка: понад людські форми

Стратегія поширюється на гуманоїдних і квадроподних роботів, усіх обладнаних міні-комп’ютером Jetson і навчених у симуляторі Isaac. Інтеграція також охоплює промислові системи, такі як інструменти від Synopsys, Cadence і Siemens.

Дженсен Хуанг пожартував під час презентації: “Найбільший робот — сама фабрика. Роботи будуть проектуватися на комп’ютерах, виготовлятися на комп’ютерах і навіть тестуватися та перевірятися віртуально на комп’ютерах перед тим, як зіткнутися з реальною гравітацією”.

Ширший контекст: 10 трильйонів доларів на модернізацію

За останнє десятиліття близько 10 трильйонів доларів інфраструктури глобальних обчислень повністю оновлюються. Але це не просто апгрейд обладнання. Це змінює парадигму у тому, як розробляється і розгортається програмне забезпечення.

Зростання відкритих моделей, таких як DeepSeek, що здивували світ своєю ефективністю інференції, спричинило хвилю інновацій. Хоча ці моделі можуть відставати на 6 місяців від найпередовіших, кожні півроку з’являється нове покоління з конкурентоспроможною здатністю.

Ця швидкість ітерацій тримає стартапи, гігантів технологій і дослідників у постійному русі. Платформа відкритих моделей Nemotron охоплює біомедицину, фізичний ШІ, агентів-розумних систем, робототехніку і автономне керування, з кількома версіями, що займають високі місця у незалежних рейтингах і широко використовуються компаніями різного масштабу.

Ефективність, що окупається: токени за вата і долар

Хоча Vera Rubin споживає удвічі більше енергії, ніж її попередники, продуктивність зростає пропорційно. Ключова метрика — пропускна здатність токенів, що генеруються за вату і за долар: зростання у 10 разів.

Для дата-центру потужністю 1 ГВт це означає, що Spectrum-X покращує пропускну здатність на 25%, що еквівалентно економії 5 мільярдів доларів на інфраструктурі. “Ця мережева система практично безкоштовна”, — каже керівник.

Вирішення KV Cache: найбільша перешкода генеративного ШІ

Настоящий головний біль галузі — “KV Cache”, робоча пам’ять, яку споживає ШІ під час довгих розмов. З розширенням моделей і розмов, доступна пам’ять HBM вичерпується.

Vera Rubin вирішує це, розгортаючи процесори BlueField-4 у кожному боксі. Кожен вузол містить 4 BlueField-4, забезпечуючи 150 ТБ розподіленої пам’яті контексту між GPU, з додатковими 16 ТБ на GPU, що підтримують пропускну здатність 200 Гбіт/с. Таким чином, тисячі GPU, розкидані по десятках боксів, працюють як єдина когерентна пам’ять.

Геополітичне значення цієї “ядерної бомби”

Презентація Vera Rubin символізує щось глибше за технічні інновації. У часи скептицизму щодо стійкості бульбашки ШІ, Дженсен Хуанг мав довести конкретними фактами, які реальні можливості відкриває ШІ: від безпечного автономного керування до промислових роботів, від синтезу білків до систем з відкритим кодом, що демократизують технології.

Раніше компанія продавала “лопати на золотій лихоманці”. Тепер вона безпосередньо бере участь у трансформації фізичних галузей — від автомобілебудування до виробництва. Ця еволюція від постачальника компонентів до оркестратора екосистем визначає фундаментальний перехід у тому, як технологічна індустрія позиціонується на наступне десятиліття.

LA-6,38%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити