Чому вимога SRAM раптово вибухнула? Просто подивіться на цю хвилю операцій.



Деякий час тому, незабаром після того, як провідний виробник AI-чипів публічно зайняв позицію в технологічному гіганті, він оголосив про придбання компанії з інновацій у сфері мікросхем. Ця удача — це все ще сила, і ви дізнаєтеся відповідь після більш детального розгляду.

Яка основна сила цієї компанії? На відміну від традиційних GPU, які базуються на зовнішній пам'яті високої пропускної здатності (HBM), їхні процесори LPU переймають конструкцію вбудованої вбудованої високоємної статичної пам'яті з довільним доступом (SRAM). Ці 230 МБ вбудованої SRAM можуть забезпечити пропускну здатність до 80 ТБ/с — яка концепція цього числа? Швидкість обробки даних безпосередньо перевищує традиційні GPU-рішення.

Як він насправді працює? Їхній хмарний сервіс відомий своєю неймовірною швидкістю висновків. Під час запуску великих відкритих моделей, таких як Mixtral і Llama 2, він може виводити близько 500 токенів на секунду, що не є порядком величини порівняно зі швидкістю відгуку традиційних сервісів. Ціни також конкурентні, а вартість за мільйон токенів досить вигідна.

Чому це так важливо зараз? Оскільки в усій сфері ШІ відбувається ключовий зсув — потреби в висновках ось-ось повністю перевищать потреби у навчанні. У цю епоху ринку справді бракує ефективної, недорогої та справді масштабованої інфраструктури виведення через інноваційну архітектуру LPU. Керівник компанії з виробництва чипів чітко дав зрозуміти, що планує інтегрувати цей процесор з низькою затримкою у власну архітектуру фабрики штучного інтелекту з метою обслуговування ширшого спектра інференцій ШІ та робочих навантажень у реальному часі.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 5
  • Репост
  • Поділіться
Прокоментувати
0/400
CodeSmellHuntervip
· 15год тому
80TB/s пропускна здатність? Ці цифри буквально розчавлюють GPU Це досить цікаво, інтеграція SRAM на чипі — справді крута ідея Обчислювальні можливості скоро вибухнуть, здається, війна чипів справді починається Вірю, що ця хвиля LPU зможе підняти прапор обчислень
Переглянути оригіналвідповісти на0
MEVvictimvip
· 12-26 11:52
80TB/s ця цифра, коли з’явилася, я одразу зрозумів, хто виграв, набір HBM цей стиль гри буде знищено Обчислювальні витрати так сильно зросли, я вірю в цю хвилю Знову історія "я купив заздалегідь", щасливий чи ні — сам вирішуй SRAM інтеграція — це геніально, безпосередньо знижує рівень традиційних рішень 500 токенів за секунду — я вірю, але мені цікаво, скільки ця річ реально може працювати у виробничих умовах Ось чому я останнім часом слідкую за напрямком на мікросхемне зберігання, вже відчував цю зміну Король змагань знову придумав новий трюк, подивимось, наскільки зможуть знизити ціну LPU архітектура вже створена, доведеться змінювати підхід до GPU Це справжній козир у ціновій війні, але потрібно побачити, як це працюватиме на практиці Обговорення перевищення інференсу над тренуванням я чув вже кілька років, чи справді це скоро станеться?
Переглянути оригіналвідповісти на0
AirdropDreamervip
· 12-26 11:52
80ТБ/с пропускна здатність? Тепер виробники GPU не зможуть сидіти склавши руки, SRAM — це справді прихована нішова галузь
Переглянути оригіналвідповісти на0
rugpull_ptsdvip
· 12-26 11:41
80TB/s цей показник дійсно вражає, переважає традиційні GPU — це не перебільшення --- Отже, все зводиться до того, що потрібно підняти рівень дедукції, вже давно потрібно було звернути на це увагу --- 500tokens/s? Така швидкість справді трохи божевільна, нарешті хтось серйозно взявся за дедукцію --- Саме ця ідея: SRAM на кристалі безпосередньо зменшує затримки, ефективність просто зашкалює --- Цей хід з поглинанням — чудовий, LPU — це справжнє майбутнє дедукції --- Ціна ще й низька? Тепер тренувальні системи будуть у паніці, дедукція справді може змінити гру --- Зачекайте, що таке 80TB/s... Це швидше за все будь-чого --- Нарешті хтось повністю зрозумів дедукцію, система HBM вже давно пора застаріти
Переглянути оригіналвідповісти на0
BearMarketBrovip
· 12-26 11:39
80TB/s?смішно, якщо це справді можливо, виробники HBM заплачуть --- Інференційне супернавчання, цю хвилю дійсно зрозуміли, все через гроші --- Трохи жорстко, прямо інтегрувати SRAM, щоб обійти HBM і не допустити затримок, давно пора так робити --- 500 токенів/с звучить круто, але де реальні результати тестів? --- Ось справжній шлях для AI-чипів, обхід зовнішніх вузьких місць — це перемога --- Виробники чипів розуміють, спочатку тримають позиції, потім купують, капітал настільки впертий --- Шлях SRAM правильний, тільки б не зросли витрати на подальше виробництво --- Перехід до інференційного домінування нарешті настав, хто перший займе позицію — той і виграє --- Ціна вигідна + швидкість висока, епоха цінових конкурентів змінюється --- Зачекайте, чи не згорить замовлення на HBM?
Переглянути оригіналвідповісти на0
  • Закріпити