Почему спрос на SRAM внезапно резко вырос? Просто посмотрите на эту волну операций.



Некоторое время назад, вскоре после того, как ведущий производитель чипов на базе ИИ публично занял позицию в технологическом гиганте, он обратил внимание и объявил о приобретении компании по инновациям в области чипов. Эта удача — всё ещё сила, и ответ вы узнаете после более внимательного рассмотрения.

В чём основная сила этой компании? В отличие от традиционных GPU, основанных на внешней памяти с высокой пропускной способностью (HBM), их процессоры LPU используют концепцию встроенной высокой ёмкости статической памяти с произвольным доступом (SRAM). Эта встроенная SRAM объемом 230 МБ может обеспечить до 80 ТБ/с пропускной способности памяти — в чём смысл этого числа? Скорость обработки данных напрямую превосходит традиционные GPU-решения.

Как он на самом деле работает? Их облачный сервис известен своей невероятной скоростью вывода. При запуске крупных моделей с открытым исходным кодом, таких как Mixtral и Llama 2, он может выводить около 500 токенов в секунду, что не является порядком по сравнению со скоростью отклика традиционных сервисов. Цены также конкурентоспособны, а стоимость миллиона жетонов довольно экономична.

Почему это так важно сейчас? Поскольку во всей сфере ИИ происходит ключевой сдвиг — потребности в выводах вот-вот полностью превысят потребности в обучении. В эту эпоху рынку действительно не хватает эффективной, недорогой и действительно масштабируемой инфраструктуры выводов благодаря инновационной архитектуре LPU. Глава компании по производству чипов ясно дал понять, что планирует интегрировать этот процессор с низкой задержкой в собственную архитектуру фабрики искусственного интеллекта с целью обслуживания более широкого спектра выводов и рабочих нагрузок в реальном времени.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
CodeSmellHuntervip
· 18ч назад
80TB/s пропускная способность? Эта цифра буквально раздавит GPU в пух и прах Интересно, интеграция SRAM на чипе — действительно впечатляющая идея Инференс скоро взорвется, похоже, война чипов действительно началась Держу пари, что эта волна LPU сможет поднять флаг инференса
Посмотреть ОригиналОтветить0
MEVvictimvip
· 12-26 11:52
80TB/s эта цифра как только появилась, я сразу понял, кто выиграл, игра HBM скоро будет похоронена Стоимость вывода так сильно растет, я верю в эту волну Опять история "я купил заранее", удача или сила — решайте сами Интеграция SRAM — гениальный ход, сразу бьет по традиционным решениям 500 токенов в секунду — я верю, но мне больше интересно, сколько эта штука сможет реально работать в производственной среде Вот почему я недавно постоянно следил за направлением встроенной памяти, давно чувствовал эти изменения Король гонки снова придумал что-то новое, посмотрим, насколько снизится стоимость LPU-архитектура готова, придется менять подход к GPU Это действительно мощный ценовой козырь, посмотрим, как это скажется на реальных внедрениях Говорят, что вывод за пределы обучения — я слышал это уже несколько лет, действительно ли это скоро произойдет?
Посмотреть ОригиналОтветить0
AirdropDreamervip
· 12-26 11:52
80TB/с пропускная способность? Теперь производителям GPU придется поудобнее устроиться, SRAM — действительно скрытая ниша.
Посмотреть ОригиналОтветить0
rugpull_ptsdvip
· 12-26 11:41
Количество 80 ТБ/с действительно впечатляет, и разгромить традиционные видеокарты — это не хвастовство --- Так что в конечном итоге рассуждения вот-вот начнут развиваться, и на это следовало уделить давно --- 500 токенов/с? Эта скорость действительно немного безумная, и наконец-то кто-то серьёзно рассуждает --- В этом и смысл: SRAM в фильме напрямую убивает монстра задержки, и эффективность просто потрясающая --- Приобретение — хороший ход, а LPU — это способ играть в будущее рассуждений --- Дешевая ли цена? Теперь тренировочная фракция спешит, и логика вот-вот изменится --- Погоди, что такое 80 ТБ/с... Это быстрее всего остального --- Наконец-то кто-то проглотил рассуждения, и набор HBM давно должен был быть упразднён
Посмотреть ОригиналОтветить0
BearMarketBrovip
· 12-26 11:39
80TB/s?Смех, если это действительно сможет работать, производители HBM заплачут --- Инференсное суперобучение, теперь всё понятно, всё дело в деньгах --- Немного жестко, сразу интегрировать SRAM, чтобы обойти узкое место HBM, давно пора было так делать --- 500 токенов/с звучит круто, а где реальные результаты тестов? --- Это правильный путь для AI-чипов, обход внешних узких мест — вот как выигрывать --- Производители чипов понимают, сначала держат акции, потом покупают, капитал такой капризный --- Путь с SRAM выбран правильно, только боюсь, что последующие технологические издержки не снизятся --- Поворот к инференсу как мейнстриму наконец-то наступил, кто первым займёт позицию, тот и выиграет --- Цены выгодные + высокая скорость, эпоха конкуренции за эти показатели скоро изменится --- Подождите, а заказ на HBM, похоже, скоро закроется?
Посмотреть ОригиналОтветить0
  • Закрепить