Почему спрос на SRAM внезапно резко вырос? Просто посмотрите на эту волну операций.
Некоторое время назад, вскоре после того, как ведущий производитель чипов на базе ИИ публично занял позицию в технологическом гиганте, он обратил внимание и объявил о приобретении компании по инновациям в области чипов. Эта удача — всё ещё сила, и ответ вы узнаете после более внимательного рассмотрения.
В чём основная сила этой компании? В отличие от традиционных GPU, основанных на внешней памяти с высокой пропускной способностью (HBM), их процессоры LPU используют концепцию встроенной высокой ёмкости статической памяти с произвольным доступом (SRAM). Эта встроенная SRAM объемом 230 МБ может обеспечить до 80 ТБ/с пропускной способности памяти — в чём смысл этого числа? Скорость обработки данных напрямую превосходит традиционные GPU-решения.
Как он на самом деле работает? Их облачный сервис известен своей невероятной скоростью вывода. При запуске крупных моделей с открытым исходным кодом, таких как Mixtral и Llama 2, он может выводить около 500 токенов в секунду, что не является порядком по сравнению со скоростью отклика традиционных сервисов. Цены также конкурентоспособны, а стоимость миллиона жетонов довольно экономична.
Почему это так важно сейчас? Поскольку во всей сфере ИИ происходит ключевой сдвиг — потребности в выводах вот-вот полностью превысят потребности в обучении. В эту эпоху рынку действительно не хватает эффективной, недорогой и действительно масштабируемой инфраструктуры выводов благодаря инновационной архитектуре LPU. Глава компании по производству чипов ясно дал понять, что планирует интегрировать этот процессор с низкой задержкой в собственную архитектуру фабрики искусственного интеллекта с целью обслуживания более широкого спектра выводов и рабочих нагрузок в реальном времени.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
14 Лайков
Награда
14
5
Репост
Поделиться
комментарий
0/400
CodeSmellHunter
· 18ч назад
80TB/s пропускная способность? Эта цифра буквально раздавит GPU в пух и прах
Интересно, интеграция SRAM на чипе — действительно впечатляющая идея
Инференс скоро взорвется, похоже, война чипов действительно началась
Держу пари, что эта волна LPU сможет поднять флаг инференса
Посмотреть ОригиналОтветить0
MEVvictim
· 12-26 11:52
80TB/s эта цифра как только появилась, я сразу понял, кто выиграл, игра HBM скоро будет похоронена
Стоимость вывода так сильно растет, я верю в эту волну
Опять история "я купил заранее", удача или сила — решайте сами
Интеграция SRAM — гениальный ход, сразу бьет по традиционным решениям
500 токенов в секунду — я верю, но мне больше интересно, сколько эта штука сможет реально работать в производственной среде
Вот почему я недавно постоянно следил за направлением встроенной памяти, давно чувствовал эти изменения
Король гонки снова придумал что-то новое, посмотрим, насколько снизится стоимость
LPU-архитектура готова, придется менять подход к GPU
Это действительно мощный ценовой козырь, посмотрим, как это скажется на реальных внедрениях
Говорят, что вывод за пределы обучения — я слышал это уже несколько лет, действительно ли это скоро произойдет?
Посмотреть ОригиналОтветить0
AirdropDreamer
· 12-26 11:52
80TB/с пропускная способность? Теперь производителям GPU придется поудобнее устроиться, SRAM — действительно скрытая ниша.
Посмотреть ОригиналОтветить0
rugpull_ptsd
· 12-26 11:41
Количество 80 ТБ/с действительно впечатляет, и разгромить традиционные видеокарты — это не хвастовство
---
Так что в конечном итоге рассуждения вот-вот начнут развиваться, и на это следовало уделить давно
---
500 токенов/с? Эта скорость действительно немного безумная, и наконец-то кто-то серьёзно рассуждает
---
В этом и смысл: SRAM в фильме напрямую убивает монстра задержки, и эффективность просто потрясающая
---
Приобретение — хороший ход, а LPU — это способ играть в будущее рассуждений
---
Дешевая ли цена? Теперь тренировочная фракция спешит, и логика вот-вот изменится
---
Погоди, что такое 80 ТБ/с... Это быстрее всего остального
---
Наконец-то кто-то проглотил рассуждения, и набор HBM давно должен был быть упразднён
Посмотреть ОригиналОтветить0
BearMarketBro
· 12-26 11:39
80TB/s?Смех, если это действительно сможет работать, производители HBM заплачут
---
Инференсное суперобучение, теперь всё понятно, всё дело в деньгах
---
Немного жестко, сразу интегрировать SRAM, чтобы обойти узкое место HBM, давно пора было так делать
---
500 токенов/с звучит круто, а где реальные результаты тестов?
---
Это правильный путь для AI-чипов, обход внешних узких мест — вот как выигрывать
---
Производители чипов понимают, сначала держат акции, потом покупают, капитал такой капризный
---
Путь с SRAM выбран правильно, только боюсь, что последующие технологические издержки не снизятся
---
Поворот к инференсу как мейнстриму наконец-то наступил, кто первым займёт позицию, тот и выиграет
---
Цены выгодные + высокая скорость, эпоха конкуренции за эти показатели скоро изменится
---
Подождите, а заказ на HBM, похоже, скоро закроется?
Почему спрос на SRAM внезапно резко вырос? Просто посмотрите на эту волну операций.
Некоторое время назад, вскоре после того, как ведущий производитель чипов на базе ИИ публично занял позицию в технологическом гиганте, он обратил внимание и объявил о приобретении компании по инновациям в области чипов. Эта удача — всё ещё сила, и ответ вы узнаете после более внимательного рассмотрения.
В чём основная сила этой компании? В отличие от традиционных GPU, основанных на внешней памяти с высокой пропускной способностью (HBM), их процессоры LPU используют концепцию встроенной высокой ёмкости статической памяти с произвольным доступом (SRAM). Эта встроенная SRAM объемом 230 МБ может обеспечить до 80 ТБ/с пропускной способности памяти — в чём смысл этого числа? Скорость обработки данных напрямую превосходит традиционные GPU-решения.
Как он на самом деле работает? Их облачный сервис известен своей невероятной скоростью вывода. При запуске крупных моделей с открытым исходным кодом, таких как Mixtral и Llama 2, он может выводить около 500 токенов в секунду, что не является порядком по сравнению со скоростью отклика традиционных сервисов. Цены также конкурентоспособны, а стоимость миллиона жетонов довольно экономична.
Почему это так важно сейчас? Поскольку во всей сфере ИИ происходит ключевой сдвиг — потребности в выводах вот-вот полностью превысят потребности в обучении. В эту эпоху рынку действительно не хватает эффективной, недорогой и действительно масштабируемой инфраструктуры выводов благодаря инновационной архитектуре LPU. Глава компании по производству чипов ясно дал понять, что планирует интегрировать этот процессор с низкой задержкой в собственную архитектуру фабрики искусственного интеллекта с целью обслуживания более широкого спектра выводов и рабочих нагрузок в реальном времени.