SRAM需求緣何突然爆發?看看這波操作就明白了。



前段時間某頭部AI晶片廠商公開持倉某科技巨頭後不久,轉身就宣布收購一家晶片創新公司。這運氣還是實力,細品一下就知道答案了。

這家公司的核心優勢在哪兒呢?與傳統GPU依賴外部高帶寬內存(HBM)不同,他們的LPU處理器採用了片上集成大容量靜態隨機存取存儲器(SRAM)的設計思路。這230MB的片上SRAM能提供高達80TB/s的內存帶寬——這個數字什麼概念?數據處理速度直接碾壓傳統GPU方案。

實際表現怎麼樣?他們的雲服務因推理速度驚人而出名。跑Mixtral、Llama 2這類開源大模型時,每秒能輸出約500個tokens,這比起傳統服務的響應速度,壓根不是一個量級。價格也有競爭力,按百萬tokens計費的成本相當划算。

為什麼這事兒現在這麼重要?因為整個AI領域正在發生一個關鍵轉變——推理需求即將全面超越訓練需求。在這個時代背景下,通過LPU這種創新架構,提供一個高效、低成本且真正能規模化的推理基礎設施,這才是市場真正缺的。某晶片公司負責人明確表態,計劃把這套低延遲處理器集成到自家AI工廠架構中,目標是為更廣泛的AI推理和實時工作負載服務。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 轉發
  • 分享
留言
0/400
CodeSmellHuntervip
· 2025-12-27 04:32
80TB/s帶寬?這數字硬是把GPU碾成渣啊 有點意思,SRAM片上集成這思路確實秀 推理要爆發了,看来芯片戰爭才真正開始 賭這波LPU能扛起推理的大旗
查看原文回復0
MEV牺牲品vip
· 2025-12-26 11:52
80TB/s這數字一出來我就知道誰贏了,HBM這套玩法要被拍死了 推理成本這麼卷,我看好這波 又是一個"我提前買了"的故事呗,運氣還是實力自己品 SRAM集成這招妙啊,直接降維打擊傳統方案 每秒500tokens我信,但我更想看這玩意兒真實生產環境能跑多久 這就是為什麼我最近一直在關注片上存儲方向,早就嗅到這波變化了 卷王又出新花樣了,等等看成本能壓到多低 LPU架構起來了,GPU的日子得改改了 價格殺手鐧啊,還真得看實際部署效果咋樣 推理超越訓練這說法我聽過好幾年了,這回真的要來了?
查看原文回復0
大空投不是梦vip
· 2025-12-26 11:52
80TB/s帶寬?這下GPU廠商要坐不住了,SRAM這波確實隱形賽道啊
查看原文回復0
rugpull_ptsdvip
· 2025-12-26 11:41
80TB/s這個數字真的絕了,碾壓傳統GPU不是吹牛 --- 所以說到底還是推理這塊要起飛啊,早該重視了 --- 500tokens/s?這速度屬實有點瘋,終於有人認真做推理了 --- 就是這個思路啊,片上SRAM直接幹掉延遲怪獸,效率爆表 --- 收購這手棋下得妙,LPU才是未來推理的玩法吧 --- 成本還便宜?這下訓練派要急了,推理真要翻身了 --- 等等,80TB/s是什麼概念...這比啥都快啊 --- 終於有人把推理這塊吃透了,HBM那套早該淘汰
查看原文回復0
BearMarketBrovip
· 2025-12-26 11:39
80TB/s?笑死,這要是真能跑出來,HBM廠商得哭了 --- 推理超訓練,這波確實看明白了,都是錢的問題啦 --- 有點狠啊,直接集成SRAM避開HBM卡脖子,早該這麼玩 --- 500 tokens/s聽起來牛,但真實跑分數據在哪呢? --- 這才是AI芯片的正道,繞過外部瓶頸才能贏 --- 芯片廠玩得明白,先持倉再收購,資本就這麼任性 --- SRAM這條路走對了,就怕後續工藝成本壓不下來啊 --- 推理成為主流的拐點終於來了,誰搶佔誰就贏 --- 價格划算+速度快,這對標的時代要變天 --- 等等,那HBM的單子是不是要涼了?
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)