لماذا فجأة انفجر طلب SRAM؟ انظر إلى هذه العملية لتفهم الأمر.



بعد فترة قصيرة من إعلان أحد كبار مصنعي شرائح الذكاء الاصطناعي عن حيازته لمخزون شركة تكنولوجيا عملاقة، أعلن مباشرة عن استحواذه على شركة مبتكرة في مجال الشرائح. هل هذا حظ أم قوة؟ بالتدقيق ستعرف الإجابة.

ما هي الميزة الأساسية لهذه الشركة؟ على عكس معتمدية وحدات معالجة الرسوميات التقليدية (GPU) على الذاكرة الخارجية عالية النطاق الترددي (HBM)، تعتمد معالجات LPU الخاصة بهم على تصميم مدمج على الشريحة لذاكرة ثابتة كبيرة السعة (SRAM). هذه الذاكرة المدمجة على الشريحة بسعة 230MB توفر عرض نطاق ذاكرة يصل إلى 80TB/s — ما مفهوم هذا الرقم؟ سرعة معالجة البيانات تتفوق بشكل مباشر على الحلول التقليدية لوحدات معالجة الرسوميات.

كيف الأداء الفعلي؟ خدماتهم السحابية مشهورة بسرعة الاستنتاج المذهلة. عند تشغيل نماذج مفتوحة المصدر مثل Mixtral وLlama 2، يمكنها إخراج حوالي 500 رمز في الثانية، وهذا يفوق بشكل كبير سرعة استجابة الخدمات التقليدية. السعر أيضا تنافسي، حيث أن تكلفة الحساب على أساس مليون رمز معقولة جدًا.

لماذا هذا الأمر مهم الآن؟ لأن مجال الذكاء الاصطناعي يمر بتحول رئيسي — حيث ستتجاوز طلبات الاستنتاج بشكل كامل طلبات التدريب. في ظل هذا السياق، من خلال بنية معمارية مبتكرة مثل LPU، يمكن توفير بنية تحتية فعالة ومنخفضة التكلفة وقابلة للتوسع الحقيقي للاستنتاج، وهو ما يحتاجه السوق فعلاً. أكد مسؤول في شركة شرائح أن خطتهم هي دمج هذه المعالجات ذات الكمون المنخفض في بنية مصنع الذكاء الاصطناعي الخاص بهم، بهدف خدمة استنتاجات الذكاء الاصطناعي الأوسع نطاقًا والأعباء الزمنية الحية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
CodeSmellHuntervip
· منذ 10 س
80TB/s عرض النطاق الترددي؟ هذه الأرقام حقًا تسحق وحدات معالجة الرسومات مثير للاهتمام، تكامل SRAM على الرقاقة هو بالفعل فكرة رائعة الاستنتاجات على وشك الانفجار، يبدو أن حرب الشرائح بدأت حقًا أراهن أن هذه الموجة من LPU ستتمكن من رفع راية الاستنتاجات
شاهد النسخة الأصليةرد0
MEVvictimvip
· 12-26 11:52
بمجرد صدور رقم 80 تيرابايت/ثانية، عرفت من فاز، وكان أسلوب لعب HBM سيصور حتى الموت تكلفة التفكير مرتفعة جدا، وأنا متفائل بشأن هذه الموجة إنها قصة أخرى عن "اشتريتها مسبقا"، الحظ لا يزال قوتي الخاصة دمج SRAM خدعة، حيث يقلل الأبعاد بشكل مباشر لمواجهة الحلول التقليدية أعتقد أن 500 رمز في الثانية، لكني أريد أن أرى كم يمكن لهذا الجهاز أن يعمل في بيئة إنتاج حقيقية لهذا السبب كنت أتابع اتجاه التخزين على الشريحة مؤخرا، وقد شممت بالفعل هذه الموجة من التغيرات ملك الأحجام لديه خدعة جديدة، انتظر لترى مدى انخفاض التكلفة تم بناء وحدة LPU، ويجب أن تتغير أيام وحدات معالجة الرسوميات ميزة قاتل السعر، تعتمد فعلا على تأثير النشر الفعلي سمعت مصطلح التفكير خارج التدريب منذ عدة سنوات، هل سيأتي حقا هذه المرة؟
شاهد النسخة الأصليةرد0
AirdropDreamervip
· 12-26 11:52
عرض نطاق 80 تيرابايت/ثانية؟ الآن يجب أن يكون مصنعو وحدات معالجة الرسومات (GPU) غير قادرين على الجلوس، فذاكرة SRAM تعتبر بالفعل مسارًا غير مرئي حقًا
شاهد النسخة الأصليةرد0
rugpull_ptsdvip
· 12-26 11:41
80TB/s هذا الرقم مذهل حقًا، يتفوق على وحدات المعالجة الرسومية التقليدية ليس مجرد كلام --- لذا في النهاية، يجب أن نركز على قسم الاستنتاج، كان من المفترض أن نولي اهتمامًا أكبر منذ زمن --- 500 توكن/ثانية؟ هذا السرعة حقًا مجنونة، أخيرًا بدأ أحدهم في العمل بجد على الاستنتاج --- هذه هي الفكرة، SRAM على الشريحة يقضي مباشرة على الوحش التأخيري، والكفاءة عالية جدًا --- الاستحواذ على هذه الخطوة ممتازة، LPU هو حقًا طريقة المستقبل في الاستنتاج --- هل التكلفة لا تزال منخفضة؟ الآن فريق التدريب في حالة توتر، الاستنتاج على وشك أن يتغير تمامًا --- انتظر، ما هو مفهوم 80TB/s... هذا أسرع من أي شيء آخر --- أخيرًا، أحدهم فهم تمامًا قسم الاستنتاج، نظام HBM كان من المفترض أن يُستبدل منذ زمن
شاهد النسخة الأصليةرد0
BearMarketBrovip
· 12-26 11:39
80TB/s؟ أضحك، إذا كان بإمكانه أن يعمل فعلاً، فإن مصنعو HBM سيبكون --- التدريب على الاستنتاج، لقد فهمت الأمر الآن، كلها مسألة أموال --- يا لها من خطوة قوية، دمج SRAM مباشرة لتجنب عنق الزجاجة في HBM، كان من المفترض أن يتم ذلك منذ زمن --- 500 توكن/ثانية يبدو رائعًا، لكن أين نتائج الأداء الحقيقي؟ --- هذه هي الطريق الصحيح لشريحة الذكاء الاصطناعي، تجاوز العقبات الخارجية هو الفوز --- صانعو الشرائح فهموا الأمر جيدًا، يبدؤون بالاحتفاظ بالمخزون ثم يجرون عمليات الاستحواذ، رأس المال هكذا يتصرف بحرية --- طريق SRAM كان صحيحًا، فقط الخوف من عدم القدرة على خفض تكاليف العمليات لاحقًا --- نقطة التحول التي جعلت الاستنتاجات تصبح السائدة أخيرًا قد حانت، من يسبق يربح --- السعر معقول + السرعة عالية، عصر المقارنة على وشك أن يتغير --- انتظر، هل ستتوقف طلبات HBM؟
شاهد النسخة الأصليةرد0
  • تثبيت