التحدي الذي لا يمكن تجاهله: تباطؤ قانون مور وارتفاع الطلب على الذكاء الاصطناعي
تواجه الصناعة مفارقة محرجة: ففي حين يتباطأ معدل تحسين السيليكون، تتطلب نماذج الذكاء الاصطناعي زيادات أداء أُسّية كل عام. بالنسبة لمركز بيانات بقدرة 1 جيجاوات وتكلفة 50 مليار دولار، يمكن أن تعني الفروقات بين بنية قديمة وجديدة مضاعفة القدرة على توليد الإيرادات مباشرة.
جنسن هوانج، الرئيس التنفيذي لأحد رواد التكنولوجيا العالميين، يعترف بصراحة بهذا المأزق: لم تعد الطرق التقليدية للتحسين قادرة على مواكبة الوتيرة. لذلك، بدلاً من استبدال 1 أو 2 من الرقائق في كل جيل كما كان معتادًا، راهنوا هذه المرة على إعادة تصميم شاملة لستة مكونات رئيسية لمنصة الحوسبة فيرا روبين، التي دخلت الآن مرحلة الإنتاج الضخم.
فيرا روبين: البنية التي تعيد كتابة قواعد اللعبة
البطل الحقيقي في هذا الدورة ليس بطاقة رسومية تقليدية، بل نظام معالجة كامل. فيرا روبين، التي سُميت تيمناً بعالمة الفلك التي اكتشفت المادة المظلمة، تمثل تحولاً في التفكير: الابتكار بشكل متزامن على جميع مستويات المنصة.
الركائز الست لهذه البنية هي:
Vera CPU توفر الذكاء والتنسيق. مزودة بـ 88 نواة أ Olympus مخصصة، تدعم 176 خيطًا متزامنًا بفضل تقنية المعالجة المتعددة الخيوط الفضائية. عرض النطاق الترددي NVLink C2C بمقدار 1.8 تيرابايت/ثانية وذاكرة النظام بسعة 1.5 تيرابايت (ثلاثة أضعاف مقارنة بالجيل السابق) يضمنان عدم وجود عنق زجاجة في العمليات الأساسية. مع 227 مليار ترانزستور، تدمج القدرة على المعالجة اللازمة لتنسيق عمليات ضخمة.
Rubin GPU، القلب الحاسوبي، تصل إلى 50 بيلافلوبس من قوة الاستنتاج بدقة منخفضة، وخمسة أضعاف بنية Blackwell. مع 336 مليار ترانزستور، تدمج الجيل الثالث من محركات Transformer التي تعدل الدقة ديناميكياً وفقًا لاحتياجات النموذج.
بطاقة الشبكة ConnectX-9 تقدم اتصالاً فائق السرعة مع إيثرنت بسرعة 800 جيجابت/ثانية يعتمد على تقنية PAM4 بسرعة 200G. تشمل RDMA قابلة للبرمجة ومعجل مسار البيانات، بالإضافة إلى شهادات الأمان CNSA و FIPS مع 23 مليار ترانزستور.
BlueField-4 DPU يظهر كمُعالج متخصص لتخزين الذكاء الاصطناعي من الجيل الجديد. بسعة 800 جيجابت/ثانية من SmartNIC، يدمج CPU Grace ذو 64 نواة مع ConnectX-9، ويحتوي على 126 مليار ترانزستور مخصص لهذه الوظيفة الحرجة.
رقاقة التبديل NVLink-6 هي منسق الشبكة الداخلية. يمكنها ربط 18 عقدة حوسبة وتنسيق حتى 72 وحدة معالجة رسومات Rubin تعمل كنظام موحد متماسك. مع بنية NVLink 6، تصل كل وحدة معالجة رسومات إلى عرض نطاق ترددي 3.6 تيرابايت/ثانية جميع إلى جميع، مما يتيح اتصالاً جماعياً فائق السرعة داخل الشبكة.
وأخيرًا، يتولى المبدل البصري Spectrum-6 إدارة 512 قناة بسرعة 200 جيجابت لكل منها لنقل البيانات التي تتجاوز سرعات التقليدية. مصنوع باستخدام تقنية السيليكون الضوئي المدمج عبر TSMC COOP، ويحتوي على 352 مليار ترانزستور مخصص للربط البصري المعبأ بشكل مشترك.
أرقام تتحدث: تحسينات أداء غير مسبوقة
النظام NVL72 الناتج عن هذا التكامل العميق يضع معايير جديدة. في مهام الاستنتاج بدقة منخفضة، يصل إلى 3.6 إكسافلوبس، أي خمسة أضعاف الجيل السابق. للتدريب، يصل إلى 2.5 إكسافلوبس، بزيادة 3.5 مرة.
الذاكرة المتاحة ثلاثية، حيث تصل إلى 54 تيرابايت من LPDDR5X في النظام الرئيسي مقابل 20.7 تيرابايت من HBM عالية النطاق الترددي. عرض النطاق الترددي لـ HBM4 يصل إلى 1.6 بيتابايت/ثانية (أكثر بـ 2.8 مرة)، بينما يصل عرض النطاق Scale-Up إلى 260 تيرابايت/ثانية، وهو ضعف الجيل السابق.
الأهم من ذلك: تم تحقيق هذه الزيادات في الأداء مع زيادة قدرها 1.7 مرة فقط في عدد الترانزستورات (2.2 تريليون بشكل إجمالي)، مما يبرهن على أن الابتكار في الهندسة المعمارية مهم بقدر كثافة السيليكون.
من الرقمي إلى الفيزيائي: الحدود القادمة
على الرغم من أن الأرقام مدهشة، إلا أن تأثيرها الحقيقي يكمن في التطبيقات. يتطلب الذكاء الاصطناعي الآن الانتقال من العالم الرقمي إلى الفيزيائي. لهذا، هناك ثلاثة أنواع من الحوسبة المدمجة ضرورية:
الحاسوب التدريبي المبني على بنى مثل GB300 التي تولد النماذج الأساسية. والحاسوب الاستنتاجي، “المخ” الذي يعمل في الروبوتات أو المركبات الذاتية القيادة في الوقت الحقيقي. والحاسوب المحاكاتي، بما في ذلك منصات مثل Omniverse و Cosmos، التي توفر بيئات افتراضية يتعلم فيها الذكاء الاصطناعي ردود الفعل الفيزيائية قبل العمل في العالم الحقيقي.
ألبامايو: القيادة الذاتية التي تتفكر
استنادًا إلى هذه البنية الثلاثية، يظهر ألبامايو، أول نظام قيادة ذاتية بقدرات تفكير حقيقي. على عكس الأنظمة التقليدية التي تنفذ تعليمات صارمة، يتفكر ألبامايو كقائد بشري. يمكنه شرح ما سيفعله بعد ذلك ولماذا يتخذ هذا القرار.
سيتم إطلاق سيارة مرسيدس CLA المزودة بهذه التقنية رسميًا في الولايات المتحدة في الربع الأول من هذا العام، ثم تتوسع إلى أوروبا وآسيا. وقد صنفتها NCAP كأكثر السيارات أمانًا في العالم، بفضل بنية “طبقتي الأمان المزدوجة” التي تتناوب بين نظام الذكاء الاصطناعي من طرف إلى طرف وبروتوكولات الأمان التقليدية عندما تنقص الثقة.
الروبوتات: ما وراء الإنسان الآلي
تمتد الاستراتيجية إلى الروبوتات الإنسان الآلي والرباعية الأرجل، جميعها مزودة بالحاسوب الصغير Jetson ومدربة على المحاكي Isaac. كما تشمل التكامل أنظمة صناعية مثل أدوات من Synopsys و Cadence و Siemens.
سخر جنسن هوانج خلال العرض: “أكبر روبوت هو المصنع نفسه. ستُصمم الروبوتات على الحواسيب، وتُصنع على الحواسيب، وحتى تُختبر وتُتحقق منها افتراضيًا على الحواسيب قبل مواجهة الجاذبية الحقيقية”.
السياق الأوسع: 10 تريليون دولار في التحديث
على مدى العقد الماضي، يتم تحديث حوالي 10 تريليون دولار من البنية التحتية الحاسوبية العالمية بشكل كامل. لكن الأمر ليس مجرد ترقية للأجهزة. إنه تحول في نموذج تطوير ونشر البرمجيات.
صعود النماذج المفتوحة، ممثلة بأنظمة مثل DeepSeek التي فاجأت العالم بكفاءتها في الاستنتاج، أدى إلى موجة من الابتكار. على الرغم من أن هذه النماذج قد تتخلف عن الأحدث بـ 6 أشهر، إلا أنه في كل نصف عام تظهر جيل جديد بقدرات تنافسية.
هذه الوتيرة من التكرار تبقي الشركات الناشئة، والشركات التقنية العملاقة، والباحثين في حركة مستمرة. منصة النماذج مفتوحة المصدر Nemotron تغطي مجالات الطب الحيوي، والذكاء الاصطناعي الفيزيائي، والوكلاء الأذكياء، والروبوتات، والقيادة الذاتية، مع إصدارات متعددة تتصدر التصنيفات المستقلة وتُعتمد على نطاق واسع من قبل الشركات بمختلف الأحجام.
الكفاءة التي تعوض: الرموز مقابل الواط والدولار
على الرغم من أن فيرا روبين تستهلك ضعف طاقة أسلافها، إلا أن الأداء يتضاعف بشكل غير متناسب. المقياس الحاسم هو معدل إنتاج الرموز لكل واط ولكل دولار: زيادة بمقدار 10 مرات.
لمركز بيانات بقدرة 1 جيجاوات، يعني ذلك أن Spectrum-X يحسن معدل الإنتاج بنسبة 25%، مما يعادل توفير 5 مليارات دولار في البنية التحتية. قال المسؤول التنفيذي: “هذا النظام الشبكي يكاد يكون مجانيًا”.
حل مشكلة ذاكرة التخزين المؤقت KV: أكبر عائق في الذكاء الاصطناعي التوليدي
المشكلة الحقيقية في الصناعة هي “ذاكرة التخزين المؤقت KV”، ذاكرة العمل التي يستهلكها الذكاء الاصطناعي خلال المحادثات الطويلة. مع نمو النماذج وتوسع المحادثات، تنفد ذاكرة HBM المتاحة.
تحل فيرا روبين هذه المشكلة عبر نشر معالجات BlueField-4 داخل كل إطار. كل عقدة تحتوي على 4 BlueField-4، موفرة 150 تيرابايت من ذاكرة السياق الموزعة بين وحدات المعالجة الرسومية، مع 16 تيرابايت إضافية لكل وحدة معالجة رسومية مع عرض نطاق ترددي 200 جيجابت/ثانية. وهكذا، تعمل آلاف وحدات المعالجة الرسومية الموزعة عبر عشرات الإطارات كوحدة ذاكرة موحدة ومتسقة.
المعنى الجيوسياسي لهذا “القنبلة النووية”
تمثل عرض فيرا روبين شيئًا أعمق من الابتكار التقني. في عصر الشك حول استدامة فقاعة الذكاء الاصطناعي، كان على جنسن هوانج أن يثبت بأفعال ملموسة القدرات الحقيقية التي يتيحها الذكاء الاصطناعي: من القيادة الذاتية الآمنة إلى الروبوتات الصناعية، ومن تركيب البروتينات إلى أنظمة المصدر المفتوح التي ت democratize التكنولوجيا.
قبل سنوات، كانت الشركة تبيع “المجارف في حمى الذهب”. الآن، تشارك مباشرة في تحويل الصناعات المادية، من السيارات إلى التصنيع. هذا التحول من مزود مكونات إلى منسق للأنظمة البيئية يمثل انتقالًا جوهريًا في كيفية تموضع صناعة التكنولوجيا للمستقبل.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
ثورة الحوسبة الجماعية: كيف تعيد "القنبلة النووية" لفيرا روبين تعريف مسيرة الذكاء الاصطناعي
التحدي الذي لا يمكن تجاهله: تباطؤ قانون مور وارتفاع الطلب على الذكاء الاصطناعي
تواجه الصناعة مفارقة محرجة: ففي حين يتباطأ معدل تحسين السيليكون، تتطلب نماذج الذكاء الاصطناعي زيادات أداء أُسّية كل عام. بالنسبة لمركز بيانات بقدرة 1 جيجاوات وتكلفة 50 مليار دولار، يمكن أن تعني الفروقات بين بنية قديمة وجديدة مضاعفة القدرة على توليد الإيرادات مباشرة.
جنسن هوانج، الرئيس التنفيذي لأحد رواد التكنولوجيا العالميين، يعترف بصراحة بهذا المأزق: لم تعد الطرق التقليدية للتحسين قادرة على مواكبة الوتيرة. لذلك، بدلاً من استبدال 1 أو 2 من الرقائق في كل جيل كما كان معتادًا، راهنوا هذه المرة على إعادة تصميم شاملة لستة مكونات رئيسية لمنصة الحوسبة فيرا روبين، التي دخلت الآن مرحلة الإنتاج الضخم.
فيرا روبين: البنية التي تعيد كتابة قواعد اللعبة
البطل الحقيقي في هذا الدورة ليس بطاقة رسومية تقليدية، بل نظام معالجة كامل. فيرا روبين، التي سُميت تيمناً بعالمة الفلك التي اكتشفت المادة المظلمة، تمثل تحولاً في التفكير: الابتكار بشكل متزامن على جميع مستويات المنصة.
الركائز الست لهذه البنية هي:
Vera CPU توفر الذكاء والتنسيق. مزودة بـ 88 نواة أ Olympus مخصصة، تدعم 176 خيطًا متزامنًا بفضل تقنية المعالجة المتعددة الخيوط الفضائية. عرض النطاق الترددي NVLink C2C بمقدار 1.8 تيرابايت/ثانية وذاكرة النظام بسعة 1.5 تيرابايت (ثلاثة أضعاف مقارنة بالجيل السابق) يضمنان عدم وجود عنق زجاجة في العمليات الأساسية. مع 227 مليار ترانزستور، تدمج القدرة على المعالجة اللازمة لتنسيق عمليات ضخمة.
Rubin GPU، القلب الحاسوبي، تصل إلى 50 بيلافلوبس من قوة الاستنتاج بدقة منخفضة، وخمسة أضعاف بنية Blackwell. مع 336 مليار ترانزستور، تدمج الجيل الثالث من محركات Transformer التي تعدل الدقة ديناميكياً وفقًا لاحتياجات النموذج.
بطاقة الشبكة ConnectX-9 تقدم اتصالاً فائق السرعة مع إيثرنت بسرعة 800 جيجابت/ثانية يعتمد على تقنية PAM4 بسرعة 200G. تشمل RDMA قابلة للبرمجة ومعجل مسار البيانات، بالإضافة إلى شهادات الأمان CNSA و FIPS مع 23 مليار ترانزستور.
BlueField-4 DPU يظهر كمُعالج متخصص لتخزين الذكاء الاصطناعي من الجيل الجديد. بسعة 800 جيجابت/ثانية من SmartNIC، يدمج CPU Grace ذو 64 نواة مع ConnectX-9، ويحتوي على 126 مليار ترانزستور مخصص لهذه الوظيفة الحرجة.
رقاقة التبديل NVLink-6 هي منسق الشبكة الداخلية. يمكنها ربط 18 عقدة حوسبة وتنسيق حتى 72 وحدة معالجة رسومات Rubin تعمل كنظام موحد متماسك. مع بنية NVLink 6، تصل كل وحدة معالجة رسومات إلى عرض نطاق ترددي 3.6 تيرابايت/ثانية جميع إلى جميع، مما يتيح اتصالاً جماعياً فائق السرعة داخل الشبكة.
وأخيرًا، يتولى المبدل البصري Spectrum-6 إدارة 512 قناة بسرعة 200 جيجابت لكل منها لنقل البيانات التي تتجاوز سرعات التقليدية. مصنوع باستخدام تقنية السيليكون الضوئي المدمج عبر TSMC COOP، ويحتوي على 352 مليار ترانزستور مخصص للربط البصري المعبأ بشكل مشترك.
أرقام تتحدث: تحسينات أداء غير مسبوقة
النظام NVL72 الناتج عن هذا التكامل العميق يضع معايير جديدة. في مهام الاستنتاج بدقة منخفضة، يصل إلى 3.6 إكسافلوبس، أي خمسة أضعاف الجيل السابق. للتدريب، يصل إلى 2.5 إكسافلوبس، بزيادة 3.5 مرة.
الذاكرة المتاحة ثلاثية، حيث تصل إلى 54 تيرابايت من LPDDR5X في النظام الرئيسي مقابل 20.7 تيرابايت من HBM عالية النطاق الترددي. عرض النطاق الترددي لـ HBM4 يصل إلى 1.6 بيتابايت/ثانية (أكثر بـ 2.8 مرة)، بينما يصل عرض النطاق Scale-Up إلى 260 تيرابايت/ثانية، وهو ضعف الجيل السابق.
الأهم من ذلك: تم تحقيق هذه الزيادات في الأداء مع زيادة قدرها 1.7 مرة فقط في عدد الترانزستورات (2.2 تريليون بشكل إجمالي)، مما يبرهن على أن الابتكار في الهندسة المعمارية مهم بقدر كثافة السيليكون.
من الرقمي إلى الفيزيائي: الحدود القادمة
على الرغم من أن الأرقام مدهشة، إلا أن تأثيرها الحقيقي يكمن في التطبيقات. يتطلب الذكاء الاصطناعي الآن الانتقال من العالم الرقمي إلى الفيزيائي. لهذا، هناك ثلاثة أنواع من الحوسبة المدمجة ضرورية:
الحاسوب التدريبي المبني على بنى مثل GB300 التي تولد النماذج الأساسية. والحاسوب الاستنتاجي، “المخ” الذي يعمل في الروبوتات أو المركبات الذاتية القيادة في الوقت الحقيقي. والحاسوب المحاكاتي، بما في ذلك منصات مثل Omniverse و Cosmos، التي توفر بيئات افتراضية يتعلم فيها الذكاء الاصطناعي ردود الفعل الفيزيائية قبل العمل في العالم الحقيقي.
ألبامايو: القيادة الذاتية التي تتفكر
استنادًا إلى هذه البنية الثلاثية، يظهر ألبامايو، أول نظام قيادة ذاتية بقدرات تفكير حقيقي. على عكس الأنظمة التقليدية التي تنفذ تعليمات صارمة، يتفكر ألبامايو كقائد بشري. يمكنه شرح ما سيفعله بعد ذلك ولماذا يتخذ هذا القرار.
سيتم إطلاق سيارة مرسيدس CLA المزودة بهذه التقنية رسميًا في الولايات المتحدة في الربع الأول من هذا العام، ثم تتوسع إلى أوروبا وآسيا. وقد صنفتها NCAP كأكثر السيارات أمانًا في العالم، بفضل بنية “طبقتي الأمان المزدوجة” التي تتناوب بين نظام الذكاء الاصطناعي من طرف إلى طرف وبروتوكولات الأمان التقليدية عندما تنقص الثقة.
الروبوتات: ما وراء الإنسان الآلي
تمتد الاستراتيجية إلى الروبوتات الإنسان الآلي والرباعية الأرجل، جميعها مزودة بالحاسوب الصغير Jetson ومدربة على المحاكي Isaac. كما تشمل التكامل أنظمة صناعية مثل أدوات من Synopsys و Cadence و Siemens.
سخر جنسن هوانج خلال العرض: “أكبر روبوت هو المصنع نفسه. ستُصمم الروبوتات على الحواسيب، وتُصنع على الحواسيب، وحتى تُختبر وتُتحقق منها افتراضيًا على الحواسيب قبل مواجهة الجاذبية الحقيقية”.
السياق الأوسع: 10 تريليون دولار في التحديث
على مدى العقد الماضي، يتم تحديث حوالي 10 تريليون دولار من البنية التحتية الحاسوبية العالمية بشكل كامل. لكن الأمر ليس مجرد ترقية للأجهزة. إنه تحول في نموذج تطوير ونشر البرمجيات.
صعود النماذج المفتوحة، ممثلة بأنظمة مثل DeepSeek التي فاجأت العالم بكفاءتها في الاستنتاج، أدى إلى موجة من الابتكار. على الرغم من أن هذه النماذج قد تتخلف عن الأحدث بـ 6 أشهر، إلا أنه في كل نصف عام تظهر جيل جديد بقدرات تنافسية.
هذه الوتيرة من التكرار تبقي الشركات الناشئة، والشركات التقنية العملاقة، والباحثين في حركة مستمرة. منصة النماذج مفتوحة المصدر Nemotron تغطي مجالات الطب الحيوي، والذكاء الاصطناعي الفيزيائي، والوكلاء الأذكياء، والروبوتات، والقيادة الذاتية، مع إصدارات متعددة تتصدر التصنيفات المستقلة وتُعتمد على نطاق واسع من قبل الشركات بمختلف الأحجام.
الكفاءة التي تعوض: الرموز مقابل الواط والدولار
على الرغم من أن فيرا روبين تستهلك ضعف طاقة أسلافها، إلا أن الأداء يتضاعف بشكل غير متناسب. المقياس الحاسم هو معدل إنتاج الرموز لكل واط ولكل دولار: زيادة بمقدار 10 مرات.
لمركز بيانات بقدرة 1 جيجاوات، يعني ذلك أن Spectrum-X يحسن معدل الإنتاج بنسبة 25%، مما يعادل توفير 5 مليارات دولار في البنية التحتية. قال المسؤول التنفيذي: “هذا النظام الشبكي يكاد يكون مجانيًا”.
حل مشكلة ذاكرة التخزين المؤقت KV: أكبر عائق في الذكاء الاصطناعي التوليدي
المشكلة الحقيقية في الصناعة هي “ذاكرة التخزين المؤقت KV”، ذاكرة العمل التي يستهلكها الذكاء الاصطناعي خلال المحادثات الطويلة. مع نمو النماذج وتوسع المحادثات، تنفد ذاكرة HBM المتاحة.
تحل فيرا روبين هذه المشكلة عبر نشر معالجات BlueField-4 داخل كل إطار. كل عقدة تحتوي على 4 BlueField-4، موفرة 150 تيرابايت من ذاكرة السياق الموزعة بين وحدات المعالجة الرسومية، مع 16 تيرابايت إضافية لكل وحدة معالجة رسومية مع عرض نطاق ترددي 200 جيجابت/ثانية. وهكذا، تعمل آلاف وحدات المعالجة الرسومية الموزعة عبر عشرات الإطارات كوحدة ذاكرة موحدة ومتسقة.
المعنى الجيوسياسي لهذا “القنبلة النووية”
تمثل عرض فيرا روبين شيئًا أعمق من الابتكار التقني. في عصر الشك حول استدامة فقاعة الذكاء الاصطناعي، كان على جنسن هوانج أن يثبت بأفعال ملموسة القدرات الحقيقية التي يتيحها الذكاء الاصطناعي: من القيادة الذاتية الآمنة إلى الروبوتات الصناعية، ومن تركيب البروتينات إلى أنظمة المصدر المفتوح التي ت democratize التكنولوجيا.
قبل سنوات، كانت الشركة تبيع “المجارف في حمى الذهب”. الآن، تشارك مباشرة في تحويل الصناعات المادية، من السيارات إلى التصنيع. هذا التحول من مزود مكونات إلى منسق للأنظمة البيئية يمثل انتقالًا جوهريًا في كيفية تموضع صناعة التكنولوجيا للمستقبل.