امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

أحدث إصدار من Grok اسقط بعض الأرقام المثيرة للاهتمام. النسخة 4.1 السريعة مع قدرات التفكير حققت 93.5 في معيار اتصالات NYT الموسعة - قفزة قوية بمقدار 1.4 نقطة من النموذج السابق 4 Fast Reasoning الذي سجل 92.1.



في الوقت نفسه، سجل المتغير غير المنطقي 4.1 فاست 25.8، وهو أعلى بنقطة كاملة تقريبًا من سلفه 24.9. مكاسب تدريجية، لكنها تتراكم عندما تدفع حدود الأداء.

ما الذي يستحق الملاحظة هنا؟ لا يزال نموذج الاستدلال يهيمن - لا يزال هناك فجوة ضخمة بين أوضاع الاستدلال وغير الاستدلال. تلك النسبة 93.5 مقابل 25.8 تخبرك أين تهم القوة الحوسبية حقًا.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 4
  • إعادة النشر
  • مشاركة
تعليق
0/400
ThatsNotARugPullvip
· منذ 6 س
grok لا زال يقوم بتحديث البيانات، لكن هذه الفجوة غير معقولة، 93.5 مقابل 25.8 فعلاً فرق شاسع، هل يمكنك توضيح لماذا النسخة غير المعالجة تختلف كثيراً؟
شاهد النسخة الأصليةرد0
GateUser-e51e87c7vip
· منذ 6 س
93.5 يبدو جيدًا ولكنه ليس مفاجئًا كبيرًا. الفرق الكبير بين التفكير وغير التفكير هو لأن قوة الحوسبة مختلفة...
شاهد النسخة الأصليةرد0
BearHuggervip
· منذ 6 س
93.5 نقطة ماذا تعني؟ يجب علينا أن ننظر إلى الأداء الفعلي.
شاهد النسخة الأصليةرد0
GasFeeCriervip
· منذ 7 س
فارق بين نمط reasoning و non-reasoning، 93.5 مقارنة بـ 25.8... هذا الفرق غير منطقي، أشعر أن non-reasoning ليس له أي فائدة على الإطلاق
شاهد النسخة الأصليةرد0
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$3.92Kعدد الحائزين:2
    1.04%
  • القيمة السوقية:$3.62Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.61Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.51Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.49Kعدد الحائزين:1
    0.00%
  • تثبيت