ARC-AGI-3 يعلن عن أكبر اختبار بشري في التاريخ: تم التغلب على جميع المستويات بواسطة البشر، والذكاء الاصطناعي لا يزال لديه فجوات

robot
إنشاء الملخص قيد التقدم

أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察Beating، أعلنت مؤسسة ARC Prize عن مجموعة بيانات أداء الإنسان لـ ARC-AGI-3، وهي أكبر دراسة اختبار بشري حتى الآن ضمن سلسلة ARC-AGI، بمشاركة 458 شخصًا. تحتوي مجموعة البيانات على 342 سجلًا كاملًا لتشغيل الإنسان، تغطي 25 بيئة عامة، وتم فتحها جميعًا للمصدر. يتضمن ARC-AGI-3 135 بيئة استنتاج تجريدية، حيث لا يتلقى المختبرون أي شرح للعبة، ويجب عليهم استكشاف القواعد، واستنتاجها، ووضع استراتيجيات بأنفسهم. تُجرى الاختبارات في مركز اختبار حضري في سان فرانسيسكو، وتستمر كل جلسة 90 دقيقة، ويحصل المشاركون على حوالي 130 دولارًا كأجر أساسي بالإضافة إلى 5 دولارات عن كل بيئة يتم تجاوزها. جميع الاختبارات تتم تحت شرط “المرور الأول”، أي أن كل شخص يشاهد مرة واحدة ويحاول مرة واحدة فقط، ويقيس ذلك قدرة التعلم والتكيف عند مواجهة مشكلات جديدة. يحصل الإنسان والذكاء الاصطناعي على نفس المعلومات تمامًا، دون أي فرق في المعلومات. الاستنتاج الرئيسي: تم تجاوز جميع بيئات ARC-AGI-3 من قبل البشر، حيث أكمل كل بيئة على الأقل اثنين من المشاركين المستقلين، ومعظم البيئات تم تجاوزها من قبل أكثر من خمسة أشخاص. تقول مؤسسة ARC Prize: “لم نحقق بعد الذكاء الاصطناعي العام، وهذه البيانات هي الدليل”. منذ معاينة ARC-AGI-3، تلقت البيئات العامة ما يقرب من مليون تقييم من الذكاء الاصطناعي. استنادًا إلى هذه البيانات، أعلنت المؤسسة عن تعديلين في قواعد التقييم: الأول هو تغيير معيار الأداء البشري من “أفضل لاعب ثاني” إلى “متوسط اللاعب”، لتقليل تأثير الحظ على النتيجة؛ والثاني هو رفع الحد الأقصى لنقاط كل مهمة من 100% إلى 115%، لتجنب أن تؤثر أداء ضعيف في مهمة واحدة على الأداء الكلي. الأثر الصافي للتعديلين هو ارتفاع درجات الإنسان والذكاء الاصطناعي بشكل طفيف حوالي 0.5 نقطة مئوية. (المصدر: BlockBeats)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت