مؤسسة جائزة ARC أعلنت عن مجموعة بيانات أداء الإنسان لـ ARC-AGI-3، والتي تشمل نتائج اختبار 458 مشاركًا في 135 بيئة استنتاج مجردة بدون شرح طريقة. جميع البيئات تم اجتيازها من قبل البشر، ولم يتم بعد تحقيق الذكاء الاصطناعي العام. في الوقت نفسه، قامت المؤسسة بتعديل قواعد التقييم لرفع درجات الإنسان والذكاء الاصطناعي بشكل طفيف.

MeNews

2026-04-15 07:00:23

إنشاء الملخص قيد التقدم

أخبار ME، في 15 أبريل (بتوقيت UTC+8)، وفقًا لمراقبة 动察Beating، أعلنت مؤسسة ARC Prize عن مجموعة بيانات أداء الإنسان لـ ARC-AGI-3، وهي أكبر دراسة اختبار بشري حتى الآن ضمن سلسلة ARC-AGI، بمشاركة 458 شخصًا. تحتوي مجموعة البيانات على 342 سجلًا كاملًا لتشغيل الإنسان، تغطي 25 بيئة عامة، وتم فتحها جميعًا للمصدر. يتضمن ARC-AGI-3 135 بيئة استنتاج تجريدية، حيث لا يتلقى المختبرون أي شرح للعبة، ويجب عليهم استكشاف القواعد، واستنتاجها، ووضع استراتيجيات بأنفسهم. تُجرى الاختبارات في مركز اختبار حضري في سان فرانسيسكو، وتستمر كل جلسة 90 دقيقة، ويحصل المشاركون على حوالي 130 دولارًا كأجر أساسي بالإضافة إلى 5 دولارات عن كل بيئة يتم تجاوزها. جميع الاختبارات تتم تحت شرط “المرور الأول”، أي أن كل شخص يشاهد مرة واحدة ويحاول مرة واحدة فقط، ويقيس ذلك قدرة التعلم والتكيف عند مواجهة مشكلات جديدة. يحصل الإنسان والذكاء الاصطناعي على نفس المعلومات تمامًا، دون أي فرق في المعلومات. الاستنتاج الرئيسي: تم تجاوز جميع بيئات ARC-AGI-3 من قبل البشر، حيث أكمل كل بيئة على الأقل اثنين من المشاركين المستقلين، ومعظم البيئات تم تجاوزها من قبل أكثر من خمسة أشخاص. تقول مؤسسة ARC Prize: “لم نحقق بعد الذكاء الاصطناعي العام، وهذه البيانات هي الدليل”. منذ معاينة ARC-AGI-3، تلقت البيئات العامة ما يقرب من مليون تقييم من الذكاء الاصطناعي. استنادًا إلى هذه البيانات، أعلنت المؤسسة عن تعديلين في قواعد التقييم: الأول هو تغيير معيار الأداء البشري من “أفضل لاعب ثاني” إلى “متوسط اللاعب”، لتقليل تأثير الحظ على النتيجة؛ والثاني هو رفع الحد الأقصى لنقاط كل مهمة من 100% إلى 115%، لتجنب أن تؤثر أداء ضعيف في مهمة واحدة على الأداء الكلي. الأثر الصافي للتعديلين هو ارتفاع درجات الإنسان والذكاء الاصطناعي بشكل طفيف حوالي 0.5 نقطة مئوية. (المصدر: BlockBeats)

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

أعجبني
إعجاب
تعليق
إعادة النشر
مشاركة

تعليق

إضافة تعليق

لا توجد تعليقات

المواضيع الرائجة
عرض المزيد
#
GatePreIPOsLaunchesWithSpaceX
121.2K درجة الشعبية
#
GateMarchTransparencyReport
42.79K درجة الشعبية
#
IsraelStrikesIranBTCPlunges
29.81K درجة الشعبية
#
GoldmanSachsFilesBitcoinIncomeETF
776.17K درجة الشعبية
#
USBlocksStraitofHormuz
749.22K درجة الشعبية

تثبيت

خريطة الموقع

ARC-AGI-3 يعلن عن أكبر اختبار بشري في التاريخ: تم التغلب على جميع المستويات بواسطة البشر، والذكاء الاصطناعي لا يزال لديه فجوات

المواضيع الرائجة

GatePreIPOsLaunchesWithSpaceX

GateMarchTransparencyReport

IsraelStrikesIranBTCPlunges

GoldmanSachsFilesBitcoinIncomeETF

USBlocksStraitofHormuz

تثبيت