2026-01-12 08:28:13

الاختبار المرجعي هو في الواقع كتابة القيم كمبرمجيات.

كل توقعاتنا ومخاوفنا من الذكاء الاصطناعي تم دفعها بقوة إلى تلك الأدوات التي يمكنها تقييم الأداء — ما هو التقدم، ما الذي يجب أن نخاف منه، ما الذي يجب تحسينه، وفي النهاية يجب أن نتظاهر بأن هذه الأشياء يمكن قياسها بدقة. المشكلة هي أن بعض الأشياء لا يمكن قياسها أصلاً. وراء المعايير المختارة، غالبًا ما تكمن افتراضات المصمم نفسه. اختيارك لمعيار معين يعادل تحديد شكل الذكاء الاصطناعي الذي يجب أن يكون عليه. وبالعكس، الأشياء التي لم تُختَر قد تكون الأهم حقًا.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 12

أعجبني
12
10
إعادة النشر
مشاركة

تعليق

0/400

Hash_Bandit

· منذ 1 س

المقاييس هي مجرد معتقدات شخص ما تحولت إلى معادلات، بصراحة. لقد كنت أتابع هذا منذ الأيام الأولى وهو حرفيًا نفس خطة اللعب—اختر مقاييس تبدو موضوعية، وتظاهر بأنها تلتقط كل ما يهم، ثم تصدم عندما تلدغك النقاط العمياء. الأشياء غير المقاسة دائمًا تفوز في النهاية، دائمًا.

شاهد النسخة الأصليةرد0

Rekt_Recovery

· منذ 7 س

لا، هذا يختلف حقًا... يذكرني عندما تم تصفيتي وأنا ألاحق مقياسًا بدا جيدًا على الورق. اتضح أن تحسين الإشارة الخاطئة هو ما يؤدي إلى الانفجار. 🚨

شاهد النسخة الأصليةرد0

SignatureLiquidator

· 01-12 10:06

المؤشرات هي مجرد حيلة بصرية، تختار ما تراه وما لا تراه هو الأكثر رعبًا

شاهد النسخة الأصليةرد0

EternalMiner

· 01-12 08:58

قول صحيح، المؤشرات هي في الحقيقة السلطة

شاهد النسخة الأصليةرد0

PanicSeller

· 01-12 08:54

المعيار هو لعبة السيطرة على الخطاب، من يحدد المعايير هو الذي يفوز

شاهد النسخة الأصليةرد0

GateUser-7b078580

· 01-12 08:52

تُظهر البيانات أن نظام التقييم هذا غير منطقي من الأساس، ولكن من الذي يحدد المعايير المختارة؟ المعدنون يأكلون الكثير، والاختبارات المرجعية أيضًا.

شاهد النسخة الأصليةرد0

ChainBrain

· 01-12 08:45

يا إلهي، لهذا السبب تكون تلك القوائم التصنيفية كلها هراء

شاهد النسخة الأصليةرد0

MetaMisery

· 01-12 08:35

هذه هي الحقيقة، من يحدد المعايير هو من يملك حق الكلام

شاهد النسخة الأصليةرد0

TokenTherapist

· 01-12 08:30

嗯…الاختبار المرجعي هو تحويل من يملك القيم إلى رمز برمجي، وهذه هي المشكلة في الواقع --- حقًا، الأشياء التي لم تُدرج في المؤشرات هي الأكثر رعبًا --- لذا، ببساطة، المصممون يلعبون لعبة السلطة باستخدام الأرقام --- الكمية نفسها نوع من الانتقاء، كلامي صار حاسمًا جدًا هاها --- بمجرد تحديد المؤشر، يتحول إلى نبوءة تحقق ذاتها --- كلما نظرت إلى الاختبار المرجعي، أريد أن أسأل: من قال إن هذه الأشياء يجب قياسها --- الأكثر جنونًا هو التظاهر أن القياس الدقيق يمكن أن يحل مشكلة القيم

شاهد النسخة الأصليةرد0

TopBuyerBottomSeller