أخبار Gate، في 25 مارس، أصدر Cursor تقريرًا تقنيًا عن Composer 2، وكشف لأول مرة عن خطة التدريب الكاملة. يعتمد النموذج الأساسي Kimi K2.5 على بنية MoE، ويحتوي على إجمالي 1.04 تريليون معلمة، و320 مليار معلمة نشطة. يتكون التدريب من مرحلتين: الأولى استكمال التدريب المسبق على بيانات الشيفرة لتعزيز المعرفة الترميزية، والثانية تحسين القدرة على الترميز من النهاية إلى النهاية من خلال التعلم المعزز على نطاق واسع. بيئة التعلم المعزز تحاكي تمامًا سيناريوهات الاستخدام الحقيقية لـ Cursor، بما في ذلك تحرير الملفات، عمليات الطرفية، البحث عن الشيفرة، واستدعاء أدوات أخرى، مما يسمح للنموذج بالتعلم في ظروف قريبة من بيئة الإنتاج. كما تم نشر طريقة بناء معيار CursorBench الخاص بنا بشكل متزامن: حيث يتم جمع المهام من جلسات الترميز الحقيقية لفريق الهندسة، وليس من خلال تركيب يدوي. حقق النموذج Kimi K2.5 على هذا المعيار درجة 36.0، وبعد مرحلتي التدريب، وصل Composer 2 إلى 61.3 نقطة، بزيادة قدرها 70%. وأكدت Cursor أن تكاليف استنتاج النموذج أقل بشكل ملحوظ من بعض نماذج API المتقدمة، مع تحقيق توازن مثالي بين الدقة والتكلفة.