豆包大モデルチームオープンソースベンチマークテストセットSuperGPQA

GoldenOctober2024

2025-03-04 05:51:31

金十データ3月4日の情報によると、豆包の大規模モデルチームの公式ウェブサイトによると、最近、豆包の大規模モデルチームがオープンソースSuperGPQA、領域全体をカバーし、高い識別力を備えた知識推論ベンチマークテストをリリースしました。このデータセットは、研究科目を285個カバーし、26529の専門問題を含む評価体系を構築しており、主要な学科だけでなく、軽工業、農業、サービス科学などのロングテールの学科も取り入れており、幅広い学科領域を示し、ロングテールの知識評価領域の空白を埋めることになります。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

2 いいね