金色财经の報道によると、今日は2つの正式版モデルを同時に発表します:DeepSeek-V3.2とDeepSeek-V3.2-Speciale。DeepSeek-V3.2は、思考をツールの使用に組み込んだ最初のモデルで、思考モードと非思考モードのツール呼び出しの両方をサポートしています。私たちは、大規模なエージェント訓練データ合成方法を提案し、「解決が難しく、検証が容易な」強化学習タスク(1800以上の環境、85,000以上の複雑な指示)を構築し、モデルの一般化能力を大幅に向上させました。(DeepSeek)
219.6K 人気度
10.53K 人気度
1.44K 人気度
1.6K 人気度
2.32K 人気度
DeepSeek V3.2 がリリースされました: エージェント機能の強化と統合された思考と推論
金色财经の報道によると、今日は2つの正式版モデルを同時に発表します:DeepSeek-V3.2とDeepSeek-V3.2-Speciale。DeepSeek-V3.2は、思考をツールの使用に組み込んだ最初のモデルで、思考モードと非思考モードのツール呼び出しの両方をサポートしています。私たちは、大規模なエージェント訓練データ合成方法を提案し、「解決が難しく、検証が容易な」強化学習タスク(1800以上の環境、85,000以上の複雑な指示)を構築し、モデルの一般化能力を大幅に向上させました。(DeepSeek)