Golden Finance rapporte qu'aujourd'hui, nous publions simultanément deux modèles en version officielle : DeepSeek-V3.2 et DeepSeek-V3.2-Speciale. DeepSeek-V3.2 est notre premier modèle qui intègre la réflexion dans l'utilisation des outils et prend en charge à la fois le mode de réflexion et le mode non réflexif pour l'appel des outils. Nous avons proposé une méthode de synthèse de données de formation pour les agents à grande échelle, construisant un grand nombre de tâches d'apprentissage par renforcement “difficiles à résoudre, faciles à vérifier” (1800+ environnements, 85 000+ instructions complexes), ce qui augmente considérablement la capacité de généralisation du modèle. (DeepSeek)
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Publication de la version officielle DeepSeek V3.2 : Renforcement des capacités de l'Agent, intégration de la pensée et du raisonnement.
Golden Finance rapporte qu'aujourd'hui, nous publions simultanément deux modèles en version officielle : DeepSeek-V3.2 et DeepSeek-V3.2-Speciale. DeepSeek-V3.2 est notre premier modèle qui intègre la réflexion dans l'utilisation des outils et prend en charge à la fois le mode de réflexion et le mode non réflexif pour l'appel des outils. Nous avons proposé une méthode de synthèse de données de formation pour les agents à grande échelle, construisant un grand nombre de tâches d'apprentissage par renforcement “difficiles à résoudre, faciles à vérifier” (1800+ environnements, 85 000+ instructions complexes), ce qui augmente considérablement la capacité de généralisation du modèle. (DeepSeek)