A Gold Finance report diz que hoje estamos lançando dois modelos oficiais: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale. O DeepSeek-V3.2 é o nosso primeiro modelo que incorpora o pensamento na utilização de ferramentas, e suporta simultaneamente chamadas de ferramentas em modo de pensamento e modo não-pensante. Propusemos um método de síntese de dados de treinamento de agente em larga escala, construindo uma grande quantidade de tarefas de aprendizado por reforço “difíceis de responder, fáceis de verificar” (mais de 1800 ambientes, mais de 85.000 instruções complexas), aumentando significativamente a capacidade de generalização do modelo. (DeepSeek)
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
DeepSeek V3.2 versão oficial lançada: capacidade de Agent aprimorada, incorporando raciocínio e reflexão
A Gold Finance report diz que hoje estamos lançando dois modelos oficiais: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale. O DeepSeek-V3.2 é o nosso primeiro modelo que incorpora o pensamento na utilização de ferramentas, e suporta simultaneamente chamadas de ferramentas em modo de pensamento e modo não-pensante. Propusemos um método de síntese de dados de treinamento de agente em larga escala, construindo uma grande quantidade de tarefas de aprendizado por reforço “difíceis de responder, fáceis de verificar” (mais de 1800 ambientes, mais de 85.000 instruções complexas), aumentando significativamente a capacidade de generalização do modelo. (DeepSeek)