A Gold Finance report diz que hoje estamos lançando dois modelos oficiais: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale. O DeepSeek-V3.2 é o nosso primeiro modelo que incorpora o pensamento na utilização de ferramentas, e suporta simultaneamente chamadas de ferramentas em modo de pensamento e modo não-pensante. Propusemos um método de síntese de dados de treinamento de agente em larga escala, construindo uma grande quantidade de tarefas de aprendizado por reforço “difíceis de responder, fáceis de verificar” (mais de 1800 ambientes, mais de 85.000 instruções complexas), aumentando significativamente a capacidade de generalização do modelo. (DeepSeek)
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
DeepSeek V3.2 versão oficial lançada: capacidade de Agent aprimorada, incorporando raciocínio e reflexão
A Gold Finance report diz que hoje estamos lançando dois modelos oficiais: DeepSeek-V3.2 e DeepSeek-V3.2-Speciale. O DeepSeek-V3.2 é o nosso primeiro modelo que incorpora o pensamento na utilização de ferramentas, e suporta simultaneamente chamadas de ferramentas em modo de pensamento e modo não-pensante. Propusemos um método de síntese de dados de treinamento de agente em larga escala, construindo uma grande quantidade de tarefas de aprendizado por reforço “difíceis de responder, fáceis de verificar” (mais de 1800 ambientes, mais de 85.000 instruções complexas), aumentando significativamente a capacidade de generalização do modelo. (DeepSeek)