Згідно з повідомленням Golden Finance, сьогодні ми одночасно випускаємо дві офіційні версії моделей: DeepSeek-V3.2 та DeepSeek-V3.2-Speciale. DeepSeek-V3.2 є нашою першою моделлю, яка інтегрує мислення у використання інструментів і одночасно підтримує виклик інструментів у режимі мислення та без мислення. Ми запропонували методику синтезу даних для навчання агентів у великому масштабі, створивши велику кількість завдань з підкріпленого навчання “важко розв'язувані, легко перевіряються” (1800+ середовищ, 85 000+ складних інструкцій), що значно підвищує загальні можливості моделі. (DeepSeek)
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Офіційний реліз DeepSeek V3.2: посилені можливості Agent, інтеграція мислення та розумування
Згідно з повідомленням Golden Finance, сьогодні ми одночасно випускаємо дві офіційні версії моделей: DeepSeek-V3.2 та DeepSeek-V3.2-Speciale. DeepSeek-V3.2 є нашою першою моделлю, яка інтегрує мислення у використання інструментів і одночасно підтримує виклик інструментів у режимі мислення та без мислення. Ми запропонували методику синтезу даних для навчання агентів у великому масштабі, створивши велику кількість завдань з підкріпленого навчання “важко розв'язувані, легко перевіряються” (1800+ середовищ, 85 000+ складних інструкцій), що значно підвищує загальні можливості моделі. (DeepSeek)