Laporan Jinse Caijing, hari ini, kami secara bersamaan merilis dua model versi resmi: DeepSeek-V3.2 dan DeepSeek-V3.2-Speciale. DeepSeek-V3.2 adalah model pertama yang kami luncurkan yang mengintegrasikan pemikiran dalam penggunaan alat, dan mendukung pemanggilan alat dalam mode pemikiran dan non-pemikiran. Kami mengusulkan metode sintesis data pelatihan Agent skala besar, membangun banyak tugas pembelajaran penguatan “sulit dijawab, mudah diverifikasi” (1800+ lingkungan, 85.000+ instruksi kompleks), yang secara signifikan meningkatkan kemampuan generalisasi model. (DeepSeek)
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
DeepSeek V3.2 versi resmi dirilis: Memperkuat kemampuan Agent, mengintegrasikan pemikiran dan penalaran
Laporan Jinse Caijing, hari ini, kami secara bersamaan merilis dua model versi resmi: DeepSeek-V3.2 dan DeepSeek-V3.2-Speciale. DeepSeek-V3.2 adalah model pertama yang kami luncurkan yang mengintegrasikan pemikiran dalam penggunaan alat, dan mendukung pemanggilan alat dalam mode pemikiran dan non-pemikiran. Kami mengusulkan metode sintesis data pelatihan Agent skala besar, membangun banyak tugas pembelajaran penguatan “sulit dijawab, mudah diverifikasi” (1800+ lingkungan, 85.000+ instruksi kompleks), yang secara signifikan meningkatkan kemampuan generalisasi model. (DeepSeek)