DeepSeek, una empresa emergente de inteligencia artificial con sede en Hangzhou, China, lanzó a finales de diciembre de 2024 el modelo de lenguaje de gran escala DeepSeek-V3, que ha captado la atención global de la industria de la inteligencia artificial. Este modelo cuenta con 671 mil millones de parámetros y se entrenó en aproximadamente dos meses con una inversión de solo 5,58 millones de dólares, mucho menor que la de otros gigantes tecnológicos. DeepSeek-V3 performs exceptionally well in open-source models and is comparable to the most advanced models in the world. The company has optimized the training process to reduce costs and uses approximately 2.78 million hours of Nvidia H800 GPUs, which are manufactured in China. This indicates significant progress by Chinese artificial intelligence companies in acquiring advanced semiconductor materials needed for training AI, despite restrictions from the United States. El éxito de DeepSeek ha suscitado preocupaciones en la industria tecnológica estadounidense, y las acciones de Nvidia y otras empresas tecnológicas han caído considerablemente. Los expertos opinan que, mediante el uso de tecnología de código abierto y métodos de formación eficaces, DeepSeek ha logrado una alta eficiencia a un costo mucho menor que sus competidores estadounidenses. Además, DeepSeek ha publicado el código fuente del modelo y una explicación técnica detallada, lo que permite a investigadores y desarrolladores de todo el mundo acceder y mejorar esta tecnología. Esta transparencia contrasta fuertemente con el enfoque más conservador de las principales empresas de inteligencia artificial en los Estados Unidos y podría cambiar la forma en que las empresas tecnológicas desarrollan modelos en el futuro.
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
#Deepseek Goes Viral
DeepSeek, una empresa emergente de inteligencia artificial con sede en Hangzhou, China, lanzó a finales de diciembre de 2024 el modelo de lenguaje de gran escala DeepSeek-V3, que ha captado la atención global de la industria de la inteligencia artificial. Este modelo cuenta con 671 mil millones de parámetros y se entrenó en aproximadamente dos meses con una inversión de solo 5,58 millones de dólares, mucho menor que la de otros gigantes tecnológicos.
DeepSeek-V3 performs exceptionally well in open-source models and is comparable to the most advanced models in the world. The company has optimized the training process to reduce costs and uses approximately 2.78 million hours of Nvidia H800 GPUs, which are manufactured in China. This indicates significant progress by Chinese artificial intelligence companies in acquiring advanced semiconductor materials needed for training AI, despite restrictions from the United States.
El éxito de DeepSeek ha suscitado preocupaciones en la industria tecnológica estadounidense, y las acciones de Nvidia y otras empresas tecnológicas han caído considerablemente. Los expertos opinan que, mediante el uso de tecnología de código abierto y métodos de formación eficaces, DeepSeek ha logrado una alta eficiencia a un costo mucho menor que sus competidores estadounidenses.
Además, DeepSeek ha publicado el código fuente del modelo y una explicación técnica detallada, lo que permite a investigadores y desarrolladores de todo el mundo acceder y mejorar esta tecnología. Esta transparencia contrasta fuertemente con el enfoque más conservador de las principales empresas de inteligencia artificial en los Estados Unidos y podría cambiar la forma en que las empresas tecnológicas desarrollan modelos en el futuro.