2025-01-31 05:37:08

#Deepseek Goes Viral

DeepSeek，一家总部位于中国杭州的人工智能初创公司，于2024年12月底推出了引起全球人工智能行业关注的大型语言模型DeepSeek-V3。该模型拥有6710亿参数，但仅花费558万美元约两个月时间进行训练，远低于其他科技巨头的投资成本。
DeepSeek-V3在开源模型中表现出色，并与世界上最先进的模型相媲美。该公司优化了培训过程，以降低成本，使用了约2.78百万小时的Nvidia H800 GPU，这些GPU是在中国制造的。这表明中国的人工智能公司在获取训练AI所需的先进半导体材料方面取得了重大进展，尽管受到美国的限制。
DeepSeek的成功引起了美国科技行业的担忧，Nvidia和其他科技公司的股票大幅下跌。专家认为，DeepSeek通过使用开源技术和有效的培训方法，以比美国竞争对手低得多的成本实现了高效能。
此外，DeepSeek已经公开了模型的源代码和详细的技术解释，使全球的研究人员和开发人员可以接触和改进这项技术。这种透明度与美国顶级人工智能公司更加保守的方法形成了鲜明对比，并可能改变未来科技公司开发模型的方式。

DEEPSEEK3.24%

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

0/400

暂无评论

热门 Gate Fun
查看更多

1
金龙马
DNB
市值:$2552.28持有人数:2
0.36%
2
BNB
BNB
市值:$0.1持有人数:1
0.00%
3
蔷薇花
蔷薇花
市值:$0.1持有人数:1
0.00%
4
福
福
市值:$0.1持有人数:1
0.00%
5
PS
PowerShell
市值:$2530.15持有人数:2
0.25%

#Deepseek Goes Viral

热门话题

Gate广场发帖领五万美金红包

美国核心CPI创四年新低

比特币下一步怎么走？

Gate春节赛马红包嘉年华

我看好的AIAgent

热门 Gate Fun

金龙马

DNB

BNB

BNB

蔷薇花

蔷薇花

福

福

PS

PowerShell

置顶