DeepSeek V4将在未来数周内发布,或将完全运行于华为芯片

BlockBeatNews

BlockBeats 消息,4 月 4 日,据美国科技媒体 The Information 最新报道,中国 AI 初创公司 DeepSeek 即将发布的新一代旗舰模型 V4,将完全运行于华为自研芯片之上,被视为中国推动半导体自主化进程的重要里程碑。

V4 预计将在未来数周内发布,并将完全运行于华为芯片。DeepSeek 为此与华为及芯片设计商寒武纪合作数月,重新改写了模型底层部分代码,以实现与国产芯片的兼容。

值得注意的是,DeepSeek 这次并未向英伟达开放 V4 的提前测试权限,仅邀请国内芯片企业参与早期优化,打破了业界惯例。

阿里巴巴、字节跳动、腾讯等中国科技巨头已提前采购华为最新款 Ascend 950PR 芯片,总订单量达数十万颗,计划通过云服务部署 V4 并整合至自家 AI 应用。需求激增推动该芯片价格上涨约 20%。

V4 采用混合专家架构(MoE),总参数量约 1 万亿,每次推理激活约 370 亿参数,可在保持低延迟的同时支持文本、图像与代码的多模态输入。

去年 DeepSeek 发布低成本模型 V3 和 R1,曾引发全球科技股大跌,令市场质疑美国 AI 公司是否需要耗资数十亿美元采购算力。V4 因此备受国际关注。

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Opmerking
0/400
Geen opmerkingen