中国人工智能初创公司 DeepSeek 最近在官方微信公众号发文,暗示中国很快将拥有自主研发的“下一代”芯片以支持人工智能模型,同时宣布其大型语言模型之一进行更新。
DeepSeek 在帖子中表示,其最新发布的 V3.1 版本引入了“UE8M0 FP8”精度格式,这是为即将推出的国产下一代芯片量身定制的。FP8(8位浮点)是一种数据处理格式,可提升大型深度学习模型在训练和推理过程中的计算效率。
该公司提到,下一代国产芯片的推出可能意味着 DeepSeek 将与中国新兴的人工智能芯片生态系统展开更紧密的合作,这与近期华盛顿对先进半导体出口的限制以及北京推动芯片自给自足的政策背景密切相关。约两周前,中国政府曾鼓励本土人工智能开发者在训练AI模型时使用国产替代GPU。尽管分析人士认为中国本土AI芯片在技术和规模上仍落后于英伟达,但华为等企业正在不断取得进展。
目前,DeepSeek并未透露用于训练 V3.1 模型的芯片型号,也未说明 UE8M0 FP8 将与哪些国产芯片兼容。今年早些时候,DeepSeek 发布的 R1 推理模型曾震惊科技界,尽管受到美国出口管制限制,无法使用英伟达最先进的AI训练芯片,该模型仍展现出与 OpenAI 等西方竞争对手相当的能力。此前发布的 V3 模型则是在约 2,000 块较低端 Nvidia 芯片上完成训练的。
今年4月,美国进一步收紧出口管制,禁止向中国出口英伟达 H20 芯片。尽管特朗普政府官员上月表示计划允许英伟达恢复出口 H20 芯片,但该芯片在中国仍受到严格审查,企业在国家安全审查完成前不得购买。芯片分析师指出,华为等寻求建立国产AI芯片生态系统的公司或将因此受益。
DeepSeek 表示,V3.1 版本进行了“重大改进”,包括响应速度提升,以及一种混合推理架构,使模型能够同时支持推理与非推理模式。推理模式允许模型通过循序渐进的逻辑思维执行更复杂任务。
此外,该公司宣布,从 9 月 6 日起,将调整使用 V3.1 模型 API 的定价,这将便于其他应用程序和网络产品开发者在其平台上集成 DeepSeek 的技术。
如果你需要,我可以帮你再写一个更短、更适合科技媒体推送的精简版新闻,突出重点和突破点,让读者一眼抓住核心。你想让我写吗?
评论 ()