DeepSeek官方发文介绍DeeepSeek V4特性
4月10日DeeepSeek官方博客发文介绍DeepSeek V4,DeepSeek V4是DeepSeek即将推出的旗舰模型,它不仅突破了参数规模的极限,更承诺带来前所未有的效率。DeepSeek V4预计可处理1 万亿 (1T) 个参数,原生支持文本、图像、视频和音频等多模态数据,并拥有100万个词元的上下文窗口(相当于15-20部完整的小说),使其成为OpenAI的GPT-5.4和Anthropic的Claude Opus 4.5等西方巨头的直接竞争对手。DeepSeek V4的API定价比GPT-5.4和Claude Opus 4.5便宜10-50倍;预计DeepSeek V4将采用 Apache 2.0 许可协议开源权重;DeepSeek V4可在本地双 RTX 4090 或单 RTX 5090 上运行。
DeepSeek还介绍了DeepSeek V4的3项突破性的创新:1、Engram条件记忆; 2、流形约束超连接(mHC); 3、稀疏注意力机制 (DSA) 和Lightning索引器。
此外,DeepSeek官方还表示,由于美国对英伟达高端 GPU(例如B300和H200)的出口有着严格的限制,DeepSeek对V4进行了优化,使其能够主要依靠中国国产芯片进行推理。虽然初始训练可能仍然使用了英伟达硬件(例如H800s),但该模型针对华为 Ascend 950PR和Cambricon MLU芯片进行了高度优化。
上一篇:昨日美国比特币现货ETF净流入3.581亿美元,以太坊ETF净流入8520万美元
下一篇:没有了
下一篇:没有了
热门快讯
1
Conflux:已修复一个操作码相关漏洞,此次安全事件未导致用户资金损失
2025-03-25
2
Upbit 正式支持 USDT 代币在 Aptos 主网充提
2025-06-18
3
美国上诉法院裁定,在上诉程序进行期间,特朗普的关税措施可能仍将继续生效
2025-06-11
4
USD1即将于Aptos网络发行
2025-10-01
5
胜利证券陈辰:香港是稳定币发展的政策缓冲区
2025-08-06
6
知情人士:MetaMask 或将本周公布 mUSD 稳定币计划
2025-08-14
