华为昇腾910D挑战英伟达!虽7nm制程落后,但低功耗+低成本成优势,直指中国市场。PK英伟达H100,Ascend 910D在FP16/INT8性能上亮眼,但HBM2e内存和MindSpore生态成短板。Nvidia CUDA生态和云联盟优势明显,AI芯片大战,华为仍需努力!
译自:Huawei Ascend 910D vs Nvidia H100 Performance Comparison 2025
作者:News Desk
2019 年,当美国以国家安全为由将华为列入黑名单时,很少有人想到仅仅六年后的今天,华为会直接挑战英伟达——人工智能硬件领域无可争议的王者。
然而,在 2025 年 4 月,华为的 Ascend 910D 已经迫使全球芯片观察者、投资者和 AI 开发者们开始关注。
华为 | 英伟达 | |
---|---|---|
成立时间 | 1987 | 1993 |
创始人 | 任正非 | 黄仁勋 |
最初领域 | 电信设备 | 图形处理器 |
转向 AI | 2018 (Ascend 系列) | 2012 (CUDA AI) |
- 英伟达在全球 AI 训练芯片领域占据主导地位——截至 2024 年,市场份额超过 80%。
- 华为最初是一家电信巨头,在受到制裁后意识到,建立独立的 AI 芯片产业对于中国的技术主权至关重要。
因此,一场秘密的、资金雄厚的 AI 半导体推进开始了,最终产生了 Ascend 芯片系列。
指标 | 华为 | 英伟达 |
---|---|---|
2025 年市值 | ~1600 亿美元(由于制裁,低于 2020 年的 ~5000 亿美元) | ~2.6 万亿美元 |
员工人数 | ~195,000 | ~36,000 |
研发支出 | 240 亿美元 | 129 亿美元 |
总部 | 中国深圳 | 美国圣克拉拉 |
请注意,尽管受到制裁,华为的研发预算几乎是英伟达的 3 倍——这是 Ascend 910D 快速发展的关键因素。
然而,在全球范围内,华为面临着激烈的竞争对手:
- 英伟达 H100(5nm, TSMC): 在性能、生态系统 (CUDA) 和内存技术 (HBM3) 方面处于领先地位。
- 英伟达 B100(预计 2025 年,4nm, TSMC): 预计性能比 H100 提高 30-40%,并引入 HBM3e 内存。
- AMD Instinct MI300X(6nm, TSMC): 在内存带宽基准测试中占据主导地位,这对于 LLM 训练至关重要。
- Cerebras 和 SambaNova: 提供革命性的晶圆级和可重构 AI 加速器,但与英伟达相比仍然是小众。
因此,虽然 Ascend 910D 是华为内部的巨大飞跃,但全球 AI 竞赛仍然拥挤而激烈。
华为的战略:
- 首先关注 中国、中东、俄罗斯以及与美国贸易政策不太一致的国家。
- 提供比英伟达/AMD 更低的 TCO(总拥有成本) 解决方案。
- 推广 MindSpore 作为 CUDA 的替代品,并预先构建针对其芯片进行微调的 LLM。
特性 | Ascend 910D | 英伟达 H100 | AMD MI300X |
---|---|---|---|
峰值 FP16 | 1.2 PFLOPS | 1.0 PFLOPS | 1.3 PFLOPS |
峰值 INT8 | 2.4 PFLOPS | 2.0 PFLOPS | 2.6 PFLOPS |
内存带宽 | 800 GB/s (HBM2e) | 3 TB/s (HBM3) | 5.2 TB/s (HBM3) |
支持的模型大小 | 175B 参数 | 530B 参数 | 500B 参数 |
制程节点 | 7nm (SMIC N+2) | 4N (TSMC) | 5nm (TSMC) |
能源效率 | 比 H100 高 +12% | 基线 | 比 H100 高 +10% |
TDP(功耗) | 350W | 700W | 750W |
✅ 优势:
- 更低的功耗
- 更低的成本(便宜约 30-40%)
- 防制裁设计
❌ 劣势:
- 较慢的内存访问速度 (HBM2e vs HBM3)
- 软件生态系统不够成熟
由于 SMIC(华为的代工厂合作伙伴)被限制购买先进的 EUV 光刻机,Ascend 910D 使用 7nm DUV 制造——令人印象深刻,但落后于英伟达的 4N 工艺(基于台积电的 5nm EUV)。
然而,华为:
- 增加了芯片面积以容纳更多的晶体管。
- 专注于低频运行以控制热量。
- 优化了用于 LLM 的矩阵乘法单元,而不是广泛的 AI 工作负载。
这是一款 为特定目的而设计的 芯片,还不是通用的竞争对手。
尽管 Ascend 910D 首次亮相令人印象深刻,但它面临着关键的局限性:
- 制造限制:采用 7nm 工艺制造,而竞争对手则转向 5nm 甚至 4nm 工艺。较低的晶体管密度会影响长期竞争力。
- 内存瓶颈:仅限于旧版本的 HBM 内存,影响超大型模型的训练。
- 软件生态系统:与英伟达 CUDA 的全球主导地位相比,MindSpore 的采用受到限制。
- 国际市场准入:美国的制裁限制了华为在中国境外自由销售,欧洲仍然持谨慎态度。
这些因素可能会阻止 Ascend 910D 在国际上复制其国内的成功。
英伟达仍然是无可争议的全球 AI 芯片领导者,原因有以下几个战略原因:
- 全栈优势:除了硬件之外,英伟达还通过 CUDA、TensorRT 和 cuDNN 库控制着 AI 软件世界。
- 战略云联盟:与 AWS、Microsoft Azure、Google Cloud 的深度集成确保了 Nvidia 硬件嵌入在全球 AI 管道中。
- 创新步伐:黄仁勋的领导力推动 Nvidia 采取积极的产品更新周期——每 18-24 个月。
- 财务实力:截至 2025 年 4 月,Nvidia 2.2 万亿美元的市值使华为的芯片部门相形见绌,后者在严格的预算和地缘政治约束下运营。简单来说,当华为还在攀登时,Nvidia 已经建造了这座山。
昇腾 910D 的发布 подчеркивает 了华为在压力下不断增强的创新能力。它加强了中国国内的 AI 格局,并帮助华为在多年的技术禁运后重拾自豪感。
然而,在全球范围内,Nvidia 的领先地位仍然是决定性的——目前而言。在未来五年内,AI 芯片霸主之争不仅取决于设计更好的芯片,还取决于确保获得尖端制造技术、建立值得信赖的生态系统以及赢得开发者忠诚度。
真正的 AI 芯片战争才刚刚开始。