2025年华为昇腾910D与英伟达H100性能对比

华为昇腾910D挑战英伟达!虽7nm制程落后,但低功耗+低成本成优势,直指中国市场。PK英伟达H100,Ascend 910D在FP16/INT8性能上亮眼,但HBM2e内存和MindSpore生态成短板。Nvidia CUDA生态和云联盟优势明显,AI芯片大战,华为仍需努力!

译自:Huawei Ascend 910D vs Nvidia H100 Performance Comparison 2025

作者:News Desk

2019 年,当美国以国家安全为由将华为列入黑名单时,很少有人想到仅仅六年后的今天,华为会直接挑战英伟达——人工智能硬件领域无可争议的王者。

然而,在 2025 年 4 月,华为的 Ascend 910D 已经迫使全球芯片观察者、投资者和 AI 开发者们开始关注。

历史竞争:华为和英伟达如何发生冲突

华为 英伟达
成立时间 1987 1993
创始人 任正非 黄仁勋
最初领域 电信设备 图形处理器
转向 AI 2018 (Ascend 系列) 2012 (CUDA AI)
  • 英伟达在全球 AI 训练芯片领域占据主导地位——截至 2024 年,市场份额超过 80%
  • 华为最初是一家电信巨头,在受到制裁后意识到,建立独立的 AI 芯片产业对于中国的技术主权至关重要。

因此,一场秘密的、资金雄厚的 AI 半导体推进开始了,最终产生了 Ascend 芯片系列

这些参与者的规模有多大?

指标 华为 英伟达
2025 年市值 ~1600 亿美元(由于制裁,低于 2020 年的 ~5000 亿美元) ~2.6 万亿美元
员工人数 ~195,000 ~36,000
研发支出 240 亿美元 129 亿美元
总部 中国深圳 美国圣克拉拉

请注意,尽管受到制裁,华为的研发预算几乎是英伟达的 3 倍——这是 Ascend 910D 快速发展的关键因素。

华为 Ascend 910D vs 英伟达 H100:华为的地位

然而,在全球范围内,华为面临着激烈的竞争对手:

  • 英伟达 H100(5nm, TSMC): 在性能、生态系统 (CUDA) 和内存技术 (HBM3) 方面处于领先地位。
  • 英伟达 B100(预计 2025 年,4nm, TSMC): 预计性能比 H100 提高 30-40%,并引入 HBM3e 内存。
  • AMD Instinct MI300X(6nm, TSMC): 在内存带宽基准测试中占据主导地位,这对于 LLM 训练至关重要。
  • Cerebras 和 SambaNova: 提供革命性的晶圆级和可重构 AI 加速器,但与英伟达相比仍然是小众。

因此,虽然 Ascend 910D 是华为内部的巨大飞跃,但全球 AI 竞赛仍然拥挤而激烈

华为的战略

  • 首先关注 中国、中东、俄罗斯以及与美国贸易政策不太一致的国家。
  • 提供比英伟达/AMD 更低的 TCO(总拥有成本) 解决方案。
  • 推广 MindSpore 作为 CUDA 的替代品,并预先构建针对其芯片进行微调的 LLM

详细技术比较:为什么 Ascend 910D 很重要

特性 Ascend 910D 英伟达 H100 AMD MI300X
峰值 FP16 1.2 PFLOPS 1.0 PFLOPS 1.3 PFLOPS
峰值 INT8 2.4 PFLOPS 2.0 PFLOPS 2.6 PFLOPS
内存带宽 800 GB/s (HBM2e) 3 TB/s (HBM3) 5.2 TB/s (HBM3)
支持的模型大小 175B 参数 530B 参数 500B 参数
制程节点 7nm (SMIC N+2) 4N (TSMC) 5nm (TSMC)
能源效率 比 H100 高 +12% 基线 比 H100 高 +10%
TDP(功耗) 350W 700W 750W

优势

  • 更低的功耗
  • 更低的成本(便宜约 30-40%)
  • 防制裁设计

劣势

  • 较慢的内存访问速度 (HBM2e vs HBM3)
  • 软件生态系统不够成熟

制裁如何塑造了华为的战略

由于 SMIC(华为的代工厂合作伙伴)被限制购买先进的 EUV 光刻机,Ascend 910D 使用 7nm DUV 制造——令人印象深刻,但落后于英伟达的 4N 工艺(基于台积电的 5nm EUV)。

然而,华为:

  • 增加了芯片面积以容纳更多的晶体管。
  • 专注于低频运行以控制热量。
  • 优化了用于 LLM 的矩阵乘法单元,而不是广泛的 AI 工作负载。

这是一款 为特定目的而设计的 芯片,还不是通用的竞争对手。

华为 Ascend 910D 的风险和局限性

尽管 Ascend 910D 首次亮相令人印象深刻,但它面临着关键的局限性:

  • 制造限制:采用 7nm 工艺制造,而竞争对手则转向 5nm 甚至 4nm 工艺。较低的晶体管密度会影响长期竞争力。
  • 内存瓶颈:仅限于旧版本的 HBM 内存,影响超大型模型的训练。
  • 软件生态系统:与英伟达 CUDA 的全球主导地位相比,MindSpore 的采用受到限制。
  • 国际市场准入:美国的制裁限制了华为在中国境外自由销售,欧洲仍然持谨慎态度。

这些因素可能会阻止 Ascend 910D 在国际上复制其国内的成功。

为什么英伟达仍然在全球占据主导地位

英伟达仍然是无可争议的全球 AI 芯片领导者,原因有以下几个战略原因:

  • 全栈优势:除了硬件之外,英伟达还通过 CUDA、TensorRT 和 cuDNN 库控制着 AI 软件世界。
  • 战略云联盟:与 AWS、Microsoft Azure、Google Cloud 的深度集成确保了 Nvidia 硬件嵌入在全球 AI 管道中。
  • 创新步伐:黄仁勋的领导力推动 Nvidia 采取积极的产品更新周期——每 18-24 个月。
  • 财务实力:截至 2025 年 4 月,Nvidia 2.2 万亿美元的市值使华为的芯片部门相形见绌,后者在严格的预算和地缘政治约束下运营。简单来说,当华为还在攀登时,Nvidia 已经建造了这座山

仍然是一场漫长的战斗

昇腾 910D 的发布 подчеркивает 了华为在压力下不断增强的创新能力。它加强了中国国内的 AI 格局,并帮助华为在多年的技术禁运后重拾自豪感。

然而,在全球范围内,Nvidia 的领先地位仍然是决定性的——目前而言。在未来五年内,AI 芯片霸主之争不仅取决于设计更好的芯片,还取决于确保获得尖端制造技术、建立值得信赖的生态系统以及赢得开发者忠诚度

真正的 AI 芯片战争才刚刚开始。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注