Top500：中国退出全球超级计算机竞赛

对于 Top500 来说，坏消息是：中美之间的技术冷战让中国对参与不感兴趣。

译自 Top500: China Opts Out of Global Supercomputer Race，作者 Agam Shah。

根据周一发布的最新 Top500 最快超级计算机列表，美国拥有全球两台最快的计算机，突显了该国在硬件方面的重大进展。

但中国——曾经是全球最快超级计算机的所在地——选择对其在超级计算领域的进步保持沉默。

中国已经拥有强大的百亿亿次系统，但它正在保护这些系统，以防竞争对手窥探其秘密的技术基础设施。

Top500 列表根据该组织规定的基准，评选出全球 500 台最快的计算机。Top500 列表极具影响力，但中国——曾经的积极参与者——已经对它失去了兴趣。

最新列表中的前两个系统安装在美国政府实验室，是已知唯一总性能超过 1 百亿亿次的计算机。

中国的百亿亿次超级计算机可能与最快的美国系统一样强大。该国尚未与 Top500 组织共享有关这些系统的信息。

Top500 组织在一份新闻稿中表示：“事实上，中国没有为这个新列表报告任何新机器。”

美国有 168 个系统（11 月份时是 161），中国有 80 个（之前是 104），在最新的 Top500 列表中拥有最多的条目。

新时代冷战

美国限制了高性能芯片（包括最新的 AI 芯片——包括尖端的 NVIDIA GPU）对中国的出口。其目标是扼杀中国在需要最新芯片的 AI 领域的进步。

美国还禁止出口 ASML 公司用于制造先进移动、AI、PC 和服务器芯片的工具。但中国的华为最近发布了一款搭载 7 纳米芯片的智能手机，而美国在限制出台后认为这是无法实现的。

据报道，中国半导体制造公司中芯国际现在正在使用 5 纳米工艺制造芯片，落后于台湾半导体制造公司制造的最新芯片一代。

中芯国际的芯片使用旧的制造工具制造，而且人们怀疑中国是否能超越该节点。

美国实施的贸易限制迫使中国专注于技术自给自足。该国正在向硬件开发投入数十亿美元。

3 月份，中国禁止在政府电脑中使用 AMD 和英特尔的 x86 芯片。中国要求电脑使用国产芯片。现有的国产芯片，包括龙芯，无法达到英特尔或 AMD 最新处理器的尖端性能。

中国还在向 RISC-V 指令集架构投入资金，该架构是 x86 和 ARM 架构的替代品。

RISC-V 芯片还远未成熟，但数百家中国公司正在为移动设备、PC 和服务器开发 RISC-V CPU。值得注意的是，阿里巴巴已经发布了开源服务器 RISC-V CPU 设计。

超级计算机对国家的国家和经济利益至关重要。这些系统用于开发武器、维护核武器库存和进行经济预测。

当今最快的超级计算机名为 Frontier，由美国能源部橡树岭国家实验室托管。它运行在 AMD 的第三代 Epyc CPU 和 MI250X GPU 上，峰值性能为 1.2 百亿亿次浮点运算。

第二快的超级计算机 Aurora 由能源部的阿贡国家实验室托管。该系统运行在英特尔的 CPU 和 GPU 上，并且仅进行了部分基准测试。

Aurora 的峰值性能可达 2 百亿亿次浮点运算，当基准测试完成后，该系统可能会将 Frontier 从榜首拉下马。但该系统消耗了大量的电力。

超级计算基准测试通常称为高性能 Linpack，需要进行大量微调，直到达到性能阈值。

美国政府规定，在向系统构建商发放合同时，超级计算机必须满足指定的基准要求。HPE 是 Frontier 和 Aurora 的承包商。

中国通过研究论文展示了其百亿亿次系统。Next Platform 也挖掘了一些有关这些系统的详细信息。

去年，一个关于 1.5 百亿亿次系统的中国研究项目被提名角逐最高超级计算荣誉——戈登·贝尔（Gordon Bell）奖。

除了百亿亿次系统，Top500 榜单上最快的中国系统是太湖之光，目前排名第 13 位。该系统最高可达 93 petaflops，比当今的百亿亿次超级计算机慢 10 倍以上。

太湖之光在 2016 年和 2017 年是世界上最快的系统，直到 2018 年被使用 IBM Power9 芯片的 ORNL 的 Summit 系统推翻。

第二快的中国系统天河二号 A 排在 Top500 榜单的第 16 位。它是 2013-2016 年世界上最快的超级计算机。

中国提交的不足已让 Top500 组织者陷入困境。该榜单不再提供世界上最快系统的全部可见性。

然而，组织者表示，他们正在与中国同行合作，以获取有关系统类型的详细信息。

Top500 榜单正在快速老化，自 2017 年以来，新系统的数量有所下降。Top500 系统的平均年龄现在为 30 个月，而 2018-2019 年的平均年龄为 15 个月。

较新的系统专注于人工智能，具有更快的内存和吞吐量。系统构建者也更注重系统的能效，而不是性能。

包括谷歌、微软和亚马逊在内的云制造商正在投入数十亿美元来围绕人工智能构建其计算基础设施，人工智能使用混合精度技术进行确定性计算，这是人工智能风格计算的默认设置。

人们对名为“El Capitan”的 2 百亿亿次超级计算机的期待与日俱增，该超级计算机已经在劳伦斯利弗莫尔国家实验室建造中。它可能会在 11 月的下一个 Top500 榜单中首次亮相。

El Capitan 拥有 AMD 的 CPU 和升级的 MI300 GPU，与 Nvidia 的 GPU 竞争。该超级计算机专为人工智能和高精度科学应用而设计。

欧洲即将推出的百亿亿次超级计算机，称为 Jupiter 和 Jules Vernes，具有模块化设计，其中量子和人工智能计算5藕片00模块可以根据需要快速插入到基础设施中。