来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢。
一个欧洲大学生团队拼凑出第一台能够显示平衡功耗和性能的 RISC-V 超级计算机。
更重要的是,它展示了 RISC-V 在高性能计算和代理方面的潜在前进道路,为欧洲摆脱对美国芯片技术的完全依赖提供了机会。
“Monte Cimone”集群不会很快处理大规模的天气模拟等,因为它只是一台实验机器。也就是说,它确实表明,低功率包络的性能牺牲并不一定像许多人认为的那样戏剧化。
由博洛尼亚大学和意大利最大的超级计算中心 CINECA 的人员构建的六节点集群是更广泛的学生集群竞赛的一部分,旨在展示除浮点能力之外的各种 HPC 性能元素。名为 NotOnlyFLOPs 的集群构建团队希望在使用 SiFive 的 Freedom U740 片上系统时建立 RISC-V 的电源性能配置文件。
这个2020 年推出的 SoC 有五个 64 位 RISC-V CPU 内核——四个 U7 应用程序内核和一个 S7 系统管理内核——2MB 二级缓存、千兆以太网以及各种外围设备和硬件控制器。它可以运行到大约 1.4GHz。
以下是 Monte Cimone 的组件以及进给和速度:
六台双板服务器,外形尺寸为 4.44 厘米 (1U) 高、42.5 厘米宽、40 厘米深。每块板都遵循行业标准 Mini-ITX 外形尺寸(每 170 毫米 170 毫米);
每块主板配备一个 SiFive Freedom U740 SoC 和 16GB 的 64 位 DDR 内存,运行速度为 1866s MT/s,以及一个运行速度为 7.8 GB/s 的 PCIe Gen 3 x8 总线、一个千兆以太网端口和 USB 3.2 Gen 1 接口;
每个节点都有一个 M.2 M-key 扩展槽,由操作系统使用的 1TB NVME 2280 SSD 占用。每块板上都插有一张 microSD 卡,用于 UEFI 启动;
每个节点内部集成了两个 250 W 电源,以支持硬件和未来的 PCIe 加速器和扩展板。
每个节点的俯视图,显示了两个 SiFive Freedom SoC 板
Freedom SoC 主板本质上是 SiFive 的 HiFive Unmatched 主板。正如大多数超级计算机使用的那样,六个计算节点中的两个配备了 Infiniband 主机通道适配器 (HCA)。目标是部署 56GB/s Infiniband 以允许 RDMA 勉强实现 I/O 性能。
这对于一个年轻的架构来说是雄心勃勃的,而且并非没有一些小问题。“供应商目前仅支持 PCIe Gen 3 通道,”集群团队写道。
“第一个实验结果表明,内核能够识别设备驱动程序并挂载内核模块来管理 Mellanox OFED 堆栈。由于尚未确定软件堆栈和内核驱动程序的不兼容性,我们无法使用 HCA 的所有 RDMA 功能。尽管如此,我们还是成功地在两个板之间以及一个板和一个 HPC 服务器之间运行了 IB ping 测试,表明完全支持 Infiniband 是可行的。这是目前正在开发的功能。”
事实证明,HPC 软件堆栈比人们想象的要容易。“我们在 Monte Cimone 上移植了在生产环境中运行 HPC 工作负载所需的所有基本服务,即 NFS、LDAP 和 SLURM 作业调度程序。将所有必要的软件包移植到 RISC-V 相对简单,因此我们可以声称将 Monte Cimone 暴露为 HPC 设施中的计算资源没有任何障碍,”该团队指出。
虽然它是对超级计算行列的一个值得注意的架构补充,但像这样的 RISC-V 集群不太可能进入世界上最快系统的 500 强名单。它的设计规范是低功耗的主力,而不是浮点怪物。
正如开发团队在对系统的详细描述中指出的那样,“Monte Cimone 的目标不是实现强大的浮点性能,而是为了“启动管道”并探索集成多节点的挑战而构建的。RISC-V 集群能够提供 HPC 生产堆栈,包括 RISC-V 硬件上的互连、存储和电源监控基础设施。”
E4 Computer Engineering 担任“Monte Cimone”集群的集成商和合作伙伴,该集群最终将成为这将为进一步测试 RISC-V 平台本身及其与其他架构良好配合的能力铺平道路,这是一个重要元素因为至少在未来几年内我们不太可能看到百亿亿级的 RISC-V 系统。
根据 E4 的说法,“Cimone 使开发人员能够在丰富的软件堆栈中测试和验证科学和工程工作负载,包括开发工具、消息传递编程库、BLAS、FFT、HS 网络驱动程序和 I/O 设备。目标是实现一个面向未来的位置,能够解决和利用 RISC-V ISA 的功能,用于科学和工程应用以及操作环境中的工作负载。”
CINECA 的 HPC 专家 Daniele Cesarini 博士:“作为一个超级计算中心,我们对支持科学界的 RISC-V 技术非常感兴趣。我们很高兴能为支持安装和调整广泛使用的科学代码和数学库的 RISC-V 生态系统做出贡献,以推动高性能 RISC-V CPU 的开发。我们相信 Monte CIMONE 将成为下一代基于 RISC-V 技术的超级计算机的先驱,我们将继续与 E4 计算机工程和博洛尼亚大学协同工作,以证明 RISC-V 已准备好继续留在高性能计算巨头的肩膀。”
欧洲有大量的 RISC-V 资金和项目,尽管这些努力的成果可能需要数年才能看到。现在,就连英特尔也在关注超级计算的未来。这完全是一个 RISC-Y(你看到了即将到来的)赌注,但在欧洲很少有本土建筑选择,至少挑选一个早期的赢家很容易。
一个欧洲大学生团队拼凑出第一台能够显示平衡功耗和性能的 RISC-V 超级计算机。
更重要的是,它展示了 RISC-V 在高性能计算和代理方面的潜在前进道路,为欧洲摆脱对美国芯片技术的完全依赖提供了机会。
“Monte Cimone”集群不会很快处理大规模的天气模拟等,因为它只是一台实验机器。也就是说,它确实表明,低功率包络的性能牺牲并不一定像许多人认为的那样戏剧化。
由博洛尼亚大学和意大利最大的超级计算中心 CINECA 的人员构建的六节点集群是更广泛的学生集群竞赛的一部分,旨在展示除浮点能力之外的各种 HPC 性能元素。名为 NotOnlyFLOPs 的集群构建团队希望在使用 SiFive 的 Freedom U740 片上系统时建立 RISC-V 的电源性能配置文件。
这个2020 年推出的 SoC 有五个 64 位 RISC-V CPU 内核——四个 U7 应用程序内核和一个 S7 系统管理内核——2MB 二级缓存、千兆以太网以及各种外围设备和硬件控制器。它可以运行到大约 1.4GHz。
以下是 Monte Cimone 的组件以及进给和速度:
六台双板服务器,外形尺寸为 4.44 厘米 (1U) 高、42.5 厘米宽、40 厘米深。每块板都遵循行业标准 Mini-ITX 外形尺寸(每 170 毫米 170 毫米);
每块主板配备一个 SiFive Freedom U740 SoC 和 16GB 的 64 位 DDR 内存,运行速度为 1866s MT/s,以及一个运行速度为 7.8 GB/s 的 PCIe Gen 3 x8 总线、一个千兆以太网端口和 USB 3.2 Gen 1 接口;
每个节点都有一个 M.2 M-key 扩展槽,由操作系统使用的 1TB NVME 2280 SSD 占用。每块板上都插有一张 microSD 卡,用于 UEFI 启动;
每个节点内部集成了两个 250 W 电源,以支持硬件和未来的 PCIe 加速器和扩展板。
每个节点的俯视图,显示了两个 SiFive Freedom SoC 板
Freedom SoC 主板本质上是 SiFive 的 HiFive Unmatched 主板。正如大多数超级计算机使用的那样,六个计算节点中的两个配备了 Infiniband 主机通道适配器 (HCA)。目标是部署 56GB/s Infiniband 以允许 RDMA 勉强实现 I/O 性能。
这对于一个年轻的架构来说是雄心勃勃的,而且并非没有一些小问题。“供应商目前仅支持 PCIe Gen 3 通道,”集群团队写道。
“第一个实验结果表明,内核能够识别设备驱动程序并挂载内核模块来管理 Mellanox OFED 堆栈。由于尚未确定软件堆栈和内核驱动程序的不兼容性,我们无法使用 HCA 的所有 RDMA 功能。尽管如此,我们还是成功地在两个板之间以及一个板和一个 HPC 服务器之间运行了 IB ping 测试,表明完全支持 Infiniband 是可行的。这是目前正在开发的功能。”
事实证明,HPC 软件堆栈比人们想象的要容易。“我们在 Monte Cimone 上移植了在生产环境中运行 HPC 工作负载所需的所有基本服务,即 NFS、LDAP 和 SLURM 作业调度程序。将所有必要的软件包移植到 RISC-V 相对简单,因此我们可以声称将 Monte Cimone 暴露为 HPC 设施中的计算资源没有任何障碍,”该团队指出。
虽然它是对超级计算行列的一个值得注意的架构补充,但像这样的 RISC-V 集群不太可能进入世界上最快系统的 500 强名单。它的设计规范是低功耗的主力,而不是浮点怪物。
正如开发团队在对系统的详细描述中指出的那样,“Monte Cimone 的目标不是实现强大的浮点性能,而是为了“启动管道”并探索集成多节点的挑战而构建的。RISC-V 集群能够提供 HPC 生产堆栈,包括 RISC-V 硬件上的互连、存储和电源监控基础设施。”
E4 Computer Engineering 担任“Monte Cimone”集群的集成商和合作伙伴,该集群最终将成为这将为进一步测试 RISC-V 平台本身及其与其他架构良好配合的能力铺平道路,这是一个重要元素因为至少在未来几年内我们不太可能看到百亿亿级的 RISC-V 系统。
根据 E4 的说法,“Cimone 使开发人员能够在丰富的软件堆栈中测试和验证科学和工程工作负载,包括开发工具、消息传递编程库、BLAS、FFT、HS 网络驱动程序和 I/O 设备。目标是实现一个面向未来的位置,能够解决和利用 RISC-V ISA 的功能,用于科学和工程应用以及操作环境中的工作负载。”
CINECA 的 HPC 专家 Daniele Cesarini 博士:“作为一个超级计算中心,我们对支持科学界的 RISC-V 技术非常感兴趣。我们很高兴能为支持安装和调整广泛使用的科学代码和数学库的 RISC-V 生态系统做出贡献,以推动高性能 RISC-V CPU 的开发。我们相信 Monte CIMONE 将成为下一代基于 RISC-V 技术的超级计算机的先驱,我们将继续与 E4 计算机工程和博洛尼亚大学协同工作,以证明 RISC-V 已准备好继续留在高性能计算巨头的肩膀。”
欧洲有大量的 RISC-V 资金和项目,尽管这些努力的成果可能需要数年才能看到。现在,就连英特尔也在关注超级计算的未来。这完全是一个 RISC-Y(你看到了即将到来的)赌注,但在欧洲很少有本土建筑选择,至少挑选一个早期的赢家很容易。