作者:匿名 2024年9月4日 下午5:11
传统处理架构在面对大数据集时,存储器和网络访问的瓶颈往往成为性能提升的主要障碍。无论是存储器还是网络接口,传统架构中的DDR4存储器在处理高性能计算时经常成为限制性能的瓶颈。
这其中,CPU通过PCle连接多个器件,这种“芯片对芯片”的连接方式在存储器和网络访问方面存在明显的瓶颈,无法满足大数据集处理的需求。
网络附加、硬件加速
AMD Alveo™ V80计算采用了Versal HBM解决方案,通过集成高带宽存储器(HBM)和自适应SoC,有效解决了传统架构中的内存瓶颈问题。HBM提供了超高的带宽,能够支持从10G到800G的广泛工作负载,提高了数据传输速率,减少了对DDR4等外部芯片的依赖。通过这种方式,Alveo™ V80实现了性能的最大化,同时降低了功耗和时延。
AMD 自适应和嵌入式计算事业部( AECG )高级产品线经理Shyam Chander坦言,HBM和其他Versal器件的结合,使其能够有效解决内存和网络访问的瓶颈问题,不再需要依赖DDR4或其他外部芯片。”
AMD自适应和嵌入式计算事业部( AECG )高级产品线经理 Shyam Chander
在提升数据传输速率方面,Alveo™ V80支持的工作负载范围广泛,能够处理多种协议,速率有所提高。其PCIe Gen5的接口支持64G传输速率,是第四代的2倍,显著提升了数据传输效率。
面对降低功耗和时延问题,通过高效的HBM和Versal器件组合,Alveo™ V80能够实现性能最大化,同时减少功耗、占板面积及时延。安全连接和灵活应变的计算能力进一步提升了整体性能。
为解决开发周期冗长问题,AMD为Alveo™ V80提供了全面的开发工具支持,包括熟悉的Vivado™设计套件和丰富的示例设计。这些工具和框架不仅缩短了开发周期,还帮助开发者更好地发挥硬件的潜力,实现快速部署和价值最大化。通过使用Vivado™工具,Alveo硬件开发者能够实现价值最大化,并且加速开发流程,缩短产品上市时间。
Shyam Chander强调说:“为进一步增强了客户的信心,AMD提供了年质保和五年期生命周期规划。
在提升处理密集型工作负载的效率方面,Alveo™ V80能够应对多种大数据工作负载,包括高性能计算、数据分析、金融科技、网络安全和AI计算等。其优化的DSP计算逻辑片使其在处理复杂计算任务时表现卓越,提升至高2倍的性能,使其能够快速处理大量数据。
“Alveo™ V80可以应对许多大数据工作负载,包括高性能计算中的基因组学和传感器处理、数据分析(如欺诈检测)等。”Shyam Chander如是说。
整体而言,Alveo V80 加速卡由 Versal HBM 自适应 SoC 设备驱动,具有超过 820 GB/s 的高带宽存储器 (HBM2e),打破了性能瓶颈。该卡还具有 400G 加密引擎,用于内联网络监控和数据包检查,多百吉比特以太网核心,以及满足巨大网络带宽需求的 112G PAM4 和 32G NRZ 收发器。
为了实现可扩展性和计算集群,V80 加速卡经过优化,最大限度地增强了与网络、CPU 主机、板载内存和 NVMe 存储驱动器的连接性。具体而言,该卡集成了 QSFP56 光学接口、PCIe Gen4 和 Gen5 接口、用于内存扩展的 DDR4 DIMM 插槽,以及 Mini Cool Edge I/O (MCIO) 连接器,以 PCIe® Gen5 速度在计算和存储节点之间进行扩展。
来源:AMD
与上一代产品相比,Alveo™ V80性能和功能优化主要得益于许多硬件功能的集成。对标的Alveo™ U55C,Alveo™ V80在多个方面实现了显著提升。存储器带宽提升至高1.8倍,逻辑密度提升至高2倍,网络带宽从200GB每秒提升至800GB每秒,至高4倍,PCle带宽提升至高2倍。这些参数表明,V80在从第四代到第五代的过渡中,实现了全面的性能提升。
Shyam Chander补充说:“Alveo™ V80还拥有大量DSP计算逻辑片,提供较前代产品至高2到3倍的DSP性能。此外,V80还具备硬化与计算基础设施的连接,也就是所谓的‘超级通路’,实现轻松集成。”
内存密集型和大数据工作负载的“加速利器”
Alveo™ V80的应用范围广泛,涵盖了从高性能计算到金融科技再到网络安全的多个领域。在基因组学、分子动力学、传感器处理、数据分析等高性能计算任务中,Alveo™ V80表现都较为出色。
联邦科学与工业研究组织CSIRO是澳大利亚国家级研究机构,参与了世界最大射电天文天线阵列的建设。在建设过程中,CSIRO一度面临是工作负载越来越复杂的挑战,需要迅速扩展计算资源,同时还要在有限的机架空间内优化设备的使用。
通过使用Alveo™ V80,CSIRO成功解决了这些问题。V80在相近的总拥有成本(TCO)下,较之前的产品实现了3倍的算力提升,同时减少了所需的机架空间和计算功耗。
Shyam Chander解释道:“CSIRO选择了Alveo™ V80,以扩展计算性能并提升Versal上的DSP引擎,从而降低时延,实现高精度和实时工作负载。V80的DSP58功能得到了增强,性能较前代产品提升了至高2至3倍。”
在网络安全方面,随着网络攻击的不断升级,网络安全问题愈发重要。Alveo™ V80通过集成高带宽核心和硬化加密引擎,为网络安全提供了坚实的保障。其至高800G的内嵌IPSec和HBM缓冲技术,能够有效管理流量,确保数据在传输过程中的安全性。
Shyam Chander指出:“如今,企业客户普遍重视网络安全,Alveo™ V80能够提供坚固的网络安全保障,防止网络攻击。通过下一代防火墙,Alveo™ V80不仅确保了安全性,还进一步提升了网络流量管理能力。”
金融科技领域对计算速度和数据处理能力有着极高的要求,金融科技领域包括风险分析和算法交易,还有网络安全中的数据包监控,以及存储领域的压缩工作负载。在建模仿真与回测的用例中,Alveo™ V80可用于密集计算的架构与DSP,其752Mb的RAM用于定价数据、交易记录,在低时延算法交易场景下,还能加速交易策略和期权定价。而HBM则用于大数据集以及历史定价数据,以及订单信息方面。
面向传统的FPGA开发人员,由于他们很多的设计采用的是Vivado™设计套件,故而其对硬件描述语言非常熟悉,支持定制和优化AMD为Alveo™ V80提供了丰富的示例设计,可以帮助开发者快速上手并开始项目。这些示例设计涵盖了各种应用场景,为开发者提供了实用的参考和指导,帮助他们在最短的时间内实现硬件设计和部署。
快速上市,始终都是Alveo™V80重要的价值定位,AMD Alveo™ V80的设计使其能够快速上市并进行部署。通过提供预构建的硬化功能和全面的开发支持,AMD帮助客户避免了系统集成任务,Shyam Chander强调:“我们进行了大量的热处理检测,确保产品及时可用,并提供了三年的质保。”
写在最后
随着AI时代的开启,计算场景下的数据量和复杂度的持续增加,对计算加速的需求不断上升。作为AMD首款大规模市场的加速卡产品,Alveo™ V80的推出通过显著提升计算性能和存储带宽,满足了市场对高性能和高灵活性计算解决方案的需求,特别是在实时数据处理和复杂算法优化方面,其优势将更加明显。其强大的性能和灵活性,将在高性能计算(HPC)、云计算和边缘计算等领域产生重要影响,帮助更多行业实现更高效的数据处理和更智能的决策支持。
据Shyam Chander透露,目前,Alveo™ V80已经向全球客户提供出货。