作為自適應(yīng)計算領(lǐng)域的探索者,賽靈思(Xilinx)公司在 SC21 超算大會上推出了 Alveo U55C 數(shù)據(jù)中心加速卡,以及一套基于標(biāo)準(zhǔn) API 驅(qū)動、用于大規(guī)模 FGPA 部署的新集群解決方案。前者能夠為高性能計算(HPC)和數(shù)據(jù)庫工作負(fù)載帶來較佳的每瓦性能,并通過該公司的 HPC 集群解決方案實現(xiàn)輕松擴展。
Xilinx 表示,作為該公司迄今為止最強大的 Alveo 加速卡產(chǎn)品線,U55C 專為 HPC 和大數(shù)據(jù)工作負(fù)載打造,在其產(chǎn)品組合中提供了最高的計算密度和高帶寬內(nèi)存(HBM)容量。
結(jié)合基于 Xilinx RoCE v2 的新集群解決方案,擁有大規(guī)模計算工作負(fù)載的廣大客戶,現(xiàn)可利用其已有的數(shù)據(jù)中心基礎(chǔ)設(shè)施和網(wǎng)絡(luò),構(gòu)建基于 FGPA 的更強大 HPC 集群。
Xilinx 數(shù)據(jù)中心事業(yè)部執(zhí)行副總裁兼總經(jīng)理 Salil Raje 表示:擴展的 Alveo 計算能力,已較以往任何時候都更加容易、高效和強大。
從架構(gòu)層面來講,類似 Alveo 的 FPGA 加速卡能夠以低成本、為諸多計算密集型工作負(fù)載提供最高性能。
通過引入一種基于標(biāo)準(zhǔn)方法、允許客戶使用現(xiàn)有基礎(chǔ)設(shè)施和網(wǎng)絡(luò)構(gòu)建的 Alveo HPC 集群,Xilinx 重新為任何規(guī)模的數(shù)據(jù)中心提供了這些關(guān)鍵優(yōu)勢,同時也是在整個數(shù)據(jù)中心更廣泛地采用 Alveo 和自適應(yīng)計算的重大飛躍。
功能特性方面,Alveo U55C 加速卡結(jié)合了當(dāng)今 HPC 工作負(fù)載所需的許多關(guān)鍵功能,包括更高的數(shù)據(jù)管道并行性、較佳的內(nèi)存管理、優(yōu)化的全管道數(shù)據(jù)移動、以及 Alveo 產(chǎn)品組合中最高的每瓦性能。
外形方面,其采用了單槽全高半長(FHHL)的設(shè)計,最大功率僅 150W 。而上代 U280 產(chǎn)品為雙槽設(shè)計,不僅計算密度沒有 U55C 高,HBM 緩存也只有 16GB 的一半。
對于想要打造基于 Alveo 加速器密集集群的數(shù)據(jù)中心客戶來說,U55C 能夠以更小外形提供更多算力,比如需要橫向擴展的高密度流數(shù)據(jù)、高 IO 算數(shù)、以及解決大數(shù)據(jù)分析和 AI 應(yīng)用程序等大型計算問題。
通過 RoCE v2 與數(shù)據(jù)中心橋接,在加上 200 Gbps 的帶寬,API 驅(qū)動的集群解決方案使 Alveo 網(wǎng)絡(luò)能夠在性能和延遲方面與 InfiniBand 展開競爭,而沒有被供應(yīng)商套牢的顧慮。
此外 MPI 集成允許 HPC 開發(fā)人員從 Xilinx Vitis 統(tǒng)一軟件平臺擴展 Alveo 數(shù)據(jù)流水線(橫跨數(shù)百張 Alveo 擴展卡),并利用現(xiàn)成的開放標(biāo)準(zhǔn)和框架,而無需煩心于服務(wù)器平臺 / 網(wǎng)絡(luò)基礎(chǔ)設(shè)施、以及共享工作的負(fù)載和內(nèi)存資源。
軟件開發(fā)人員和數(shù)據(jù)科學(xué)家們,可以利用 Vitis 平臺應(yīng)用程序和集群的高級可編程特性,來充分釋放 Alveo 和自適應(yīng)計算的優(yōu)勢。
支持 Pytorch、Tensorflow 等主要 AI 框架,C、C++、Python 等高級編程語言,以及允許開發(fā)人員使用特定的 API 和庫來構(gòu)建特定領(lǐng)域的解決方案。
或者可以利用 Xilinx 的軟件開發(fā)套件,來輕松加速數(shù)據(jù)中心內(nèi)的現(xiàn)有關(guān)鍵 HPC 工作負(fù)載。
以澳大利亞 CSIRO 研究組織為例,其正在利用 Alveo U55C 為“平方公里陣列射電望遠(yuǎn)鏡”的信號分析處理提供助力,這套系統(tǒng)使得 CSIRO 能夠?qū)崟r聚合、過濾、準(zhǔn)備和處理來自 13.1 萬根天線的大規(guī)模計算任務(wù)。
信號處理集群中的 460 Gbps HBM2 帶寬,由 420 塊 Alveo U55C 加速卡提供服務(wù),后者通過支持 P4 的十萬兆(100 Gbps)交換機完全聯(lián)網(wǎng)在一起,整個集群的總吞吐量為 15 Tbps,兼顧了緊湊空間與成本效益。
(原標(biāo)題:Xilinx推出Alveo U55C高性能計算卡:輕松橫向擴展 售4395美元)