NVIDIA 今日宣布已完成收購 Slurm 的主要開發者SchedMD。Slurm為用於高效能運算(HPC)與人工智慧(AI)的開源工作負載管理系統。此次收購將有助於強化開源軟體生態系,並為研究人員、開發者與企業推動 AI 創新。
NVIDIA 將持續以開源、供應商中立軟體的形式開發並發布 Slurm,讓 Slurm 得以在多元硬體與軟體環境中,持續被更廣泛的高效能運算與 AI 社群採用與支援。
高效能運算與 AI 工作負載往往涉及複雜運算,需在叢集上以平行方式執行多項任務,因此必須具備佇列、排程,以及運算資源分配等能力。隨著高效能運算與 AI 叢集規模日益擴大、效能持續提升,如何有效利用資源,已成為關鍵。
Slurm 在可擴展性、輸送量及複雜政策控管等方面,為領先的工作負載管理器與作業排程器。在 TOP500 超級電腦排行榜中,前 10 名與前 100 名系統有一半以上採用 Slurm。
Slurm 支援最新 NVIDIA 硬體,同時也是生成式 AI 所需的關鍵基礎設施之一。基礎模型開發者與 AI 建置團隊會使用 Slurm 來管理模型訓練與推論需求。
SchedMD 執行長 Danny Auble 表示:「我們很高興能與 NVIDIA 攜手合作。這次收購可說是對 Slurm 在全球最嚴苛的高效能運算與 AI 環境中扮演關鍵角色的最佳肯定。NVIDIA 在加速運算領域深厚的專業與投入,將強化 Slurm 的發展,以滿足下一代 AI 與超級運算的需求。Slurm 也將持續維持開源的形式。」
NVIDIA 與 SchedMD 已合作超過十年,並將持續投入 Slurm 的開發,確保其維持為高效能運算與 AI 領域首屈一指的開源排程器。
NVIDIA 也將加速 SchedMD 對新系統的導入,讓使用 NVIDIA 加速運算平台的用戶,能在整體運算基礎設施上最佳化工作負載。同時SchedMD也將支持多元硬體與軟體生態系,協助客戶在異質叢集中採用最新 Slurm 創新功能。
NVIDIA 亦將持續為 SchedMD 數百家客戶提供 Slurm 的開源軟體支援、訓練與開發服務。這些客戶涵蓋雲端服務供應商、製造商、AI 公司與研究實驗室,橫跨自動駕駛、醫療與生命科學、能源、金融服務、製造與政府等產業。
NVIDIA 與 SchedMD 將共同強化開源軟體生態系,進一步催化各產業、各種規模的高效能運算與 AI 創新。