• 業務挑戰:

隨著國家“東數西算”工程在算力建設方面的逐步展開,運營商成為算力建設的主力軍,智慧算力通過算網輻射全國,使算力資源成為社會級服務。 然而,由於傳統的算力通過硬體管道進行資源分配,無法實現算力資源使用服務化,存在顆粒度粗、調整難度大、形式單一、成本高、門檻高等問題。

  • 方案簡介:

boyue 通過軟件定義各類異構算力,實現統一調度,統一管理的資料中心級異構算力資源池,幫助運營商企業更好的管理與分配算力資源。boyue改變算力資源傳統使用管道,應用以算力1%,顯存1MB為基本組織進行異構算力資源申請。 針對多卡應用,遮罩底層資源分佈細節,通過聲明式資源申請,將資源池內可用算力資源快速綜合到虛擬機器或容器中。 軟件定義异構算力資源,算力、顯存彈性伸縮,動態掛載,虛擬機器或容器無需重啓。 應用部署無需關心所在服務器是否配寘異構算力晶片,異構算力資源可通過網絡遠程調用。 

  • 方案價值:

  1. 通過軟件定義算力,實現算力彈性使用,通過隨需應變、化整為零、化零為整、隔空取物幫助各類業務實現算力自由。

  2. 業內領先能實現多廠商算力池化並將國產晶片與英偉達晶片統一納管統一調度的異構資源池化解決方案。

  3. 實現在多種雲環境下的GPU共亯能力。

  4. 大幅提升GPU資源使用靈活性。

  5. 無需改變當前AI應用程式碼和使用習慣,通用性强。

  6. 實現虛擬GPU、物理GPU、國產晶片統一調度和共亯使用。

  7. 提高GPU資源的利用率和使用靈活性,降低運維複雜度,提升人效。

  8. 彌補開源方案科技短板(池化能力優先,無法支持國產,安全隔離性低等)。

  • 解決方案架構圖