KumoScale™ 軟體

- 重要公告 -

感謝您對 KumoScale™ 軟體 (以下稱「產品」) 感興趣。目前並無計畫推出 3.22 以上的增強版本,因為產品已轉為僅限維護,且不會授予新的評估或生產授權。如有任何問題,請點選此處與我們聯絡。

適用於資料中心的分散式 NVMe-oF™ 儲存管理

KumoScale™ 軟體執行 NVMe™ over Fabrics (NVMe-oF™)。產品透過高速網路連線,在啟動器與目標之間提供快速的網路區塊資料儲存服務。軟體在搭載 NVMe™ SSD 的儲存節點上執行,並實現儲存分散。KumoScale 軟體支援透過 RDMA 和 NVMe over TCP 進行網路傳輸,並提供共用的叢集儲存集區,可在大量 SSD 上透過 NVMe 命名空間進行邏輯分割。與直連式儲存 (DAS) 相比,KumoScale 磁碟區管理功能提供極大的彈性,可以控制由多個大型獨立 SSD 組成的龐大儲存集區。

主要應用

典型應用和使用案例

  • 雲端原生應用的高效能儲存服務
  • OpenStack™ 和 Kubernetes® 的持久性儲存服務
  • 高速區塊儲存服務,適用於 HPC 應用和其他科學應用
  • 適用於 AI/ML/DL 應用的後端儲存裝置

KumoScale™ 軟體可與一般可獲得的 NVMe-oF™ 啟動器軟體及標準型 NVMe SSD 搭配使用。無需專用軟體驅動程式或硬體。

功能

提升儲存利用率,並提高管理集區型快速 NVMe™ SSD 的彈性

最新 PCIe® Gen 4 NVMe SSD 擁有比 PCIe Gen 3 更高的容量和效能,遠超越單一運算節點可消耗的程度。在不同的使用者應用和伺服器/VM 上共用 SSD,是迫切的需求。在 NVMe-oF™ 問世並廣泛傳播之前,網路儲存裝置速度緩慢或昂貴。NVMe-oF™ 改變了這一切。KumoScale™ 軟體藉由共用 SSD、利用 NVMe 命名空間分割共用 SSD,以及增加透過軟體,以 NVMe™ SSD 效能從集區提供適當容量的彈性,達到增加儲存利用率的效果。

支援 RDMA 和 NVMe over TCP 通訊協定

KumoScale 軟體支援 RDMA 和 TCP 傳輸通訊協定。如果您透過 KumoScale 軟體尋求更快、低延遲的儲存服務,建議採用 RoCEv2 (RDMA over Converged Ethenet)。另一方面,如果您偏好現有資料中心網路中的網路相容性,可針對 KumoScale 軟體使用 TCP/IP。如需經過最新 KumoScale 軟體驗證的網路卡,請參閱 HCL (硬體相容性清單)。

調整客戶佈建和遙測架構

  • 對於 OpenStack® ,KumoScale™ 軟體提供 OpenStack Cynder® 驅動程式,支援 Wallaby 及更高版本。
  • 對於 Kubernetes®,容器化應用程式透過 KumoScale™ 容器儲存介面 (CSI) 驅動程式連接到 KumoScale 儲存節點。
  • 對於裸機環境,Ansible™ 教戰手冊或其他熱門的自動化工具可用於部署自動化,以及將儲存裝置佈建至運算節點。
  • 對於遙測整合,KumoScale™ 提供適用介面,為現有的遙測 (時間序列衡量指標) 和記錄 (非同步事件) 基礎架構啟用推/拉資料交換。

資料保護和高可用性

資料保護 - 跨網域資料複寫 (CDDR) -
KumoScale™ 軟體透過稱為跨網域資料複寫 (CDDR) 的技術,提供資料保護。  CDDR 在集區型 SSD 上建立邏輯磁碟區的多個複本,並將其對應至位於不同故障網域的儲存節點。複寫是以啟動器為基礎,而複本可以放置在第 2 或第 3 個 KumoScale™ 儲存節點上。對於複寫,KumoScale 代理程式會在啟動器上執行,以檢查磁碟區可用性。一旦代理程式偵測到磁碟區故障,無論何種原因,磁碟區會自動重新連線至不同儲存節點上的複寫磁碟區。彈性容量從故障中恢復後,所有資料都會自動重建為新的彈性容量。

確保高可用性
KumoScale™ 儲存節點支援 L3 BGP (邊界閘道通訊協定),因此當發生網路連線問題時,網路路徑會根據預先定義的最佳路由表,自動重新路由至可用的網路路徑。

V3.22 焦點

磁碟區遷移:
增強的磁碟區遷移允許管理員在儲存節點之間遷移磁碟區,而不會中斷維護和使用。在將資料移至新位置的過程中,磁碟區會保持連線並持續服務 I/O。該操作對於使用該磁碟區的應用完全透明,可增強儲存叢集的彈性。 

Cluster Manager CLI v2:
增強的 Cluster Manager CLI 擴展了 3.21 CLI v1 的功能,新增 KumoScale™ 控制面板中可用的操作員驅動生命週期自動化功能。3.22 Cluster Manager CLI 現在透過單一直觀的 CLI,提供管理員對叢集服務管理和儲存佈建功能的完全存取權限。

彈性磁碟區等級:
新的彈性磁碟區等級允許資料中心基礎設施供應商,以非複寫磁碟區開始服務租用戶,之後再向上銷售到彈性複寫磁碟區。其允許資料中心基礎設施供應商快速部署租用戶,並在後期增加適當的彈性。

KumoScale™ 3.22 版軟體還包括改良的線上技術文件、Ansible® 重構功能,以便於儲存管理員指令碼修改,以及可修改的叢集 VIP 位址。

架構

資料中心系統架構

KumoScale™ 架構 KumoScale™ 架構

功能 (模組)

1. KumoScale™ 儲存節點
執行 KumoScale™ 軟體的儲存伺服器

2. 資料路徑
透過 NVMe-oF 連接伺服器應用和儲存裝置的網路資料路徑

3. 控制路徑
管理 KumoScale 內部資料服務的網路控制路徑。

4. 佈建服務
找出適當的儲存容量,並依預先定義的參數,從儲存節點提供偏好的 QoS。

5. CSI 驅動程式
KumoScale 的容器儲存介面驅動器。與 CSI 驅動器緊密耦合。

6. 遙測資料庫
用於在伺服器和 KumoScale 儲存節點中儲存各種統計資訊的資料庫。

平台要求

KumoScale™ 軟體在各種業界標準伺服器上,經過裸機、OpenStack 和 Kubernetes® 部署測試。可以使用任何 NVMe-oF™ 相容啟動器,包括 Linux® 核心 4.8 或更新版本。支援的平台如下所示。

元件

最低要求

記憶體

64GB DDR4

系統磁碟

2 x 128 GB SATA DOM

NIC

  • MCX516A-CCAT 或 MCX545A-CCAN ConnectX®-5 EN 網路介面卡、100GbE 雙/單連接埠 QSFP28、PCIe® 3.0 x16 ROHS R6
  • MCX416A-CCAT ConnectX®-4 EN 網路介面卡、100GbE 雙/單連接埠 QSFP28、PCIe® 3.0 x16 ROHS R6
  • Intel® 810

電源供應

雙電源,熱插拔

管理介面

專用管理連接埠為選配。KumoScale™ 可以使用資料連接埠管理流量,也可以使用專用的管理連接埠。

KumoScale™ 佈建器

KumoScale™ 佈建器不需要任何額外的伺服器或容器。

V3.22 使用手冊

KumoScale V3.22 使用者手冊包括:

  • 硬體相容性清單 (HCL)
  • 我應該使用哪種 KumoScale 部署模式?
  • 版本資訊
  • 設備模式安裝指南
  • Kubernetes 管理模式安裝指南
  • NVMe™ 主機修補程式
  • 使用者指南
  • Cluster Manager CLI
  • Kubernetes™ CSI 驅動程式指南
  • Openstack™ 使用者指南
  • Provisioner REST API 指南
  • KumoScale Metric Collection
  • Grafana™ Dashboard 指南
  • Ansible™ 使用者指南

文件

本文件說明 KumoScale™ 軟體概觀、功能和優勢,以及用於部署的典型使用案例和環境資訊。

本文件討論為 KumoScale 提供資料保護的跨網域資料複寫的架構和部署。KumoScale CDDR 可在系統出現問題時,實施保護和自動自我修復機制。

本文件討論相較於以資料中心規模提供類似儲存系統功能的 Ceph,作為 NVMe-oF™ 目標執行的 KumoScale™ 應用軟體所具備的效能優勢。

本文件討論在 PCIe® Gen 4 伺服器平台和 CM6 SSD 上,KumoScale™ 作為 NVMe-oF™ 目標執行並搭配 RDMA 傳輸的效能測試結果。效能結果包括單一 SSD 效能,以及透過增加 SSD 數量實現的擴充能力。

除了現有的 NAND 記憶體裝置 ECC 技術之外,KIOXIA 還進一步開發出更準確的可靠性演算法。本文件討論 KIOXIA 內部使用 KumoScale™ 軟體的案例,該軟體在此案例中為機器學習和深度學習處理執行快速區塊儲存。

快速區塊儲存對 AI/ML 處理而言越來越重要。本文件討論 KumoScale™ 軟體的 NVIDIA GPUDirect 儲存空間和 NVMe™ 儲存空間結合的測試結果,以及此結合如何減少整個工作流程的處理時間。

產品諮詢

請透過諮詢表與我們聯絡。

  • 諮詢前請同意「重要事項」,然後在諮詢表的「產品」中選擇 KumoScale 以聯絡我們。
  • 包含的資訊,例如價格、規格、服務和聯絡方式,以公告日期為準。
  • :與 DAS 相比,在 4KB 讀取時會增加 15us 的延遲。由 KIOXIA 於 2020 年 6 月使用 KIOXIA 指定的測量工具測量。15us 是 DAS 和 NVMe-oF™ 儲存配置在相同硬體上進行 4KB 讀取的延遲差異。
  • NVMe 與 NVMe-oF 是 NVM Express, Inc. 在美國及其他國家/地區的註冊或未註冊商標。
  • PCIe 是 PCI-SIG 的註冊商標。
  • Kubernetes 是 Linux Foundation 在美國及/或其他國家/地區的註冊商標。
  • Ansible 是 Red Hat, Inc. 在美國及其他國家/地區的註冊商標。
  • Linux 是 Linus Torvalds 在美國和其他國家/地區的註冊商標。
  • OpenStack 文字標誌是 OpenStack Foundation 在美國和其他國家/地區的註冊商標,經 OpenStack Foundation 許可使用。我們不附屬於 OpenStack Foundation 或 OpenStack 社群,亦不受其背書或贊助。
  • Prometheus 是 Linux Foundation 的註冊商標。
  • Grafana 與 Loki 是 Grafana Labs, Inc. 的商標或註冊商標。
  • Intel 是 Intel Corporation 或其子公司的商標。
  • 本處提及的其他所有公司名稱、產品名稱及服務名稱,商標權益分別隸屬於個別公司