Please select your location and preferred language where available.
KIOXIA AiSAQ™ 技術以開放原始碼軟體的方式發佈,旨在降低生成式 AI 系統中的 DRAM 要求
軟體技術透過使用 SSD 改善 RAG 工作流程中的向量資料庫擴展和準確性
- 2025 年 1 月 28 日
- 鎧俠株式會社
【東京訊】全球記憶體解決方案領導廠商鎧俠株式會社,今日宣佈以開放原始碼方式發佈其全新 All-in-Storage ANNS with Product Quantization (AiSAQ) 技術(1)。KIOXIA AiSAQ™ 軟體透過針對 SSD 最佳化的新型「最近鄰」搜尋 (ANNS) 演算法,為檢索增強生成 (RAG) 提供可擴充的效能,不需要將索引資料放在 DRAM 中,直接在 SSD 上即可進行搜尋。
生成式 AI 系統需要大量的運算、記憶體和儲存資源。雖然這些系統有潛力推動各產業取得顛覆性的突破,但其部署通常伴隨著高成本。RAG 是人工智慧的關鍵階段,運用公司或應用程式的特定資料來改善大型語言模型 (LLM)。
RAG 的中央元件是向量資料庫,可累積特定資料並將其轉換為資料庫中的特徵向量。RAG 還利用 ANNS 演算法,該演算法根據累積向量和目標向量之間的相似性,來識別改進模型的向量。RAG 要有效,必須能快速檢索與查詢最相關的資訊。傳統上,ANNS 演算法部署在 DRAM 中,以達到進行這些搜尋所需的高速效能。
KIOXIA AiSAQ 技術為十億規模的資料集提供可擴充且高效率的 ANNS 解決方案,記憶體使用率和快速索引切換功能所耗用的資源幾乎可忽略不計。
KIOXIA AiSAQ 技術的主要優勢:
- 允許大規模資料庫在不依賴有限的 DRAM 資源的情況下運行,進而增強 RAG 系統的效能。
- 無需將索引資料載入 DRAM,向量資料庫能夠立即啟動。這可支援在同一伺服器上,在使用者特定或應用程式特定資料庫之間無縫切換,實現高效的 RAG 服務交付。
- 針對雲端系統最佳化,透過將索引儲存在分散的儲存空間中,以在多個伺服器之間共用。此方法可動態調整特定使用者或應用程式的向量資料庫搜尋效能,並促進實體伺服器之間的搜尋執行個體快速移轉。
鎧俠以開放原始碼軟體的方式,為其社群貢獻創新的 KIOXIA AiSAQ 技術,展現其推動人工智慧發展的承諾。
註:
- 請透過連結前往瞭解 KIOXIA AiSAQ 開放原始碼發佈。
https://github.com/kioxiaamerica/aisaq-diskann
- 公司名稱、產品名稱和服務名稱可能是第三方公司的商標。
關於鎧俠
鎧俠是記憶體解決方案的全球領導者,致力於開發、生產和銷售快閃記憶體和固態硬碟 (SSD)。2017 年 4 月,其前身東芝記憶體從東芝記憶體株式會社獨立出來,該公司於 1987 年發明 NAND 快閃記憶體。鎧俠致力推出可為客戶帶來更多選擇並為社會創造更多價值的產品、服務和系統,期望能透過記憶體技術促進世界發展。鎧俠的創新 3D 快閃記憶體技術 BiCS FLASH™ 正在形塑高密度儲存應用的未來,包括先進的智慧型手機、電腦、自動化系統、資料中心及生成式 AI 系統。
客戶諮詢:
鎧俠集團
全球銷售據點
Information in this document, including product prices and specifications, content of services and contact information, is correct on the date of the announcement but is subject to change without prior notice.