Full-stack GenAI-lösning från HPE
Hewlett Packard Enterprise har ingått ett utökat strategiskt samarbete med NVIDIA med målet att bygga en företagslösning för generativ AI (GenAI).
När företag utvecklar och distribuerar GenAI-modeller för användningsområden som sökning i konversationer, automatisering av affärsprocesser och skapande av innehåll, behöver de en mjukvaru- och infrastrukturstack som kan distribueras snabbt och från varhelst verksamheten behöver den. Den nya företagslösningen för generativ AI är en del av ett utökat samarbete mellan HPE och NVIDIA som levererar kompletta AI-lösningar. Lösningarna integrerar HPE Machine Learning Development Environment, HPE Ezmeral Software, HPE ProLiant Compute och HPE Cray Supercomputers med NVIDIA AI Enterprise-programvarusviten, inklusive NVIDIA NeMo framework.
Enterprise computing solution för generativ AI är en ny datacenterlösning för AI-träning och -inferens som ger företag av alla storlekar den perfekta startpunkten med ett färdigt erbjudande för att snabbt komma igång med sin AI-resa.
Med den nya lösningen för generativ AI kan företag använda förtränade grundmodeller med sin privata data för att skapa produktionsapplikationer som AI-chattbotar. RAG-arbetsflöden (retrieval-augmented generation) förbättrar dessutom applikationens datakvalitet och noggrannhet ytterligare.
Hårdvaran består av en rack scale-arkitektur med HPE ProLiant Compute DL380a förkonfigurerad med NVIDIA L40S GPU, NVIDIA BlueField-3 DPU och NVIDIA Spectrum-X Ethernet Networking Platform för AI i hyperscale. Lösningen är dimensionerad för att finjustera en Llama 2-modell med 70 miljarder parametrar och inkluderar 16 HPE ProLiant DL380a-servrar och 64 L40S GPU:er.
Till det kommer AI-mjukvara från HPE bestående av HPE Machine Learning Development Environment med nya generativa AI-studiofunktioner för att snabbt prototypa och testa modeller, och HPE Ezmeral Software med nya GPU-medvetna funktioner för att förenkla distributionen och påskynda preparation av data för AI-arbetsbelastningar över hybridmolnet. Systemet innehåller också NVIDIA AI Enterprise för att påskynda utveckling och driftsättning av AI i produktion och NVIDIA NeMo-ramverket med verktyg för guardrailing, verktyg för datakurering och förtränade modeller för att effektivisera GenAI i enterprise-klass.
Filed under: Utländsk Teknik