Elektronik I Norden » Full-stack GenAI-lösning från HPE

Full-stack GenAI-lösning från HPE

Posted on november 30th, 2023 by Göte Fagerfjäll

Hewlett Packard Enterprise har ingått ett utökat strategiskt samarbete med NVIDIA med målet att bygga en företagslösning för generativ AI (GenAI).

När företag utvecklar och distribuerar GenAI-modeller för användningsområden som sökning i konversationer, automatisering av affärsprocesser och skapande av innehåll, behöver de en mjukvaru- och infrastrukturstack som kan distribueras snabbt och från varhelst verksamheten behöver den. Den nya företagslösningen för generativ AI är en del av ett utökat samarbete mellan HPE och NVIDIA som levererar kompletta AI-lösningar. Lösningarna integrerar HPE Machine Learning Development Environment, HPE Ezmeral Software, HPE ProLiant Compute och HPE Cray Supercomputers med NVIDIA AI Enterprise-programvarusviten, inklusive NVIDIA NeMo framework.

Enterprise computing solution för generativ AI är en ny datacenterlösning för AI-träning och -inferens som ger företag av alla storlekar den perfekta startpunkten med ett färdigt erbjudande för att snabbt komma igång med sin AI-resa.

Med den nya lösningen för generativ AI kan företag använda förtränade grundmodeller med sin privata data för att skapa produktionsapplikationer som AI-chattbotar. RAG-arbetsflöden (retrieval-augmented generation) förbättrar dessutom applikationens datakvalitet och noggrannhet ytterligare.

Hårdvaran består av en rack scale-arkitektur med HPE ProLiant Compute DL380a förkonfigurerad med NVIDIA L40S GPU, NVIDIA BlueField-3 DPU och NVIDIA Spectrum-X Ethernet Networking Platform för AI i hyperscale. Lösningen är dimensionerad för att finjustera en Llama 2-modell med 70 miljarder parametrar och inkluderar 16 HPE ProLiant DL380a-servrar och 64 L40S GPU:er.

Till det kommer AI-mjukvara från HPE bestående av HPE Machine Learning Development Environment med nya generativa AI-studiofunktioner för att snabbt prototypa och testa modeller, och HPE Ezmeral Software med nya GPU-medvetna funktioner för att förenkla distributionen och påskynda preparation av data för AI-arbetsbelastningar över hybridmolnet. Systemet innehåller också NVIDIA AI Enterprise för att påskynda utveckling och driftsättning av AI i produktion och NVIDIA NeMo-ramverket med verktyg för guardrailing, verktyg för datakurering och förtränade modeller för att effektivisera GenAI i enterprise-klass.

Filed under: Utländsk Teknik

« Sivers Photonics får order på 10 miljoner dollar Smarta ventiler och superkondensatorer »

Kommentaren

Göte Fagerfjäll

Vad händer med Intel och Nvidia?

På börsen är idag Nvidia värt 32 gånger mer än Intel. Det skulle nog inte många ha gissat för fem år sedan då Intel var värt nästan dubbelt så mycket som Nvidia. Eller för 25 år sedan då Intel var värt sådär 150 gånger mer än Nvidia. Det beror inte bara på Nvidias framgångar utan också på Intels långa rad av misslyckanden. Mer om det strax.

Läs hela krönikan

Bläddra bland mina andra krönikor (820 stycken)

Gästkommentaren

Ramine Roane, Xilinx

Utvecklingen accelererar snabbare än någonsin

Pandemin tar fortfarande mycket av vår uppmärksamhet, men samtidigt förändrar AI hur vi arbetar, hela vägen från molnet till Edge och slutpunkter.

Ramine Roane, vice president of software and AI product marketing, Xilinx, gör här en prognos för elektronikåret 2022.

Läs mer

I periferin

Gunnar Englund

1940 – 2021

Mäta ström del två – Rogowski och hans spole

Om strömtänger för AC och DC kan sägas vara väl utredda och kända av alla så är det kanske inte så vanligt att rogowskispolar är riktigt lika välkända. Väl utredda kan man utan vidare säga att de är men ändå är principen för hur de faktiskt fungerar och vilka begränsningar de har inte alls välkända. Det har gjort att totalt felaktiga mätningar med rogowskispolar har lett till likaledes totalt felaktiga och ineffektiva ”lösningar” på det förmodade problemet.

Läs mer..

Läs alla Gunnar Englunds tidigare krönikor:

Gunnar Englund gick bort 14 juni 2021. Läs mer om det här. Men hans krönikor lever och kommer förhoppningsvis att uppdateras med några till.

Fordonselektronik

Mätteknik

Embedded

Radio

Full-stack GenAI-lösning från HPE

Kommentaren

Gästkommentaren

I periferin