15 vezető mesterséges intelligencia hardvercég, amelyek uralják a piacot 2026-ban

A mesterséges intelligencia hardvergyártó cégei gyorsan átalakítják a technológiai ipart. Az NVIDIA messzire jutott a grafikus kártyákkal kapcsolatos gyökereitől. A vállalat értékelése elérte a 4 billió dollárt, amivel a világ egyik legértékesebb vállalatává vált.

A számok ebben az ágazatban megdöbbentőek. A Bloomberg Intelligence előrejelzése szerint a generatív mesterséges intelligenciára fordított kiadások a 2023-as 67 milliárd dollárról 2032-re 1.3 billió dollárra fognak emelkedni. A Price Waterhouse Coopers szerint a generatív mesterséges intelligencia gazdasági hatása 2030-ra eléri a 15.7 billió dollárt. Ezek a hatalmas számok megmagyarázzák, miért vívnak a technológiai óriások intenzív versenyt a piacvezető szerepért.

Egy valaha specializált piac a technológia egyik legádázabb csataterévé vált. A vezető mesterséges intelligencia chipgyártók folyamatosan bővítik a lehetőségeiket – az NVIDIA Blackwell GPU-ja 2.5-szer nagyobb sebességgel és 25-ször jobb energiahatékonysággal tűnik ki elődeihez képest.

A verseny fokozódik, mivel a nagyvállalatok most már maguk tervezik meg chipjeiket ahelyett, hogy külső beszállítókra támaszkodnának. A Taiwan Semiconductor fokozta a csúcstechnológiás 3 nanométeres és 5 nm-es chipek gyártását, hogy kielégítse a növekvő keresletet.

Ez a cikk bemutatja a 15 vezető mesterséges intelligencia hardvergyártó céget, amelyek ma uralják a piacot, legjobb termékeiket és szerepüket a számítástechnika jövőjének alakításában.

NVIDIA

Az NVIDIA vezető szerepet tölt be a mesterséges intelligencia chipek gyártásában. GPU-i mindent működtetnek az önvezető járművektől a nagy nyelvi modellekig. A vállalat innovatív megközelítése a versenytársak elé helyezte a folyamatosan változó mesterséges intelligencia hardverek világában.

NVIDIA kulcsfontosságú AI chipek

Az NVIDIA mesterséges intelligencia gyorsító kínálatában számos nagy teljesítményű termék található. Az A100 Tensor Core GPU a vállalatok éltetőereje, és harmadik generációs Tensor Core-okkal akár 312 TFLOPS mélytanulási teljesítményt is biztosít. A H100 GPU a Hopper architektúrán fut, és a nagy nyelvi modelleket 30-szor gyorsabban dolgozza fel, mint a korábbi verziók.

A B300 (Blackwell Ultra) magasra teszi a lécet GPU-nként 288 GB HBM3e memóriával és 1,100 petaflop sűrű FP4 következtetési teljesítménnyel. Egyetlen GB300 NVL72 rackméretű rendszer GPU-nként másodpercenként 12 934 tokent dolgoz fel.

NVIDIA teljesítménymutatók

Az NVIDIA vezeti az MLPerf benchmarkokat, amelyek az iparágban a mesterséges intelligencia teljesítményét mérik. A platform egy kivételével az összes MLPerf Training v5.1 benchmarkban a leggyorsabb betanítási időket érte el. A vállalat tartja az adatközpontok összes GPU-nkénti MLPerf Inference teljesítményrekordját is.

A pénzügyi eredmények magukért beszélnek, egy 5 millió dolláros befektetés a GB200 NVL72 rendszerbe körülbelül 75 millió dolláros tokenbevételt generálhat, ami 15-szörös megtérülést kínál. 

NVIDIA stratégiai partnerségek

Az NVIDIA stratégiai együttműködéseket épít ki az iparágak között. Az OpenAI legalább 10 gigawatt NVIDIA rendszer telepítését tervezi a következő generációs MI-infrastruktúrájához. Az NVIDIA akár 100 milliárd dollárt is befektet az OpenAI-ba minden egyes gigawatt telepítésével.

A vállalat olyan autóipari óriásokkal működik együtt, mint a General Motors, az önvezető technológiák és a mesterséges intelligencia gyártása terén. A T-Mobile-lal és más partnerekkel együttműködve az NVIDIA létrehozza Amerika első mesterséges intelligencián alapuló vezeték nélküli rendszerét a 6G-hez.

NVIDIA jövőbeli ütemterve

Az NVIDIA ambiciózus ütemtervet mutat be a „Rubin” architektúrával (Vera Rubin csillagászról elnevezve), amely várhatóan 2026 második felében jelenik meg. Ez a következő generációs platform 3.6 EFLOPS sűrű FP4 számítási teljesítményt fog biztosítani, ami 3.3-szor erősebb, mint a jelenlegi Blackwell architektúra.

A nagyobb teljesítményű "Rubin Ultra" 2027-ben érkezik, és NVL576 konfigurációján keresztül 15 ExaFLOPS FP4 következtetési számítást kínál. Az NVLink7 interfész hatszor gyorsabb kapcsolatot biztosít elődjénél, 1.5 PB/s átviteli sebességgel. Az NVIDIA 2028-ra egy "Feynman" architektúrát tervez, amelyet Richard Feynman fizikusról neveztek el.

AMD

Az AMD erős kihívóként áll a mesterséges intelligencia hardverversenyében. A vállalat az NVIDIA piacvezető szerepét veszi át a nagy teljesítményű gyorsítók és processzorok növekvő kínálatával.

AMD kulcsfontosságú mesterséges intelligencia chipek

Az AMD Instinct MI300X gyorsító a vállalat mesterséges intelligencia alapú chipkínálatának éltető eleme, 192 GB HBM3 memóriájával. Az újabb MI325X került a figyelem középpontjába. 288 GB HBM3E memóriával rendelkezik, és 6 terabájt/másodperces memória-sávszélességet biztosít, ami 1.3-szor jobb, mint amit a versenytársak kínálnak. Az AMD Ryzen mesterséges intelligencia alapú processzorai ma már több mint 250 PC-platformot működtetnek. Ezek a processzorok mesterséges intelligencia alapú képességeket visznek a laptopokba és asztali számítógépekbe.

AMD teljesítménymutatók

A terepi tesztek azt mutatják, hogy az AMD Instinct MI300X gyorsítók jól teljesítenek a riválisokkal szemben. A chipek ROCm 6 szoftvert használnak, hogy 1.3-szor jobb következtetési teljesítményt érjenek el a Meta Llama-3 70B modelleken. Emellett 1.2-szer jobb átviteli sebességet biztosítanak a Mistral-7B-n. A Hugging Face éjszakánként 700 000 népszerű modelljét teszteli AMD Instinct MI300X gyorsítókon a kompatibilitás ellenőrzése érdekében.

AMD stratégiai együttműködések

Az AMD erős iparági partnerségeket épített ki. Az OpenAI egy hatalmas, 6 gigawattos, többéves megállapodást írt alá az AMD-vel. Az első gigawattos telepítés 2026-ban kezdődik. Az Oracle Cloud Infrastructure 50 000 MI450 GPU telepítését tervezi. A Microsoft Azure az MI300X-et használja az OpenAI szolgáltatásokhoz. A Dell Technologies (PowerEdge XE9680), a Supermicro, a Lenovo és a HPE egyesítette erőit az AMD-vel. Az AMD 10 milliárd dolláros együttműködést kötött a HUMAIN-nal, hogy mesterséges intelligencia infrastruktúrát építsen ki Szaúd-Arábiában és az Egyesült Államokban.

AMD jövőbeli ütemterve

Az AMD azt tervezi, hogy évente új MI-gyorsítókat fog kiadni. Az MI325X 2024 negyedik negyedévében jelenik meg. A CDNA 4 architektúrán alapuló MI350 sorozat is megjelenik. 35-ször gyorsabb MI-következtetési teljesítményt ígér, mint az MI300. Az MI400/MI450 "Helios" rendszerek 2026-ban érkeznek HBM4 memóriával, amely 19.6 TB/s sávszélességet kínál. Az MI500 sorozat 2027-ben követi őket. Személyes eszközök esetében a közelgő "Gorgon" (2026 elején) és a "Medusa" (2027 elején) architektúrák akár 10-szer jobb eszközön belüli MI-számítási teljesítményt biztosítanak a 2024-es szinthez képest.

Google (ábécé)

A Google úttörő szerepet játszott az egyedi mesterséges intelligencia chipek piacán a Tensor feldolgozóegységekkel (TPU-kkal). A vállalat 2015-ben fejlesztette ki ezeket a chipeket belső használatra, és 2018-ra elérhetővé tette azokat a felhőalapú ügyfelek számára. Korai befektetésük jól megtérült. A techóriás most... az egyedi felhőalapú AI-gyorsítók piacának 58%-át ellenőrzi.

Google AI chipek

A TPU termékcsalád a Google mesterséges intelligencia hardverstratégiájának éltető eleme. Ezek az alkalmazásspecifikus integrált áramkörök kifejezetten a neurális hálózati feldolgozást szolgálják ki. A jelenlegi zászlóshajó modell, az Ironwood (TPU v7), chipenként 4,614 teraflopot biztosít. Mind a betanítási, mind a következtetési terhelések esetében négyszer gyorsabb, mint elődje.

A termékcsalád magában foglalja a Trilliumot (TPU v6), a TPU v5 sorozatot és az Edge TPU-t, amely az eszközön belüli mesterséges intelligenciát kezeli. A Google elindította az Axiont, első általános célú CPU-ját, a nem mesterséges intelligencián alapuló munkaterhelések kezelésére.

Google teljesítménymutatók

A Google TPU v4 podjainak számítási teljesítménye eléri az 1.1 exaflopsot, 4,096 együtt dolgozó chippel. Minden egyes TPU v4 chip 275 teraflops sebességgel dolgozza fel az adatokat, 32 GiB HBM2 memória és 1200 GBps sávszélesség támogatásával.

Ez a nyers erő valós sikerekhez vezetett. A Google gépi tanulási (MLPerf) szuperszámítógépe nyolc MLPerf mérésből hatban győzelmet aratott. A rendszer több mint 430 petaflop csúcsteljesítményt ért el 4,096 TPU v3 chip használatával.

Google stratégiai partnerségek

Az Anthropic vezeti a Google legfontosabb együttműködéseit. A vállalat célja, hogy akár egymillió TPU chiphez is hozzáférjen, ami több tízmilliárd dollár értékű üzlet. 2026-ra ez a megállapodás több mint egy gigawatt számítási kapacitást biztosít az Anthropicnak.

A Broadcom kulcsfontosságú gyártási partner, több mint 3 milliárd dollárt fektet be chiptervezésbe. A TSMC a tényleges gyártás 92%-át végzi.

A Google jövőbeli ütemterve

Az Ironwood újévkor válik elérhetővé. A Google ezzel egyidejűleg tervezi hardverportfóliójának bővítését. A Project Suncatcher, egy napenergiával működő, TPU-kkal felszerelt műholdakból álló konstelláció, 2027-re indul.

A vállalat kvantum mesterséges intelligencia részlege létrehozta a Willow-t, egy kvantumchipet, amely kevesebb mint öt perc alatt elvégzett egy számítást. A hagyományos szuperszámítógépeknek 10 septillió évre lenne szükségük ugyanehhez a feladathoz. Hosszú út áll előttünk, de építhetünk erre a fejlődésre, mivel a mesterséges intelligencia iparág inkább a következtetésre, mint a betanításra összpontosít. A Google hardverstratégiája készen áll arra, ami előttünk áll.

Amazon (AWS)

Az Amazon Web Services kiemelkedik a mesterséges intelligencia hardveriparban az egyedi fejlesztésű gyorsítóival, amelyek egyensúlyt teremtenek a teljesítmény és a költségek között a mesterséges intelligencia által vezérelt munkaterhelések esetében.

AWS AI chipek

Az AWS két különálló MI chipcsaládot kínál: a Trainiumot a betanításhoz és az Inferentiát a következtetési feladatokhoz. A legújabb Trainium2 chip akár négyszeres teljesítményt is kínál a korábbi verziókhoz képest. A Trn2 példányok a generatív MI feladatokban ragyognak 16, NeuronLinken keresztül csatlakoztatott Trainium2 chippel. Ezek a példányok 20.8 petaflop FP8 számítási teljesítménnyel és 1.5 TB HBM3 memóriával rendelkeznek. Az Inferentia2 chip az Inf2 példányokat hajtja, és 190 TFLOPS FP16 teljesítményt nyújt chipenként 32 GB HBM-mel. Ez négyszeres memórianövekedést jelent az első generációs Inferentiához képest.

AWS teljesítménymutatók

A Trainium2 figyelemre méltó költséghatékonyságot mutat:

  • A felhasználók 30-40%-kal jobb ár-érték arányt érnek el, mint a GPU-alapú EC2 P5e példányok
  • A rendszer mindössze 4 perc alatt betanított egy 175B paraméteres GPT-3 modellt a célpontosságra.
  • A platform 13B paraméteres modellekhez 1,024 chipen túl is skálázódott

Az Inferentia2 akár 4-szer nagyobb átviteli sebességet és 10-szer alacsonyabb késleltetést ér el az előző verziójához képest. Az Inf1 példányok 2.3-szor nagyobb átviteli sebességet biztosítanak 70%-kal alacsonyabb következtetési költség mellett a hasonló EC2 példányokhoz képest.

AWS kölcsönösen előnyös szövetségek

Az AWS egy 38 milliárd dolláros, hét évre szóló megállapodást írt alá az OpenAI-val. Ez a megállapodás több százezer NVIDIA GPU-t biztosít, amelyekhez tízmillió CPU-t párosítunk. Egyedi szilikonjainkkal a belső MI-alkalmazásokra és az olyan partnerekre összpontosítottunk, mint az Anthropic. A "Project Rainier" telepítés 400 000 Trainium2 chipet tartalmaz az Anthropic számára, ami jól mutatja ezen partnerségek hatalmas mértékét.

AWS jövőbeli ütemterv

A Trainium3 előzetes verzióba kerül, majd 2026 elején teljes körű telepítésre kerül. Ez a következő generációs chip a Trainium2 teljesítményének kétszeresét, a TSMC 3 nm-es eljárásának köszönhetően pedig 40%-kal jobb energiahatékonyságot ígér. Az AWS azt tervezi, hogy 2026 és 2027 között megduplázza adatközpontjainak kapacitását 10 GW-ról 20 GW-ra. Ez jelentős befektetést jelent a mesterséges intelligencia infrastruktúrájába.

microsoft

A Microsoft egyedi megközelítéssel lépett be a mesterséges intelligencia gyorsító piacára. A vállalat speciális hardvert fejlesztett, amely zökkenőmentesen együttműködik a felhőinfrastruktúrájával a teljesítmény maximalizálása érdekében.

Microsoft AI chipek

A Project Brainwave a Microsoft első lépése volt a mesterséges intelligencia gyorsítása felé. A projekt terepen programozható kapumátrixokat (FPGA) használ egy „lágy neurális feldolgozóegység” létrehozásához, amely azonnali mesterséges intelligencia-következtetést biztosít ultraalacsony késleltetéssel. A rendszer lenyűgöző 39.5 teraflops-ot ért el Intel Stratix 10 FPGA-kon, és minden kérést egy milliszekundum alatt dolgoz fel.

Az Azure Maia 100, a Microsoft zászlóshajója, a mesterséges intelligencia chip, 2023 novemberében jelent meg. Ez a nagy teljesítményű processzor 820 mm² területet foglal el a TSMC 5 nm-es eljárásával, fejlett tokozási technológiával. A chip 64 GB HBM2E memóriát és 1.8 terabájt/másodperces sávszélességet kínál. A Microsoft létrehozta az Azure Cobalt 100 CPU-t is, egy ARM-alapú processzort, amely az energiahatékonyság révén egyszerűsíti a folyamatokat.

Microsoft teljesítménymutatók

A Maia 100 akár 4800 Gbps teljes gyűjtésű és szóráscsökkentett sávszélességet is képes kezelni. Egyedi Ethernet-alapú protokollon keresztül 1200 Gbps teljes sávszélességet támogat. A chip tenzoregysége többféle adattípussal működik, beleértve a Microsoft 2023-ban megjelent MX formátumát is.

A Microsoft Azure NC H100 v5 virtuális gépei 46%-kal jobb teljesítményt mutattak az MLPerf benchmarkokban a 80 GB memóriával rendelkező GPU-kkal rendelkező termékekhez képest. A vállalat tervei szerint a jövőben saját chipekre fog átállni, Kevin Scott műszaki igazgató szerint.

Microsoft stratégiai partnerségek

A Microsoft 2024 októberében nyitotta meg második Fairwater AI adatközpontját Atlantában. A létesítmény NVIDIA GB200 NVL72 rack méretű rendszereket tartalmaz, amelyek több százezer Blackwell GPU-hoz skálázhatók. Az NVIDIA-val való együttműködésnek köszönhetően a Microsoft lett az első felhőszolgáltató, amely nagy mennyiségben telepítette az NVIDIA GB300 NVL72-t.

A cég a Qualcommal működik együtt a Windows mesterséges intelligencia fejlesztése érdekében. A Hexagon NPU-t Windows gépi tanulással optimalizálják, hogy olyan modelleket, mint a Phi Silica, hatékonyan fussanak.

Microsoft jövőbeli ütemterve

Az eredeti chip-ütemterv három gyorsítóprogramot tartalmazott: a Bragát, a Braga-R-t és a Cleát. Ezek a chipek az adatközpontok telepítését célozzák meg 2026-ban, illetve 2027-ben. A Braga tömegtermelése 2026-ra tolódott át, ami legalább hat hónapos késést jelent.

Belső források szerint a chip „teljesítménye messze elmarad az NVIDIA zászlóshajójának számító Blackwell chipétől”. A Clea variáns végre elérheti az NVIDIA kínálatát, amikor 2027-ben megjelenik. A Microsoft licencbe vette az OpenAI chiptervezési szellemi tulajdonát, ami 12-18 hónappal felgyorsíthatja a fejlesztésüket.

Intel

Az Intel, a számítástechnika legrégebbi óriása, CPU-központú megközelítést vezet be a mesterséges intelligencia hardverpiacára, és kihasználja x86-os dominanciáját a feltörekvő GPU-technológiák között.

Intel mesterséges intelligencia chipek

A Xeon 6 processzorok az Intel mesterséges intelligencia portfóliójának középpontjában állnak, és akár 50%-kal nagyobb MI-teljesítményt nyújtanak egyharmaddal kevesebb maggal az AMD-hez képest. Ezek a processzorok beépített MI-gyorsítással rendelkeznek minden magban, amely a következtetést, a betanítást és a kis GenAI-modelleket működteti. Az Intel Core Ultra processzorok (2. széria) több mint 300 MI-gyorsítású funkciót támogatnak az Intel személyi számítástechnikához készült AI PC Acceleration Programján keresztül.

Az Intel bemutatta Crescent Island adatközponti GPU-ját, amely a mesterséges intelligencia következtetési terheléseit célozza meg. A chip Xe3P mikroarchitektúrával, 160 GB LPDDR5X memóriával rendelkezik, és optimalizált teljesítményt nyújt wattonként.

Intel teljesítménymutatók

Az Intel zászlóshajója, a 128 magos Xeon 6980P processzor figyelemre méltó mesterséges intelligencia teljesítményt nyújt földi alkalmazásokban. A processzor akár 964.57 tokent is elérhet másodpercenként LLM-következtetés esetén, amikor a PyTorch 2.6.0-t futtatja IPEX optimalizálással. Az MLPerf v5.1 mérések kivételes eredményeket mutattak, a Xeon 6 processzorok 1.9-szeres teljesítménynövekedést mutattak az előző generációkhoz képest.

Intel stratégiai együttműködések

Az Intel történelmi partnerséget kötött az NVIDIA-val, hogy több generációs egyedi adatközponti és PC-s termékeket fejlesszenek. Ez a megállapodás magában foglalja az NVIDIA 5 milliárd dolláros befektetését az Intel törzsrészvényeibe. Az Intel Foundry szerződést kötött a Microsoft Maia 2 következő generációs mesterséges intelligencia processzorának gyártására a 18A gyártási folyamatának felhasználásával.

Az Intel jövőbeli ütemterve

Az új Crescent Island adatközponti GPU 2026 második felében kerül majd a vásárlók elé. Az Intel úgy döntött, hogy megszünteti a Nervana neurális hálózati processzorok gyártását, miután 2 milliárd dollárért felvásárolta a Habana Labst, hogy a technológiájukra összpontosíthasson.

Alma

Az Apple egyedi szilíciumstratégián keresztül építi be a neurális képességeket a chiparchitektúrájába, ami megkülönbözteti a vállalatot a mesterséges intelligencia hardverfejlesztésében.

Apple AI chipek

Az Apple M5 chipje áttörést jelent a mesterséges intelligencia alapú feldolgozásban. Minden GPU-mag neurális gyorsítókat tartalmaz, amelyek több mint négyszeresét nyújtják a mesterséges intelligencia által nyújtott GPU-csúcsszámítási teljesítménynek az M4-hez képest. A chip harmadik generációs 3 nm-es technológiát használ, és tíz maggal rendelkezik - négy a teljesítményért és hat a hatékonyságért felelős. A chip 16 magos neurális motorja 153 GB/s egységes memória-sávszélességgel működik, hogy másodpercenként 133 billió műveletet dolgozzon fel, ami tizenkétszerese annak, amit az M1 kezelni tudott.

Apple teljesítménymutatók

Az M5 chip új rekordot állított fel 4,263 ponttal a Geekbench 6 egymagos tesztjein, felülmúlva az összes Mac és PC processzort. A chip 17 862 pontot szerzett a többmagos tesztelésen, és 20%-kal gyorsabban fut, mint az M4. A grafikus teljesítmény 30%-os javulást mutat az M4-hez képest, míg a sugárkövetős alkalmazások 45%-kal gyorsabban futnak.

Apple stratégiai partnerségek

Az Apple 600 milliárd dolláros befektetést tervez Amerikában 2027-ig. A vállalat 20 000 új munkahelyet teremt, a mesterséges intelligenciára és a szilícium-alapú mérnöki munkára összpontosítva. A vállalat stratégiai együttműködést kötött a Broadcommal a Baltra chip létrehozása érdekében. A jelentések szerint partnerségre lép a Google-lel a Gemini mesterséges intelligencia modelljeinek Siribe való beépítése érdekében.

Az Apple jövőbeli ütemterve

Az Apple 2026-ban fogja piacra dobni a teljes M5 termékcsaládot (M5 Pro, M5 Max, Ultra), amelyet valószínűleg az M6 variánsok is követni fognak. A vállalat még ebben az évben egy jelentős MacBook Pro újratervezést tervez, amely az M6 Pro/Max chipeket, OLED kijelzőket és érintőképernyős képességeket is tartalmazna.

Qualcomm

Az eszközökre épített mesterséges intelligencia világában a Qualcomm egy erős vezető. Energiahatékony processzoraik lehetővé teszik a mesterséges intelligencia alkalmazását számos platformon.

Qualcomm mesterséges intelligencia chipek

A vállalat mesterséges intelligencia portfóliójában a Snapdragon processzorokba épített Hexagon NPU kiemelkedő teljesítményt nyújt mobil- és PC-s alkalmazásokhoz. A Hexagon NPU-val ellátott Snapdragon X Elite kezeli az eszközön futó mesterséges intelligencia alapú feladatokat, miközben védi a felhasználók adatait. A Qualcomm bemutatta az adatközpontok számára készült AI200 és AI250 gyorsítókat, amelyek rackméretű teljesítményt nyújtanak kártyánként 768 GB LPDDR memóriával. A több mag heterogén számítástechnikát támogat az AI Engine-en keresztül, így ideális okostelefonokhoz, laptopokhoz és IoT-eszközökhöz.

Qualcomm teljesítménymutatók

A Snapdragon 8 Elite Gen 5 NPU-ja 37%-kal felülmúlja elődjét, és másodpercenként 220 tokent dolgoz fel. A zászlóshajó X2 Elite Extreme 4,080 pontot ért el a Geekbench 6.5 egymagos tesztjein, és 23 491 pontot a többmagos értékelésekben, ami 50%-kal magasabb, mint az előző generációké. A Snapdragon X Elite processzorok valós alkalmazásokban 53%-kal gyorsabban töltik be a weboldalakat, mint az AMD Ryzen AI 9 HX 370.

Qualcomm stratégiai partnerségek

A vállalat kölcsönösen előnyös szövetségeket kötött az IBM-mel a watsonx.governance és a Microsoft integrálása érdekében, hogy optimalizálja a Windows gépi tanulást a Hexagon NPU-hoz. A Qualcomm és az Advantech olyan peremhálózati mesterséges intelligencia rendszereken működik együtt, amelyek egy-négy mesterséges intelligencia PCIE gyorsítókártyát támogatnak. A Humain lett az első ügyfele a Qualcomm adatközponti mesterséges intelligencia chipjeinek 200 megawattos telepítéssel.

Qualcomm jövőbeli ütemterve

Az AI200 2026-ban kerül piacra, míg a közel memória-számítástechnikával rendelkező AI250 2027-ben követi, és tízszer nagyobb memória-sávszélességet ígér. Az éves kiadások a következtetési teljesítményre és az energiahatékonyságra összpontosítanak.

Cerebras rendszerek

A Cerebras Systems átalakítja a mesterséges intelligencia hardvereit hatalmas Wafer-Scale Engine (WSE) motorjával. Ez az innovatív processzor teljesen eltérő feldolgozási megközelítéssel kihívást jelent a hagyományos chiparchitektúrák számára.

Cerebras mesterséges intelligencia chipek

A harmadik generációs Wafer-Scale Engine (WSE-3) vezeti a Cerebras processzorkínálatát, 4 billió tranzisztorral és 900 000 mesterséges intelligencia maggal egyetlen szilíciumlapon. A processzor 46 225 mm² területet foglal el, ami 57-szer nagyobb, mint az NVIDIA H100 GPU-ja. 125 petaflops mesterséges intelligencia számítási teljesítményt nyújt. A WSE-3-mal működő CS-3 rendszer akár 1.2 petabájt külső memóriát is támogat, és akár 24 billió paraméterrel rendelkező modelleket is képes betanítani.

Cerebras teljesítménymutatók

A cég rendszerei többször is teljesítményrekordokat döntöttek. Következtető rendszerük másodpercenként 969 tokent generál a Llama 3.1-405B segítségével, ami akár 75-ször gyorsabb, mint a hiperscalerek GPU-alapú megoldásai. A rendszer 21-szeresen felülmúlja az NVIDIA DGX B200 Blackwell GPU-ját, miközben harmadannyi költséget és energiát fogyaszt. A tudományos alkalmazások még lenyűgözőbb eredményeket mutatnak. A rendszer 130-szoros gyorsulást ért el az NVIDIA A100 GPU-khoz képest a nukleáris energia szimulációkban. A molekuláris dinamikát 748-szor gyorsabban futtatta, mint a Frontier szuperszámítógép.

Cerebras stratégiai együttműködések

A Cerebras az IBM-mel és a Metával egyesítette erőit, és az AI Alliance alapító tagja lett. A vállalat G42-vel végzett munkája során a Condor Galaxy 1 és 2 segítségével 8 exaFLOP teljesítményű mesterséges intelligenciával működő szuperszámítógépet eredményezett. A ZS egy új partnerség keretében integrálta a CS-3 rendszereket a MAX.AI platformjába. Az AlphaSense összefogott a Cerebrasszal a piaci információgyűjtési képességek fokozása érdekében. 

Cerebras jövőbeli ütemterve

A Cerebras 1.1 milliárd dolláros G sorozatú finanszírozást biztosított a lapkaméretű technológiájának fejlesztésére. A vállalat célja, hogy a CS-3 rendszerklasztereket mesterséges intelligencia alapú szuperszámítógépekké skálázza fel elosztott számítási komplexitások nélkül. A jövőbeli innovációk közé tartozhat a 3D-s egymásra rakás, amely SRAM memóriát ad a lapkákhoz, ami bővítheti ennek a forradalmi mesterséges intelligencia architektúrának a képességeit.

Groq

A Groq olyan gyorsasággal alakítja át a mesterséges intelligencia világát, hogy a versenytársak sietnek tartani a lépést.

Groq mesterséges intelligencia chipek

A Groq fő terméke a Language Processing Unit (LPU) Inference Engine. Minden chip 230 MB SRAM-ot tartalmaz, és akár 80 TB/s beépített memória-sávszélességet biztosít. A chip figyelemre méltó teljesítményt mutat 750 TOP-pal (INT8) és 188 TFLOP-pal (FP16 @900 MHz). A GroqCard™ Accelerator 19 948 dollárért kapható. A hardver csak SRAM-ot használ, beépített nagy sávszélességű memória nélkül. Ez a tervezési döntés elképesztő sebességet biztosít bizonyos munkaterhelésekhez, de kapacitáskorlátokkal jár.

Groq teljesítményszabványok

Az ArtificialAnalysis.ai tesztjei a Groq kivételes képességeit mutatják. A rendszer másodpercenként 241 tokent ér el – ez több mint kétszerese más szolgáltatók sebességének. A Groq saját tesztjei még tovább mennek, elérik a másodpercenkénti 300 tokent. A rendszer gyorsan reagál, mindössze 0.8 másodperc alatt 100 kimeneti tokent állít elő. A rendszer több mint 500 szót generál körülbelül egy másodperc alatt, míg az NVIDIA GPU-knak ugyanez a feladat majdnem 10 másodpercre van szükségük.

Groq stratégiai együttműködések

Az IBM partnerségre lépett a Groq-kal a GroqCloud integrálása érdekében a watsonx Orchestrate rendszerbe. Az IBM egészségügyi ügyfelei mostantól élőben elemezhetik az információkat. A Groq a Carahsofttal is egyesítette erőit, hogy kiszolgálja az állami szektort. A vállalat egy európai adatközpontot nyitott az Equinixszel Helsinkiben, alacsony késleltetésű mesterséges intelligencia infrastruktúrát biztosítva.

Groq jövőbeli ütemterve

A vállalat több mint tizenkét új adatközpont létrehozását tervezi 2026-ban, a már létrehozott 12 létesítményre építve. A Groq az Egyesült Államokban, Kanadában, a Közel-Keleten és Európában működik. Ázsiába is terjeszkedni terveznek, India mint fő célpont. Egy nemrégiben lezajlott finanszírozási kör 750 millió dollárt hozott 6.9 milliárd dolláros értékelés mellett. A vállalat jelenleg több mint kétmillió fejlesztőt és Fortune 500-as vállalatot támogat.

meta

A Meta eltávolodik a harmadik féltől származó chipektől, és nagy teljesítményű, a közösségi hálózataihoz szabott mesterséges intelligencia gyorsítókat hoz létre.

Meta AI chipek

A zászlóshajónak számító Meta Training and Inference Accelerator (MTIA v2) figyelemre méltó képességeket mutat: 354 TOPS INT8 számítást és 177 teraflops FP16 pontosságot. Ezek a chipek 5 nm-es csomópontokon épülnek, 256 MB beépített memóriával és 2.7 TB/s memória-sávszélességgel. Sűrű számítási teljesítményben 3.5-szer jobban teljesítenek, mint az MTIA v1, és ritka számítási teljesítményben 7-szeres javulást érnek el. A Meta megkezdte első saját fejlesztésű mesterséges intelligencia által fejlesztett oktatóchipjének tesztelését. Ez a lépés csökkentheti az Nvidia GPU-kra költött 10 milliárd dollárt 2023-ban.

Meta teljesítménymutatók

A platformtesztek 6-szoros teljesítménynövekedést és 1.5-szer jobb teljesítményt mutatnak wattonként az első generációs rendszerekhez képest. A chipek jól teljesítenek különböző komplexitású rangsorolási és ajánlási modellekkel. A korai eredmények 3-szoros teljesítménynövekedést mutatnak négy kulcsfontosságú értékelési modellben.

Meta partnerségek

A Meta többéves szövetséget kötött az Armmal, hogy több számítási rétegen fejlessze a mesterséges intelligenciát. Ez a közös erőfeszítés a PyTorch Executorch futási környezetét fejleszti az Arm KleidiAI-val. Az együttműködés az Arm Neoverse platformjait használja a Meta Facebookot és Instagramot működtető ajánlórendszereihez.

Meta jövőbeli ütemterv

A Meta 2026-ban tervezi elindítani első több gigawattos mesterséges intelligencia szuperklaszterét, a "Prometheust". A vállalat "több százmilliárdot" fog befektetni mesterséges intelligencia infrastruktúrába. 

IBM

Az IBM szimbiotikus kapcsolatot teremt a kvantumtechnológiai fejlesztések és a klasszikus feldolgozási innovációk között azáltal, hogy egyensúlyt teremt a hagyományos vállalati számítástechnika és a legmodernebb mesterséges intelligencia hardverfejlesztés között.

IBM mesterséges intelligencia chipek

A Telum II processzor az IBM mesterséges intelligencia hardverstratégiájának élén áll nyolc nagy teljesítményű, 5.5 GHz-en futó maggal. Ez a processzor 40%-kal nagyobb, összesen 360 MB-os, chipre integrált gyorsítótár-kapacitással rendelkezik. Az integrált mesterséges intelligencia gyorsító négyszer nagyobb számítási kapacitást biztosít chipenként az elődjéhez képest. Egy másik nagy teljesítményű komponens, az IBM Spyre Accelerator, chipenként 32 számítási maggal rendelkezik, és akár 1 TB memóriát is támogat nyolc kártyán.

IBM teljesítménymutatók

A Telum II IO-gyorsító egységének köszönhetően jelentősen javultak az adatkezelési képességek, mivel az 50%-kal megnövelt IO-sűrűséget mutat. Minden Spyre chip 300 TOPS számítási teljesítményt nyújt, miközben alacsony, 75 W-os energiafogyasztást tart fenn. A tesztek azt mutatják, hogy egy 96 Spyre kártyával felszerelt IBM Z rendszer akár 30 PetaOps teljesítményszintet is elérhet.

IBM kölcsönösen előnyös szövetségek

Az AMD és az IBM kibővítette együttműködését, és az Instinct™ MI300X GPU elérhetővé válik az IBM Cloudon. Az IBM emellett az Intel Foundry-val is partnerségre lépett fejlett chipek gyártása érdekében.

IBM jövőbeli ütemterve

A vállalat mesterséges intelligencia ütemterve 2030-ig és azon túlra is kiterjed. A legfontosabb mérföldkövek közé tartozik a multimodális transzformátorok 2024-re, a transzformátorokon túlmutató neurális architektúrák és a fejlett érvelési képességek 2026-ra.

Tenstorrent

Jim Keller, a legendás chiptervező vezeti a Tenstorrentet, amely a mesterséges intelligencia hardverek világában a nyílt forráskódú technológiára és a RISC-V architektúrára összpontosítva tűnik ki.

Tenstorrent mesterséges intelligencia chipek

A Tenstorrent többféle mesterséges intelligencia gyorsítót gyárt különböző munkaterhelésekhez. Grayskull processzoruk 2020 áprilisában jelent meg 120 Tensix maggal, amelyek 332 TFLOPS FP8 teljesítményt nyújtanak. A Wormhole sorozat kivételes értéket képvisel - az n150 (999 dollár) 72 Tensix maggal rendelkezik, amelyek 262 TFLOPS FP8 számítási teljesítményt generálnak 12 GB GDDR6 memóriával. Az n300 (1399 dollár) megduplázza ezeket a specifikációkat. Fejlett Blackhole chipjük 140 Tensix++ magot tartalmaz 6 nm-es folyamaton, és 16 RISC-V CPU maggal 774 TFLOPS-ot (FP8) ér el.

Tenstorrent teljesítménymutatók

A Grayskull a tesztek során 1.56 TFLOP/watt csúcshatékonyságot ért el. A chipek a nyers mérőszámokban jobb teljesítményt mutattak, mint az Intel Sapphire Rapids processzorok, annak ellenére, hogy eltérő piaci szegmenseket céloztak meg.

Tenstorrent stratégiai együttműködések

A vállalat stratégiai együttműködéseket alakított ki olyan globális márkákkal, mint az LG, a Hyundai, az AIREV és a SingularityNET. A Samsung Securities vezette a közelmúltbeli 700 millió dolláros finanszírozási körüket, amelyben többek között az LG Electronics és Jeff Bezos is részt vett, és amely 2.6 milliárd dollárra értékelte a vállalatot.

Tenstorrent jövőbeli ütemterve

A vállalat a TSMC-vel, a Samsunggal és a Rapidusszal működik együtt a 2 nm-es folyamatcsomópontok terén. Japánban a mesterséges intelligencia chiptervező képzési programjuk célja, hogy 2026-ra 40-60 jelentkezőre bővüljön.

TSMC

A TSMC a színfalak mögött hajtja a mesterséges intelligencia forradalmát. A vállalat olyan szilíciumot gyárt, amely szinte minden nagyobb mesterséges intelligencia szereplő számára lehetővé teszi az intelligenciát.

TSMC AI chip gyártás

TSMC-k A16 technológia 2026-ban kezdi meg a gyártást. Ez a fejlett technológia nanosíkos tranzisztorokat és innovatív hátoldali tápvezeték-megoldásokat tartalmaz. A vállalat N2 (2 nm-es osztályú) gyártás megkezdését tervezi. Az N2P és az A16 (1.6 nm-es osztályú) 2026-ban követi majd. A System-on-Wafer technológiájuk kivételes teljesítményt nyújt a wafer szinten, amely megfelel a hiperskálázó adatközpontok jövőbeli mesterséges intelligencia követelményeinek.

TSMC teljesítményszabványok

Az A16 jelentősen felülmúlja az N2P folyamatot. Ugyanazon a feszültségen 8-10%-kal jobb sebességet biztosít, és ugyanazon a sebességen 15-20%-kal csökkenti az energiafogyasztást. Az adatközponti termékek akár 1.10-szeres javulást is mutatnak a chipsűrűségben. Az A14 folyamat is lenyűgöző eredményeket mutat. Akár 15%-kal jobb sebességet vagy 30%-kal alacsonyabb energiafogyasztást kínál az N2-höz képest. A logikai sűrűség 20%-kal nő.

TSMC stratégiai együttműködések

A TSMC phoenixi üzeme megkezdte az NVIDIA számára gyártott chipek tömeggyártását. Ez jelentős együttműködést jelent a két mesterséges intelligencia óriás között. Az OpenAI a TSMC-vel közösen fogja elkészíteni első egyedi chipjét, 3 nanométeres folyamattechnológiát használva. A vállalat befolyása tovább terjed, mivel támogatja a Cadence mesterséges intelligencia tervezési folyamatait az N3, N2 és A16 folyamattechnológiákhoz.

TSMC jövőbeli ütemterve

A cég 2026-ban dobja piacra az A16-ot, majd 2028-ban az A14-et. A CoWoS technológiával ellátott System-on-Wafer rendszerük 2027-ben érkezik. Ez az innováció lehetővé teszi olyan wafer szintű rendszerek létrehozását, amelyek egy teljes szerver számítási teljesítményével egyenértékűek.

Broadcom

A Broadcom az AI hálózati infrastruktúra éltető erejévé vált egyedi gyorsítói és fejlett kapcsolási megoldásai révén.

Broadcom mesterséges intelligencia chipek

A Thor Ultra vezeti a Broadcom termékcsaládját, mint az iparág első 800G-os mesterséges intelligencia alapú ethernet hálózati interfészkártyája nagyméretű mesterséges intelligencia alapú adatközpontok számára, amelyek több mint 100 000 XPU-t támogatnak. A vállalat gyártja a Tomahawk 6 kapcsolósorozatot, amely 102.4 Tbps sávszélességet biztosít, és több konfigurációhoz is alkalmazkodik. Hálózati portfóliójukban megtalálható a Thor Ultra a csatlakozáshoz, valamint a Tomahawk és Jericho kapcsolócsaládok, amelyek együttesen egy végponttól végpontig platformként működnek. Hock Tan vezérigazgató rámutat, hogy ezek a hálózati termékek csak egy részét képviselik a Broadcom 2027-re kiaknázható 60-90 milliárd dolláros mesterséges intelligencia piaci lehetőségeinek.

Broadcom teljesítménymutatók

A csapat megduplázta a Thor Ultra sávszélességét az elődjéhez képest. A Tomahawk 6 512 XPU portot támogat 200 Gbps sebességgel, vagy akár 1,024 portot 100 Gbps sebességgel. A vállalat nagy radixú switchei több mint 100 000 XPU-t tudnak csatlakoztatni egy kétszintű, scale-out hálózatban. A Broadcom fejlett SerDes és DSP technológiáit használja ezen specifikációk eléréséhez.

A Broadcom kölcsönösen előnyös szövetségeket kötött.

Az OpenAI bejelentette, hogy együttműködésre lép a Broadcommal 10 gigawattnyi egyedi MI-gyorsító gyártásában. A Broadcom a bejelentés előtt 10 milliárd dolláros megrendelést kapott egy meg nem nevezett ügyféltől egyedi MI-chipekre. A vállalat több generációs Tensor processzorokon végzett közös munkája milliárdos bevételt generált.

Broadcom jövőbeli ütemterve

A Broadcom a mesterséges intelligencia bevételeinek jelentős növekedésére számít a 2026-os pénzügyi évben. A mesterséges intelligencia félvezetőinek bevétele elérte a 12.2 milliárd dollárt a 2024-es pénzügyi évben. A vállalat fejleszti 3D tokozási technológiáját a teljesítmény növelése érdekében. Az ebből a partnerségből származó első OpenAI által tervezett chipek 2026 második felében érkeznek meg.

Összegzés

A mesterséges intelligencia hardverpiaca drámaian megváltozott 2023 óta. Ami egy 67 milliárd dolláros iparágként indult, az várhatóan 2032-re eléri az 1.3 billió dollárt. Ez a 15 technológiai óriás minden új chipgenerációval folyamatosan feszegeti a teljesítményhatárokat. Az NVIDIA továbbra is az élen jár úttörő Blackwell architektúrájával. Az AMD, a Google és mások saját áttöréseiknek köszönhetően jelentősen csökkentették a lemaradást.

A stratégiai együttműködések kulcsfontosságúvá váltak ebben a nagy téttel bíró versenyben. Az olyan cégek, mint az OpenAI, most már egyszerre több hardverszolgáltatóval működnek együtt. Megállapodásokat kötnek az NVIDIA-val, az AMD-vel és a Broadcommal tömeges számítástechnikai telepítésekre, amelyeket gigawattban, nem pedig egyedi chipekben mérnek. Ez egy olyan mesterséges intelligencia jövőjét mutatja, ahol a számítási teljesítményt egy közműhöz hasonlóan fogjuk mérni.

A teljesítménynövekedés elképesztő. A korai fejlesztések 2-4-szeres teljesítményugrásokhoz vezettek a chipgenerációk között. Minden vállalat a saját útját járja. A Cerebras hatalmas, wafer méretű motorokat épít. A Groq a villámgyors következtetésre összpontosít. A hagyományos szereplők, mint az Intel és a Qualcomm, architektúráikat a mesterséges intelligencia alapú terhelésekhez igazítják.

A jövő ambiciózusnak tűnik. A legtöbb nagy szereplő 12-18 hónapon belül új architektúrák bevezetését tervezi, amelyek még nagyobb előrelépéseket ígérnek. Egyes vállalatok egyesülni fognak vagy elhalványulnak, ahogy a piac érik. Mások áttörést jelentő technológiákkal törhetnek előre.

A gyors áttörések hullámát meglovagló vállalatoknak és fogyasztóknak gyakrabban kell frissíteniük hardvereiket. A BigDataSupply segít abban, hogy ezek a frissítések környezetbarátabbak és megfizethetőbbek legyenek azáltal, hogy lehetővé teszi eladja használt GPU-it, CPU, SSD, RAM és más típusú IT berendezésekEz segít megtérülni a költségeket, miközben újabb, nagyobb teljesítményű MI-hardverre váltunk.

A mesterséges intelligencia hardverpiaca 2026-ban egészen másképp fog kinézni, mint ma. A győzteseknek többre van szükségük, mint pusztán nyers teljesítményre. Az energiahatékonyság, a szoftveres ökoszisztémák és a gyártási kapacitás kulcsszerepet játszik majd. A chipgyártás globális politikája is alakítani fogja e piac fejlődését.

Ez a hardverforradalom átalakítja az iparágak mesterséges intelligencia telepítésének és használatának módját. Ezek a chipek olyan képességeket tesznek lehetővé, amelyek néhány évvel ezelőtt még lehetetlennek tűntek – az élő, nagy nyelvi modellek következtetésétől a fejlett számítógépes látásig. Teljesen új termék- és szolgáltatáskategóriákat hoznak létre.

kereszt