Wat is AVX-512 en waarom maakt Intel het af?

Wat is AVX-512 en waarom maakt Intel het af?

De CPU op uw apparaat voert elke seconde miljoenen berekeningen uit en is verantwoordelijk voor hoe uw computer functioneert. Werken met de CPU is de rekenkundige verwerkingseenheid (ALU), die verantwoordelijk is voor wiskundige taken en wordt aangestuurd door de microcode van de CPU.





Die CPU-microcode is niet statisch en kan worden verbeterd, en een van die verbeteringen was de AVX-512-instructieset van Intel. Intel is echter van plan om AVX-512 te doden, waardoor de functionaliteit voorgoed van zijn CPU's wordt verwijderd. Maar waarom? Waarom stopt Intel AVX-512?





MAKEUSEVAN VIDEO VAN DE DAG

Hoe werkt een ALU?

Voordat u de AVX-512-instructieset leert kennen, is het essentieel om te begrijpen hoe een ALU werkt.





Zoals de naam al doet vermoeden, wordt de rekenkundige verwerkingseenheid gebruikt om wiskundige taken uit te voeren. Deze taken omvatten bewerkingen zoals optellen, vermenigvuldigen en berekeningen met drijvende komma. Om deze taken uit te voeren, gebruikt de ALU toepassingsspecifieke digitale schakelingen, die worden aangestuurd door het kloksignaal van de CPU.

speel ps3-games op ps4

Daarom bepaalt de kloksnelheid van een CPU de snelheid waarmee instructies in de ALU worden verwerkt. Dus als uw CPU op een klokfrequentie van 5 GHz werkt, kan de ALU 5 miljard instructies in één seconde verwerken. Om deze reden verbeteren de CPU-prestaties naarmate de kloksnelheid toeneemt.



  Chipsets op een moederbord

Dat gezegd hebbende, naarmate de kloksnelheid van de CPU toeneemt, neemt de hoeveelheid warmte die door de CPU wordt gegenereerd toe. Om deze reden gebruiken power users vloeibare stikstof bij het overklokken van hun systemen. Helaas verhindert deze temperatuurstijging bij hoge frequenties dat CPU-fabrikanten de klokfrequentie boven een bepaalde drempel verhogen.

Dus hoe biedt een nieuwe generatie processor betere prestaties in vergelijking met oudere iteraties? Welnu, CPU-fabrikanten gebruiken het concept van parallellisme om de prestaties te verbeteren. Dit parallellisme kan worden bereikt door een multicore-architectuur te gebruiken waarbij verschillende verwerkingskernen worden gebruikt om de rekenkracht van de CPU te verbeteren.





Een andere manier om de prestaties te verbeteren, is door een SIMD-instructieset te gebruiken. In eenvoudige bewoordingen stelt een Single Instruction Multiple Data-instructie de ALU in staat om dezelfde instructie over verschillende datapunten uit te voeren. Dit type parallellisme verbetert de prestaties van een CPU en de AVX-512 is een SIMD-instructie die wordt gebruikt om de prestaties van een CPU te verbeteren bij het uitvoeren van specifieke taken.

Hoe bereiken gegevens de ALU?

Nu we een basiskennis hebben van hoe een ALU werkt, moeten we begrijpen hoe gegevens de ALU bereiken.





  harde schijf met een lege achtergrond

Om de ALU te bereiken, moeten gegevens zich door verschillende opslagsystemen verplaatsen. Deze datareis is gebaseerd op de geheugenhiërarchie van een computersysteem. Hieronder volgt een kort overzicht van deze hiërarchie:

  • Tweede geheugen: Het secundaire geheugen op een computerapparaat bestaat uit een permanent opslagapparaat. Dit apparaat kan gegevens permanent opslaan, maar is niet zo snel als de CPU. Hierdoor heeft de CPU geen rechtstreekse toegang tot gegevens vanaf het secundaire opslagsysteem.
  • Primair geheugen: Het primaire opslagsysteem bestaat uit RAM (Random Access Memory). Dit opslagsysteem is sneller dan het secundaire opslagsysteem, maar kan gegevens niet permanent opslaan. Daarom, wanneer u een bestand op uw systeem opent, wordt het van de harde schijf naar het RAM verplaatst. Dat gezegd hebbende, zelfs het RAM-geheugen is niet snel genoeg voor de CPU.
  • Cachegeheugen: Het cachegeheugen is ingebed in de CPU en is het snelste geheugensysteem op een computer. Dit geheugensysteem is opgedeeld in drie delen, namelijk de L1-, L2- en L3-cache . Alle gegevens die door de ALU moeten worden verwerkt, gaan van de harde schijf naar het RAM en vervolgens naar het cachegeheugen. Dat gezegd hebbende, de ALU heeft geen rechtstreekse toegang tot gegevens vanuit de cache.
  • CPU-registers: Het CPU-register op een computerapparaat is erg klein en op basis van de computerarchitectuur kunnen deze registers 32 of 64 bits aan gegevens bevatten. Zodra de gegevens in deze registers zijn binnengekomen, kan de ALU er toegang toe krijgen en de betreffende taak uitvoeren.

Wat is AVX-512 en hoe werkt het?

De AVX 512-instructieset is de tweede iteratie van AVX en vond zijn weg naar Intel-processors in 2013. Afkorting van Advanced Vector Extensions, de AVX-instructieset werd voor het eerst geïntroduceerd in Intel's Xeon Phi (Knights Landing) -architectuur en bereikte later de Intel-server processors in de Skylake-X CPU's.

Bovendien vond de AVX-512-instructieset zijn weg naar de consumentgebaseerde systemen met de Cannon Lake-architectuur en werd later ondersteund door de Ice Lake- en Tiger Lake-architecturen.

Het belangrijkste doel van deze instructieset was om taken met gegevenscompressie, beeldverwerking en cryptografische berekeningen te versnellen. De AVX-512-instructieset biedt een dubbele rekenkracht in vergelijking met oudere iteraties en biedt aanzienlijke prestatieverbeteringen.

Dus, hoe heeft Intel de prestaties van zijn CPU's verdubbeld met behulp van de AVX-512-architectuur?

Welnu, zoals eerder uitgelegd, heeft de ALU alleen toegang tot de gegevens die aanwezig zijn in het register van een CPU. De instructieset Advanced Vector Extensions vergroot de omvang van deze registers.

Door deze grotere omvang kan de ALU meerdere datapunten in één instructie verwerken, waardoor de prestaties van het systeem toenemen.

In termen van registergrootte biedt de AVX-512-instructieset tweeëndertig 512-bits registers, wat het dubbele is in vergelijking met de oudere AVX-instructieset.

Waarom beëindigt Intel AVX-512?

Zoals eerder uitgelegd, biedt de AVX-512 instructieset verschillende rekenkundige voordelen. In feite gebruiken populaire bibliotheken zoals TensorFlow de instructieset om snellere berekeningen te bieden op de CPU's die de instructieset ondersteunen.

hoe de bestandsgrootte van jpg te verkleinen

Dus waarom schakelt Intel AVX-512 uit op zijn recente Alder Lake-processors?

Welnu, de Alder Lake-processors zijn anders dan de oudere die door Intel zijn vervaardigd. Terwijl de oudere systemen cores gebruikten die op dezelfde architectuur draaiden, gebruiken de Alder Lake-processors twee verschillende cores. Deze kernen in de Alder Lake-CPU's staan ​​bekend als: P en E-kernen en worden aangedreven door verschillende architecturen.

Terwijl de P-cores de Golden Cove-microarchitectuur gebruiken, gebruiken de E-cores de Gracemont-microarchitectuur. Dit verschil in architecturen verhindert dat de planner correct werkt wanneer bepaalde instructies op de ene architectuur kunnen worden uitgevoerd, maar niet op de andere.

In het geval van de Alder Lake-processors is de AVX-512-instructieset zo'n voorbeeld, omdat de P-cores de hardware hebben om de instructie te verwerken, maar de E-cores niet.

Om deze reden ondersteunen de Alder Lake-CPU's de AVX-512-instructieset niet.

Dat gezegd hebbende, AVX-512-instructies kunnen worden uitgevoerd op bepaalde Alder Lake-CPU's waar Intel ze niet fysiek heeft gefuseerd. Om hetzelfde te doen, moeten gebruikers de E-cores uitschakelen tijdens het BIOS.

Is AVX-512 nodig op consumentenchipsets?

De AVX-512 instructieset vergroot de omvang van het register van een CPU om de prestaties te verbeteren. Deze prestatieverbetering stelt CPU's in staat om getallen sneller te kraken, waardoor gebruikers video-/audiocompressie-algoritmen met hogere snelheden kunnen uitvoeren.

Dat gezegd hebbende, kan deze prestatieverbetering alleen worden waargenomen wanneer de instructie die in een programma is gedefinieerd, is geoptimaliseerd om te worden uitgevoerd op de AVX-512-instructieset.

Om deze reden zijn architecturen voor instructieset zoals AVX-512 meer geschikt voor serverworkloads, en chipsets van consumentenklasse kunnen werken zonder complexe instructiesets zoals de AVX-512.