Arm Mali-G77 GPU - completările și avantajele complete

Autor: Randy Alexander
Data Creației: 3 Aprilie 2021
Data Actualizării: 1 Iulie 2024
Anonim
Arm Mali-G77 GPU - completările și avantajele complete - Tehnologii
Arm Mali-G77 GPU - completările și avantajele complete - Tehnologii

Conţinut


Alături de noul său nucleu al procesorului Cortex-A77, Arm a prezentat un GPU de nouă generație destinat SoC-urilor de smartphone-ul viitoare. Mali-G77, care nu trebuie confundat cu noul procesor de afișare Mali-D77, marchează plecarea arhitecturii Bifrost a lui Arm și trecerea la Valhall.

Vom intra în detaliile fine ale noii arhitecturi într-o clipă. În primul rând, vom face un salt direct în ceea ce ar trebui să se aștepte utilizatorii în ceea ce privește câștigurile de performanță.

Prezentare generală a performanței Mali-G77

Arm oferă o îmbunătățire a performanței grafice de până la 40% cu dispozitivele Mali-G77 de ultimă generație, comparativ cu modelele Mali-G76 din zilele noastre. Acest număr are în vedere procesul de îmbunătățire, precum și îmbunătățirile arhitecturale. Mali-G77 este configurabil de la 7 la 16 nuclee de umbră și fiecare miez are aproape exact aceeași dimensiune cu miezul G76. Acest lucru înseamnă că smartphone-urile de înaltă performanță vor fi livrate probabil cu un număr similar de core GPU așa cum se întâmplă astăzi - undeva în adolescența joasă. Cu ușurință, acest lucru ne permite să facem câteva evaluări speculative ale performanței în raport cu chipset-urile existente.


Analizând popularul reper Manhattan GFXBench, un spor de performanță de 40 la sută deschide un avantaj considerabil împotriva hardware-ului de generație curentă. Cipul Adreno de generație viitoare de la Qualcomm va avea nevoie de o actualizare semnificativă a performanței pentru a menține nivelul de joc. Tabelele par să se transforme în favoarea lui Arm.

Arhitectură înțeleptă, performanța jocurilor crește cu 20 până la 40%, în timp ce învățarea automată câștigă un spor de 60%

Pe baza acestui parcelaj destul de grosier, un Mali-G77 cu 10 nuclee (o configurație pe care o vedem adesea de la Huawei) pare aproape de a scoate în evidență partea de sus a acestei generații hardware grafic grafic mobil. O configurație de 12 nuclee, văzută de obicei în Exynos de la Samsung, oferă un avantaj important pentru cea mai recentă GPU a lui Arm. Desigur, valorile de referință reale vor depinde de alți factori, inclusiv nodul procesului, memoria cache-ului GPU, configurația memoriei LPDDR și tipul de aplicație pe care o testați. Așadar, luați graficul de mai sus cu o doză mare de sare.


În ceea ce privește noua arhitectură, Arm afirmă că Mali-G77 oferă o îmbunătățire medie cu 30% a eficienței energetice și a densității performanței. Există, de asemenea, un spor enorm de 60 la sută pentru aplicațiile de învățare automată, datorită asistenței produsului INT8 dot. Așteptările privind performanța jocurilor sunt stabilite undeva între o creștere de 20 și 40 la sută, în funcție de titlu și tipul de sarcini grafice oferite.

Pentru a înțelege exact modul în care Arm a obținut această înălțare a performanței, să facem o scufundare mai profundă în arhitectură.

Întâlnește-l pe Valhall, succesorul lui Bifrost

Vahall este a doua arhitectură scalară GPU scalar. Este un motor de 16 execuții cu urzeală, ceea ce înseamnă că GPU execută 16 instrucțiuni în paralel pe ciclu, pe unitate de procesare, pe miez. Aceasta este de la 4 la 8 latime în Bifrost.

Alte caracteristici arhitecturale noi includ planificarea dinamică a instrucțiunilor gestionată în întregime în hardware și un set complet de instrucțiuni care păstrează echivalența operațională cu Bifrost. Alții includ suportul pentru formatul de compresie AFBC1.3 al Arm, țintele de redare FP16, redarea straturilor și ieșirile de umbră a vertexului.

Mali-G77 face cu 33% mai multă matematică în paralel decât G76.

Cheile pentru înțelegerea modificărilor arhitecturale majore se găsesc examinând unitatea de execuție din interiorul miezului. Această parte a GPU este responsabilă pentru zdrobirea numărului.

În interiorul motorului de execuție

În Bifrost, fiecare nucleu GPU conținea trei motoare de execuție sau două în cazul unor proiecte Mali-G52 cu capăt inferior. Fiecare motor conține un i-cache, fișier de înregistrare și unitate de control de urzeală. În Mali-G72, fiecare motor oferă 4 instrucțiuni pe ciclu, care au crescut la 8 în Mali-G76 anul trecut. Răspândit pe aceste trei nuclee permite 12 și 24 de biți de plutire pe 32 de biți (FP32), instrucțiuni FMA (multi-accumulate) condensate pe ciclu.

Cu Valhall și Mali-G77, există un singur motor de execuție în interiorul fiecărui nucleu GPU. Ca și până acum, acest motor găzduiește unitatea de control, registrarea și icache-ul, care este acum distribuit în două unități de procesare. Fiecare unitate de procesare gestionează 16 instrucțiuni de urzire pe ciclu, pentru un debit total de 32 de instrucțiuni FP32 FMA pe miez. Acesta este un spor de 33 la sută la transferul de instrucțiuni peste Mali-G76.

Brațul a trecut de la trei la o singură unitate de execuție per nucleu GPU, dar acum există două unități de procesare în cadrul unui nucleu G77.

În plus, fiecare dintre aceste unități de procesare conține două noi blocuri de funcții matematice. Noua unitate de conversie (CVT) se ocupă cu instrucțiuni de bază întregi, logică, ramură și conversie. Unitatea funcțională specială (SFU) accelerează înmulțirea întregului, diviziunile, rădăcina pătrată, logaritmele și alte funcții întregi complexe.

Unitatea FMA standard a înregistrat câteva modificări, care acceptă 16 instrucțiuni FP32 pe ciclu, 32 FP16 sau 64 de instrucțiuni de produs INT8. Aceste optimizări produc o creștere a performanței de 60 la sută în aplicațiile de învățare automată.

Cartografierul de textură quad

Cealaltă modificare-cheie în Mali-G77 este introducerea unui mapper de textură quad, pornit de la un mapper cu textură dublă din generația anterioară. Mapperul de textură este responsabil pentru maparea poligonilor 3D dintr-o scenă în reprezentarea 2D pe care o vedeți pe un ecran. Este responsabil pentru eșantionare, interpolare și filtrare pentru a netezi conținutul în unghi și a se muta, pentru a evita margini dure, de calitate scăzută.

Anti-aliasingul cu costuri reduse rămâne în vigoare pentru a ajuta la calitatea imaginii, dar dublarea performanței texturii este beneficiul major aici. Unitatea de textură procesează acum 4 texele bilineare pe ceas până la 2 anterior, 2 texte trilineare pe ceas și gestionează mai rapid filtrarea FP16 și FP32.

Mapperul de textură quad este împărțit în două căi, oferind o conductă mai scurtă pentru firele care lovesc conținut în cache. Calea dor, care gestionează conversia formatului și decomprimarea texturii, are o interfață mai largă pentru cache L2. Acest lucru este de asemenea util pentru încărcările de lucru în învățare automată care ar putea avea nevoie frecvent pentru a extrage date noi din memorie.

Aducând totul împreună în Mali-G77

Arm a făcut o serie de alte modificări la Mali-G77 pentru a coincide cu schimbările majore din arhitectura Valhall. Blocul de control este simplificat datorită designului unității de execuție unice, în timp ce planificatorul dinamic intern permite de fapt o instrucțiune mai flexibilă care să emită în interiorul fiecărui nucleu. Cu un debit mai mare în fiecare nucleu, baza de date este de asemenea mai scurtă și mai mică în latență, până la doar 4 cicluri din 8 anterior.

Noul proiect este, de asemenea, mai bine aliniat la API-ul Vulkan, simplificând descriptorii șoferului pentru a coborâ deasupra șoferului pentru a îmbunătăți performanțele „la metal”.

În rezumat, Mali-G72 și Valhall aduc modificări importante de la Bifrost, care promit impulsuri semnificative de performanță pentru aplicațiile de jocuri și învățare automată. De asemenea, este important ca designul să se încadreze în aceleași bugete de energie și energie ca Bifrost, asigurându-se că dispozitivele mobile vor putea oferi performanțe de vârf fără a vă preocupa de costurile de căldură, energie electrică și siliciu. Pe baza proiecțiilor de performanță, Mali-G77 ar trebui să poată oferi noului Adreno de la Qualcomm o alergare bună pentru banii săi.

Nu ete nimic mai rău decât ă fii flancat de tue de vecini și de copii care plâng în timpul unui zbor internațional. Din fericire, exită uficiente căști de anulare a zgomotului (ANC) act...

Anul trecut a revenit martphone-ul de 40MP pe maă, la cinci ani după ce Nokia Lumia 1020 a livrat o cameră foto de 41MP. Ante a fot crecut în mod coniderabil de atunci, deoarece Huawei, Xiaomi și...

Alegerea Noastră