Arm Cortex-A77 - tot ce trebuie să știți

Autor: Randy Alexander
Data Creației: 2 Aprilie 2021
Data Actualizării: 1 Iulie 2024
Anonim
Ядра Cortex-A77: Увеличенная Производительность на такт MOP-кэш
Video: Ядра Cortex-A77: Увеличенная Производительность на такт MOP-кэш

Conţinut


Alături de noul său procesor grafic Mali-G77 și procesor de afișare Mali-D77, Arm a prezentat cel mai recent design al procesorului de înaltă performanță - Cortex-A77. Ca și în cazul Cortex-A76 de anul trecut, Cortex-A77 este proiectat pentru aplicații de nivel premium care necesită un semnal de consum redus de energie. Totul, de la smartphone-uri până la laptopuri și destul de probabil dincolo.

Cu Cortex-A77, Arm a vizat instrucțiunile maxime pe creșterea performanței ciclului / ceasului (IPC) pe care le-ar putea gestiona în urma Cortex-A76. Frecvențele de ceas, consumul de energie și suprafața sunt concepute pentru a rămâne aproximativ în același loc de parcare, dar noul nucleu poate zdrobi prin mai multe instrucțiuni simultan. Pentru a face acest lucru, Arm a conceput un nucleu și mai larg decât anul trecut și a făcut o serie de îmbunătățiri pentru a menține nucleul procesorului alimentat cu lucruri de făcut. Dar înainte să ajungem la asta, să ne aruncăm în rezumat la nivel înalt și numere de performanță.


Atingerea țintelor de performanță

În august 2018, Arm a împărtășit necaracteristic o foaie de parcurs a procesorului până în 2020. De la Cortex-A73 din 2016 până la designul „Hercules” din 2020, compania promite o creștere de 2,5 ori a performanțelor de calcul. O bucată corectă a acestei proiecții uriașe s-a realizat odată cu trecerea majoră a microarhitecturii cu Cortex-A76, viteze de ceas moderne mai mari, și trecerea de la 16 la 10 și acum producția de 7nm cu 5nm de urmat. Aproximativ 1,8x din câștigurile foii de parcurs au fost deja obținute până anul trecut, iar Cortex-A77 oferă o creștere suplimentară a IPC-ului cu aproximativ 20%. Acest lucru ne pune bine pe drumul de 2,5x al lui Arm, deși dispozitivele mobile cu putere limitată și bugetele termice nu așteaptă să obțină toate aceste câștiguri.

Pentru comparație, Cortex-A76 de anul trecut a oferit o creștere de aproximativ 30-35 la sută față de Cortex-A75. În acest an, ne uităm la un câștig mai mare de 20% din IPC între A77 și A76. Aceasta este o veste bună, deoarece înseamnă mai multe performanțe în timp ce respectăm constrângerile termice și de putere similare ca înainte. Compensarea este că A77 este cu aproximativ 17% mai mare decât A76, deci va costa un pic mai mult în ceea ce privește suprafața de siliciu. Dacă doriți o comparație cu liderii desktop, AMD a gestionat un impuls IPC de 15% între Zen2 și Zen +, în timp ce IPC-ul Intel a rămas practic static de ani buni.Desigur, vorbim aici despre diferite segmente de piață, dar acest lucru demonstrează modul în care echipa de proiectare a procesorului Arm a obținut câștiguri impresionante în ultimele generații.


O creștere a performanței de 20% este oferită pentru SoC-urile bazate pe Cortex-A77 pentru generația următoare

Aici este faptul că A76 a marcat o schimbare majoră microarchitecturală, cu câștiguri uriașe de performanță, în timp ce ne întoarcem la îmbunătățirile nivelului de optimizare cu A77. Cu acest lucru, să ne scufundăm în ceea ce este nou în Arm Cortex-A77.

Cortex-A77 se bazează pe microarhitectura A76

Cheia pentru înțelegerea diferenței dintre Cortex-A77 și A76 este de a înțelege ce se înțelege printr-un design de bază „mai larg”. În esență, vorbim despre capacitatea de a executa mai multe instrucțiuni pentru fiecare ciclu de ceas, ceea ce crește randamentul nucleului. Există două părți importante pentru a obține acest drept - creșterea numărului de unități de execuție care să facă procesarea și să ne asigurăm că aceste unități sunt bine alimentate cu date. Să începem cu partea din urmă și să ne concentrăm în părțile de expediere, memorie cache și predictor de ramură ale SoC.

Cortex-A77 înregistrează un spor de 50% la lățimea de expediere, până la șase instrucțiuni pe ciclu de la patru cu A76. Aceasta înseamnă mai multe instrucțiuni care se îndreaptă către miezul de execuție pentru fiecare ciclu de ceas pentru un potențial mai mare de performanță. Ca urmare, fereastra de execuție fără ordin este mai mare, crescând la 160 de intrări pentru a expune mai mult paralelism. Există un cache de instrucțiuni 64K familiar, în timp ce Buffer Target Branch (BTB), care deține adrese pentru predictorul sucursalelor, este cu 33% mai mare decât înainte pentru a gestiona creșterea în instrucțiuni paralele. Nimic neobișnuit aici, este în esență o versiune mai largă a designului de anul trecut.

Adăugarea frontală mai interesantă este noua memorie cache MOP de 1,5 K, care stochează macro-opțiuni (MOP) care sunt retrase din unitatea de decodare. Arhitectura procesorului Arm decodifică instrucțiunile din aplicația utilizatorului în macro-operațiuni mai mici și apoi mai departe în micro-opțiuni pe care le înțelege miezul de execuție. Puteți vedea acest lucru în diagrama de mai sus în secțiunea de decodare. Memoria cache MOP este utilizată pentru a reduce penalitatea de cost a ramurilor pierdute și a înroșirilor, deoarece țineți cont de macro-opțiuni, mai degrabă decât să le decodificați și crește randamentul general al miezului. Căutările de la MOP, mai degrabă decât i-cache, ocolește etapa decodificării, salvând un ciclu. Arm afirmă că memoria cache MOP poate atinge o rată de atingere de 85 la sută sau mai mult într-o gamă de sarcini de muncă, ceea ce o face un plus foarte util la i-cache-ul standard.

Trecând în partea de bază a execuției procesorului, observați adăugarea unei a patra ALU și a doua unitate ramificativă. Această a patra ALU îmbunătățește cu 50 la sută lățimea de bandă a procesului cu numărul general al procesorului. Acest ALU suplimentar este capabil de instrucțiuni de bază cu un ciclu (cum ar fi ADD și SUB), plus operații cu două cicluri, precum o înmulțire. Două dintre celelalte ALU pot gestiona doar instrucțiuni de bază cu un ciclu, în timp ce unitatea finală este încărcată cu operații matematice mai avansate, cum ar fi divizarea, înmulțirea acumulării etc. core se poate ocupa, ceea ce este util în cazurile în care două din cele șase instrucțiuni expediate sunt salturi de ramură. Acest lucru sună puțin ciudat, dar testarea internă la Arm a scos la iveală beneficiile obținute prin adoptarea acestei a doua unități.

Cortex-A77 oferă un paralelism îmbunătățit și o nouă abordare a cachelor pre-preluare

Alte modificări ale nucleului procesorului includ adăugarea unei a doua conducte de criptare AES. Conductele din magazinul de date prezintă acum porturi de emisiune dedicate pentru a dubla lățimea de bandă a problemei de memorie. Aceste porturi au fost anterior împărțite cu ALU-urile, care uneori ar putea deveni un blocaj. Există, de asemenea, un perfecționator de date de generație următoare pentru a îmbunătăți eficiența energetică, în timp ce crește lățimea de bandă la sistemul DRAM.

O parte din acest sistem din Cortex-A77 are, de asemenea, un sistem nou de preînchidere „conștient de sistem”. Acest lucru îmbunătățește performanța memoriei pe baza gamei largi de număr de nuclee ale procesorului, capacități de memorie cache și latențe și configurații ale sistemului de memorie din interiorul dispozitivelor finale. Hardware dedicat discuțiilor cu unitatea de planificare dinamică (DSU) ca parte a unui cluster CPU DynamIQ, care monitorizează utilizarea cache-ului L3 partajat. Nucleul dispune de distanțe dinamice și niveluri de agresivitate pentru a reduce utilizarea cache-ului în situațiile în care lățimea de bandă L3 este limitată de alte nuclee ale procesorului. Corele de performanță mai mare, precum Cortex-A77, sunt mai susceptibile să satureze accesul DSU la memorie, în timp ce nucleele de putere mai scăzute precum A55 sunt puțin probabil.

Se potrivesc totul

Există o mulțime de mici modificări ale Cortex-A77 care adaugă unele diferențe substanțiale față de predecesorul său. Pe scurt, noua memorie cache MOP A77 combinată cu o fereastră de instrucțiune mai largă și mai lungă ajută la menținerea ALU, a sucursalei și a unităților de memorie ocupate cu lucruri de făcut. Designul Powerhouse Cortex-A76 a fost extins pentru a-și îmbunătăți debitul și cu A77, fără a se baza pe viteze mai mari de ceas.

Cele mai mari îmbunătățiri de performanță pentru a ajunge la Cortex-A77 sub formă de matematică întreagă și punct flotant. Acest lucru este confirmat de valorile de referință interne ale Arm, care prezintă un spor de performanță de la 20 până la 35 la sută în punctele de referință ale numărului specific SPEC și respectiv în punct flotant. Îmbunătățirile pentru lățimea de bandă a memoriei se situează undeva între 15 și 20 la sută, subliniind din nou faptul că cele mai mari câștiguri apar sub forma numărării numărului. În general, aceste îmbunătățiri oferă A77 o ascensiune medie de 20% față de generația anterioară. Este posibil să vedem, de asemenea, câștiguri suplimentare, mai marginale, ca urmare a proceselor de fabricație de 7 milimetri mai avansate la sfârșitul acestui an sau la începutul anului 2020.

În ceea ce privește telefoanele inteligente, SoC-urile cu Cortex-A77 sunt destinate produselor de înaltă performanță, de înaltă performanță. Arm se așteaptă pe deplin să vadă proiectarea centralei folosind aranjamente de bază 4 + 4 biți. Având în vedere randamentul crescut și dimensiunea ușoară a dimensiunii zonei A77, vom vedea probabil că proiectanții SoC continuă în jos în tendința 1 + 3 + 4 sau 2 + 2 + 4. Cu unul sau două nuclee puternice, cu cache mai mari și ceasuri superioare, susținute de 2 sau 3 nuclee A77, cu dimensiuni de cache mai mici și ceasuri mai mici, pentru a economisi energie și zonă. În cele din urmă, Cortex-A77 vrăjește lucruri bune pentru cipurile de smartphone-uri și pe piața în creștere a laptopurilor conectate întotdeauna pe bază de Arm. Fii atent la anunțurile de siliciu la sfârșitul acestui an.

Mai devreme, The Walking Dead: Dezvoltatorul notru Mondial Next Game a anunțat un joc RPG de puzzle gratuit, bazat pe eria tranger Thing. Jocul ete diferit de cel anunțat anterior tranger Thing 3: The...

Cât de cablu mă mai urmărești? Toate cele mai bune televizoare și filme unt oricum pe ervicii de treaming precum Netflix și Hulu. Ete timpul ă a tăia legătura, iar oferta de atăzi electTV ete o a...

Vă Sfătuim Să Vedeți