Germany

Armkerne 2022: Cortex-X3, Cortex-A715 und Cortex-A510 Refresh

Basierend auf der ARMv9-Architektur stellt ARM heute die Komponenten der nächsten Generation von Chipsystemen vor, wie sie in kommenden Smartphones, Tablets und Computern zum Einsatz kommen werden. Das Upgrade von Arm Cortex-X3, A715 und A510 bietet mehr Leistung, reduzierten Stromverbrauch und ermöglicht neue Konfigurationen.

TCS22 bietet 28 Prozent mehr Spieleleistung

Cortex-X3, Cortex-A715 und Cortex-A510 Refresh sind die neuen ARM-CPU-Kerne für 2022 und Teil des Rechenleistungsabschnitts von Total Compute Solutions 2022 (TCS22), der auch Entwicklerzugriff und Sicherheit umfasst. Dieser Arm nennt in diesem Jahr eine eigene IP-Komplettlösung. Die relevanten Produkte, d.h. Prozessoren sollen erst 2023 auf den Markt kommen. In einer typischen 1 + 3 + 4-Konfiguration verspricht der TCS22 eine durchschnittlich 28%ige Steigerung der Spieleleistung gegenüber dem TCS21 mit Cortex-X2, Cortex-A710 und Cortex-A510.

Beispielkonfiguration für TCS22 (Bild: Arm)

Allerdings fließen nicht nur die neuen Cortex-Kerne in diesen Test ein, sondern insbesondere auch der neue Grafikprozessor Immortalis G715 und „DynamIQ Shared Unit“-Optimierungen. Neben der Immortalis-G715 mit Hardware-Beamtracing hat Arm heute auch die Mali-G715 und Mali-G615 als neue Grafikmodule vorgestellt. ComputerBase behandelt alle drei neuen GPUs, die auf der Architektur von Valhall basieren, in einem separaten Artikel.

Entwicklung der letztjährigen Premiere von Armv9

Mit TCS21 hatte der Armv9 vor etwa einem Jahr Premiere mit zugehörigen Präsentationen des Cortex-X2, Cortex-A710 und Cortex-A510 sowie des DSU-110 und Mali-G710. TCS22 baut darauf auf und bleibt somit ISA-konform. Neben einer um durchschnittlich 28 Prozent gesteigerten Spieleleistung soll TCS22 in diesem Szenario den DRAM-Traffic um bis zu 23 Prozent und den Stromverbrauch um bis zu 16 Prozent im Vergleich zur typischen Konfiguration für High-End-Smartphones reduzieren. Mit der neuen IP, der Unterstützung von Komponenten wie Cortex-M85 und Softwareoptimierungen erzielt TCS22 auch beim maschinellen Lernen deutliche Zuwächse. Arm stellte auch prozentuale Veränderungen der einzelnen Komponenten von TCS22 im Vergleich zum Vorjahr vor, auf die später im Artikel eingegangen wird.

  1. Änderungen an TCS22 anzeigen (Bild: Arm)

Bild 1 von 4

DSU ist bereit für schnelle Laptops

Neu im Spektrum der möglichen Konfigurationen ist die Unterstützung von bis zu zwölf Kernen im „DynamIQ Shared Unit-110“ (DSU-110)-Cluster, das ARM im vergangenen Jahr vorgestellt hat. Diese Änderung ermöglicht neue High-End-Konfigurationen, die für zukünftige Arm-Computer benötigt werden. Im Rahmen des Client Tech Day erwähnte Arm ein Setup mit acht Cortex-X3 und vier Cortex-A715, ohne jedoch den Cortex-A510 als Beispiel aufzufrischen. Ebenso lässt sich damit ein SoC mit zwölf extrem sparsamen kleinen Kernen realisieren. Mit TCS22 will Arm nicht nur Gamer, sondern insbesondere auch Gamer erfreuen und hat daher in diesem Bereich neue Kerne für konstant hohe Leistung konzipiert, ohne den Spielspaß zu schmälern.

Die Mikroarchitektur des DSU-110 hat sich nicht wesentlich verändert, Arm spricht vom notwendigen „Tuning“, um das Design für die zusätzlichen Kerne vorzubereiten. Außerdem gab es Updates für Bereiche, die von der Anzahl der Kerne abhängen, wie zum Beispiel Core-Mapping-Kernel-Register, sowie Testmethoden für die physikalische Leistung mit einem neuen Grundriss.

Theoretisch können Partner mit dem aktualisierten DSU-110 nun auch bis zu zwölf Kerne aus der letztjährigen IP einbauen. Wenn jedoch die neuesten ISA-Funktionen wie Asymmetric MTE und EPAN verwendet werden sollen (Erklärung im nächsten Absatz), muss die neueste IP verwendet werden.

  1. Arm-Laptops und -Computer erwarten eine neue 8+4+0-Konfiguration (Bild: Arm)

Bild 1 von 3

Arm erweitert Sicherheitsfunktionen

In puncto Sicherheit bringt der neue Rechencluster Unterstützung für Asymmetric MTE als Erweiterung der im vergangenen Jahr mit ARMv9 eingeführten Memory Marking Extension (MTE). Die Speicherbereiche und zugehörigen Pointer werden mit dem gleichen Tag versehen und von der CPU auf Übereinstimmung geprüft. Wenn es eine Nichtübereinstimmung gibt, unterbricht der Prozessor die Verarbeitung. Mit Asymmetric MTE kann der Prozessor diesen Fehler während eines Boot-Befehls auslösen und einen Speicherbereich während eines Speicherbefehls asynchron aktualisieren.

TCS22 bekommt Sicherheitserweiterungen (Bild: Arm)

Mit EPAN („Enhanced PAN“) folgt ARM zudem dem bisherigen PAN „Privileged Access Never“, das darauf abzielt, den Zugriff auf weniger privilegierte Bereiche des Speichers im User-Modus, etwa auf Kernel-Ebene, zu verhindern. Das Sicherheitsfeature zielt darauf ab, einen Angriff im Benutzermodus durch Cheaten des Kernels zu verhindern. Ein Fehler in den ARM-Spezifikationen verhinderte jedoch nicht den Zugriff auf Speicherseiten im Benutzermodus, der als “nur ausführen” gekennzeichnet war. “Improved PAN” zielt darauf ab, diese Tatsache zu korrigieren.

Die Immortalis-GPU beherrscht Hardware-Beamtracking

Arm führt mit TCS22 neue Grafikmodule für das Flaggschiff- und Premiumsegment ein. Das neue Flaggschiff ist die Immortalis G715, die mit bis zu 16 GPU-Kernen integriert werden kann. Die beiden wesentlichen Neuerungen der Immortalis-G715 sind Hardware-Raytracking über eine neue RTU („Ray Tracing Unit“) im Shaderkern und Unterstützung für „Variable Speed ​​Shading“ (VRS). Neben der Immortalis-G715 ist auch die Mali-G715 neu und bietet mit Ausnahme der RTU die gleichen Änderungen wie die VRS und Motoroptimierungen für die Leistung. Gleiches gilt für die Mali-G615, die mit weniger Shaderkernen konfiguriert werden kann und optional weniger L2-Cache besitzt.

  1. Drei neue GPUs, eine davon mit Hardware-Beamtracking (Foto: Arm)

Bild 1 von 2

CoreLink CI-700 und NI-700 bleiben fast gleich

Arm hat Cache-Optimierungen für die CoreLink CI-700- und NI-700-Verbindungen vorgenommen, die verwendet werden, um System-IP-Adressen und IP-Adressen von Drittanbietern zu verbinden, die intern von anderen Anbietern entwickelt wurden. Beispielsweise bei der Verwendung von (asymmetrischem) MTE für eine bessere Skalierbarkeit. An den CoreLink CI-700 können weiterhin ein bis acht DSU-Cluster und acht Speichercontroller angeschlossen werden – jeweils eine Komponente ist bei Smartphones üblich. CoreLink CI-700 ist mit sogenannten XP-Knoten konfiguriert, die in einem Netzwerk von bis zu 4 × 3 Punkten existieren können, von denen jeder maximal acht Cache-Slices auf Systemebene bis zu 4 MB haben kann. SLC wird auch von Arm verwendet, um MTE-Tags zu speichern.

Optimierungen für moderne Produktionsprozesse

Arm optimiert physisches IP, damit es in Kombination mit modernsten Herstellungsverfahren wie 5 nm und 4 nm, wie sie beispielsweise von Samsung und TSMC angeboten werden, besser genutzt werden kann. Der TCS22 unterstützt jetzt auch die Cortex-M85-Anbindung, die sich für Embedded-Lösungen wie Smart Speaker eignet, aber mit seinen DSP- und Machine-Learning-Features auch als Permanent-On-Prozessor fungieren kann, um beispielsweise Smartphone-Sprachbefehle zu verarbeiten. Wenn der kleinere Cortex-M55 verwendet wird, können die benutzerdefinierten Arm-Befehle, die bei ihrer Einführung auf den Cortex-M33 beschränkt waren, jetzt auch darauf ausgeführt werden.

  1. Optimierungen für moderne Produktionsprozesse (Bild: Arm)

Bild 1 von 2

Neue Tools für Entwickler

Bei den Software- und Entwicklertools bietet Arm TCS22-Unterstützung für das neueste Android, das voraussichtlich im Herbst in Version 13 erscheinen wird, und stellt in Kürze eine neue feste virtuelle Plattform (FVP) zur Verfügung, die ein vollständiges Arm-System basierend auf den neuen Komponenten bietet , muss es möglich sein, die ungefähre Geschwindigkeit der realen Hardware zu simulieren. FVP bietet ARM für Windows- und Linux-Betriebssysteme. Zu den Entwicklertools gehören auch das Hardware Success Kit und das Software Success Kit, die Arm bald in einer neuen, für TCS22 angepassten Generation zur Verfügung stellen will.

Neue Tools und Kits für Entwickler (Foto: Arm) Seite 1/3 Nächste SeiteCortex-X3: In Texas ist alles größer