ARM im Rack — wie Graviton, Ampere und Cobalt die Server-Welt verschoben haben

Sieben Jahre nach dem ersten Graviton-Launch ist ARM in der Datacenter-Welt keine Versuchsanordnung mehr. Eine Bestandsaufnahme der Architektur-Verschiebung zwischen x86-Veteranen und neuen Marktteilnehmern.

Die Architektur-Diskussion in der Server-Welt sei für mehr als zwei Jahrzehnte eine ungewöhnlich eindimensionale gewesen: Intel-Xeon gegen AMD-Opteron beziehungsweise später AMD-EPYC, plus eine handvoll Spezialfälle (IBM Power, Oracle SPARC, frühe ARM-Versuche von Calxeda und Cavium), die nie über die akademische Aufmerksamkeit hinausgekommen seien. Im Jahr 2026 sehe dieses Bild grundsätzlich anders aus — ARM sei in der Datacenter-Welt zu einem ernsthaften dritten Pol geworden, und die x86-Welt sei in einer Verteidigungs-Position, die ihr noch vor wenigen Jahren niemand zugetraut hätte.

Die x86-Vorgeschichte: AMD-EPYC ab Naples 2017

Bevor man über ARM-Server spreche, müsse man die x86-Welt selbst sortieren. Die Intel-Dominanz im Server-Segment, die bis etwa 2017 unangefochten gewesen sei (mit Xeon-Marktanteilen jenseits der 90 Prozent), sei in den vergangenen sieben Jahren von AMD systematisch aufgebrochen worden. Die EPYC-Generation Naples (im Juni 2017 vorgestellt) sei der Auftakt gewesen; Rome (August 2019, erste 7nm-Generation mit bis zu 64 Kernen pro Sockel) der Durchbruch in die Glaubwürdigkeit; Milan (März 2021), Genoa (November 2022) und Turin (Oktober 2024) die Etappen, in denen AMD vom Underdog zum ernsthaften Marktteilnehmer geworden sei.

Die Marktanteils-Zahlen für das Server-Segment (x86-only) hätten sich entsprechend verschoben: Intel halte global im Jahr 2025 nur noch rund 75 bis 80 Prozent, AMD habe sich von rund 1 Prozent im Jahr 2017 auf rund 20 bis 25 Prozent hochgearbeitet. In bestimmten Hyperscaler-Compute-Tiers (insbesondere bei AWS, Azure und GCP für CPU-intensive Workloads) liege der AMD-Anteil punktuell höher.

Die Erzählung, AMD habe Intel im Datacenter „eingeholt”, greife zu kurz — was geschehen sei, sei eine strukturelle Diversifizierung des x86-Markts in eine echte Zwei-Anbieter-Welt nach mehr als einer Dekade Monopol.

Der ARM-Einbruch: Graviton ab 2018

Die ARM-Welt im Datacenter sei lange Zeit eine Reihe gescheiterter Anläufe gewesen. Calxeda habe 2013 Insolvenz angemeldet, Cavium ThunderX habe nie die Massentauglichkeit erreicht, Qualcomm Centriq 2400 sei 2018 nach einem ambitionierten Launch wieder eingestellt worden. Das Bild der ARM-Server-Welt sei bis kurz vor dem AWS-Graviton-Launch 2018 das einer Technologie gewesen, die zwar interessante Effizienz-Versprechen mitbringe, in der Praxis aber an Software-Ökosystem, Compiler-Reife und Marktakzeptanz scheitere.

AWS Graviton (im November 2018 als Graviton 1 in der A1-Instance-Familie vorgestellt) sei der Bruch in dieser Trajektorie gewesen. Das erste Graviton sei ein vorsichtiger Versuch gewesen — basierend auf einem ARM Cortex-A72-Design, in der A1-Familie mit überschaubarer Performance, vor allem als Test-Plattform für die ARM-Compiler-Tauglichkeit der eigenen Workloads gedacht. Graviton 2 (Dezember 2019, M6g/C6g/R6g-Familien, eigenes Neoverse-N1-basiertes Design mit 64 Kernen pro Sockel) sei dann das Modell gewesen, das die Branchen-Wahrnehmung umgedreht habe: Plötzlich seien ARM-Instanzen bei AWS preislich und im Performance-pro-Dollar-Vergleich deutlich attraktiver als die parallelen x86-Familien gewesen.

Graviton 3 (Mai 2022, Neoverse V1-Architektur, DDR5-Speicher) und Graviton 4 (November 2023, Neoverse V2, 96 Kerne pro Sockel, R8g-Familie) hätten die Linie fortgesetzt. Im Jahr 2026 betreibe AWS schätzungsweise ein Drittel seiner internen Workloads auf Graviton — und der Anteil neuer Kunden-Instanzen, die auf Graviton-Familien gebucht würden, liege deutlich höher.

Ampere als unabhängige ARM-Stimme

AWS Graviton sei eine vertikal integrierte Hyperscaler-Lösung — die Chips würden nicht extern verkauft, sondern ausschließlich in EC2-Instanzen vermietet. Wer in der eigenen On-Premises-Welt oder bei anderen Cloud-Anbietern ARM-Server wolle, brauche eine andere Bezugsquelle. Diese Rolle habe seit 2021 Ampere Computing übernommen.

Ampere (von Ex-Intel-Managerin Renée James 2018 gegründet, mit Sitz in Santa Clara) habe mit der Altra-Familie (2020/2021, bis zu 80 Kerne pro Sockel) und Altra Max (2022, 128 Kerne) eine kommerziell verfügbare ARM-Server-CPU eingeführt, die in mehreren Cloud-Anbietern (Oracle Cloud Infrastructure, Google Cloud Tau T2A, Microsoft Azure in Sub-Tiers) als Compute-Basis fungiere. Die AmpereOne-Generation (2023 vorgestellt, 192 Kerne, eigenes Core-Design statt Neoverse-Lizenz) sei der Versuch, sich aus der Arm-Limited-Standard-IP zu lösen und eine eigene Architektur-Identität aufzubauen.

Für die deutsche Hosting-Mittelschicht sei Ampere die relevantere Bezugsquelle als Graviton — Hetzner habe seit 2024 ARM-Cloud-Instanzen mit Ampere-Basis im Programm (CAX-Familie), und mehrere kleinere Anbieter zögen nach. Die Preis-Argumentation sei in diesen Angeboten ähnlich wie bei Graviton: gleiche oder bessere Performance pro Watt, niedrigerer Listenpreis pro vCPU, gut geeignete Workloads sind ein breites Spektrum von Web-Servern, Microservices, Datenbank-Replicas und Container-Hosts.

Microsoft Cobalt 100 — die jüngste Eskalation

Im November 2023 habe Microsoft die Cobalt-100-CPU angekündigt, im Frühjahr 2024 in produktive Azure-Instances ausgerollt. Cobalt 100 sei ein 128-Kern-ARM-Design auf Neoverse-N2-Basis, das Microsoft (analog zur AWS-Graviton-Strategie) ausschließlich intern in den eigenen Cloud-Diensten einsetze. Die Ankündigung sei in der Branche als Beleg gelesen worden, dass die ARM-Trajektorie kein AWS-Spezialfall sei, sondern eine Hyperscaler-übergreifende Strategie.

Google habe parallel mit den Axion-Prozessoren (im April 2024 angekündigt, in der C4A-Instance-Familie) den dritten Hyperscaler-eigenen ARM-Chip vorgelegt. Damit hätten alle drei großen US-Hyperscaler im Jahr 2026 eigene ARM-Designs im produktiven Einsatz — eine Konsolidierung, die im Server-CPU-Markt historisch ohne Vorbild sei.

Die ARM-Welt im Datacenter sei 2026 keine Versuchsanordnung mehr, sondern strukturelle Realität. Die offene Frage sei nicht mehr, ob ARM eine relevante Architektur sei, sondern wie schnell der x86-Anteil weiter schrumpfe.

Die Energie-Frage als Treiber

Die wirtschaftliche Logik hinter der ARM-Welle sei mehrschichtig, aber ein Faktor stehe im Mittelpunkt: Energie pro Compute-Einheit. Datacenter-Strom sei in der DACH-Region seit der Energiepreis-Krise 2022 ein operativer Hauptkosten-Block; Hetzner habe im Lauf der Jahre 2022 und 2023 die Preise für Dedicated Server mit explizitem Verweis auf die Strom-Komponente angepasst. In dieser Lage sei eine CPU-Architektur, die für die gleiche Compute-Leistung 20 bis 40 Prozent weniger Energie verbrauche, kein nettes Beiwerk, sondern ein Wettbewerbs-Faktor.

Die ARM-Energie-Effizienz sei historisch im Mobile-Markt entstanden, wo jedes Milliampere Akku-Laufzeit bedeute. Die Übertragung dieser Optimierungs-Tradition in die Server-Welt habe Jahre gedauert, sei aber im Stand 2026 unbestritten. Die Neoverse-N- und V-Familien, die als Lizenz-IP von Arm Limited an die Chip-Hersteller vergeben würden, seien explizit auf Server-Workloads optimiert; die Stromaufnahme pro Kern liege deutlich unter der x86-Vergleichs-Klasse.

Die Software-Welt: Compatibility und ABI

Die Frage, ob eine bestimmte Workload „auf ARM läuft”, sei im Jahr 2026 für die überwiegende Mehrheit der typischen Hosting-Workloads ein gelöstes Problem. Linux-Distributionen (Debian, Ubuntu, RHEL, Alma, Rocky) seien seit Jahren mit ARM64-Builds (aarch64) ausgeliefert; die großen Container-Registries (Docker Hub, GitHub Container Registry, Quay) führten Multi-Architektur-Images (mit linux/amd64 und linux/arm64 als Standard); Sprachen-Toolchains (Go, Rust, Python, Node.js, Java) seien auf ARM64 produktionsreif.

Die Reibungspunkte lägen in der Peripherie: Spezielle Performance-kritische Bibliotheken mit handgeschriebenen x86-Assembly-Pfaden (klassisch in Video-Codec-Welten, in Crypto-Libraries, in HPC-Numerik), proprietäre Software-Produkte mit verspäteter ARM-Portierung, ältere Datenbank-Engines mit x86-spezifischen Tuning-Annahmen. Wer auf einer ARM-Instanz eine WordPress-Site, ein Node.js-Backend, einen PostgreSQL-Cluster oder einen Container-Host betreibe, der bemerke den Unterschied nicht. Wer eine x86-Legacy-ERP-Komponente migrieren wolle, der finde mehr Stolperstellen.

Die Hardware-Kette: TSMC und die Fertigungs-Frage

Eine Dimension der ARM-Server-Welle, die in der Architektur-Diskussion oft im Hintergrund bleibe, sei die Fertigungs-Kette. Die produktive Herstellung der relevanten ARM-Server-CPUs (AWS Graviton, Ampere Altra/AmpereOne, Microsoft Cobalt 100, Google Axion) erfolge bei TSMC im taiwanesischen Hsinchu — in den jüngsten 3-Nanometer- und 5-Nanometer-Prozessknoten, die sich in der Spitze auch große Teile der x86-Welt teilten. Die Konsolidierung der Halbleiter-Fertigung auf wenige Anbieter (TSMC dominant, Samsung Foundry und Intel Foundry Services als kleinere Spieler) sei damit ein struktureller Faktor, der die ARM-Welt von ihren Anfängen unterscheide — als ARM-Chips noch in einer breiten Fertigungs-Landschaft entstanden seien.

Für die geopolitische Resilienz-Diskussion sei diese Konzentration ein eigenes Thema. Die europäische Halbleiter-Strategie (Chips Act seit 2023, mit erheblichen Förder-Programmen für Fertigungs-Ansiedlungen in Deutschland, den Niederlanden und Frankreich) ziele explizit auf eine Diversifizierung dieser Lieferkette. Die ersten produktiven Ergebnisse dieser Strategie (TSMC-Werk in Dresden im Bau, Intel-Pläne in Magdeburg in mehreren Anpassungs-Runden) lägen aber außerhalb der für 2026 verfügbaren Kapazität.

Die NVIDIA-Frage und der GH200-Sonderfall

Wer im Jahr 2026 von „ARM im Datacenter” spreche, der könne den NVIDIA-Faktor nicht ignorieren. NVIDIA habe mit dem Grace-CPU (eigene ARM-Server-CPU, im März 2022 angekündigt, in der Grace-Hopper-Kombination GH200 ab 2023 in produktiven HPC- und AI-Clustern eingesetzt) eine eigene ARM-Linie aufgebaut, die zunächst nicht den klassischen Webhosting-Markt anvisiere, aber in der KI-Inferenz-Welt eine zentrale Stellung einnehme.

Die GH200-Architektur sei ein interessanter Sonderfall: Eine ARM-CPU (72 Neoverse-V2-Kerne) sei mit einer Hopper-GPU über NVLink-C2C mit ungewöhnlich hoher Bandbreite gekoppelt. Diese Kombination eigne sich für KI-Workloads, die enge CPU-GPU-Interaktion benötigten (große Sprach-Modell-Inferenz mit häufigen Memory-Transfers), und werde in den großen KI-Cluster-Bauten der Jahre 2024 und 2025 (CoreWeave, Lambda Labs, mehrere Hyperscaler-Sonderlinien) intensiv eingesetzt. Für die klassische Hosting-Welt sei der GH200 zwar nicht direkt relevant — die strategische Botschaft, dass auch NVIDIA als zentraler Treiber der KI-Infrastruktur auf ARM setze, sei aber ein weiterer Datenpunkt im sich verschiebenden Architektur-Bild.

Die Bilanz und der Ausblick

Die x86-Welt verliere keine absoluten Märkte — die produzierte Anzahl an x86-Server-CPUs wachse weiterhin, Intel und AMD verkauften absolut mehr Einheiten als vor fünf Jahren. Was sie verliere, sei der Anteil am Wachstum: Die zusätzlichen Compute-Kapazitäten, die in die Datacenter der Welt eingebaut würden, gingen zunehmend an ARM-Designs. Diese Verschiebung sei nicht spektakulär, aber stetig.

Für die DACH-Hosting-Mittelschicht stelle sich die ARM-Frage konkret. Ein Dedicated-Server-Anbieter mit klassischem x86-Portfolio müsse entscheiden, ob er eine parallele ARM-Linie aufbaue, ob er auf die nächste x86-Generation setze, oder ob er die ARM-Welle den Hyperscalern überlasse. Die Antworten in der Branche seien gemischt: Hetzner habe sich für eine zurückhaltende ARM-Linie in der Cloud-Sparte entschieden, in der Dedicated-Sparte bleibe x86 (AMD-EPYC, Intel-Xeon) dominant. Andere Anbieter im Mittelfeld experimentierten mit Ampere-Plattformen als Premium-Linie für effizienz-bewusste Kund:innen.

Was im Jahr 2030 in den deutschen Rechenzentren stehen werde, lasse sich heute nicht seriös prognostizieren. Sicher sei nur, dass die Architektur-Frage nicht mehr eindimensional sei — und dass die Compiler-, Container- und Sprach-Ökosysteme, die diese Frage in den letzten Jahren handhabbar gemacht hätten, eine stille Infrastruktur-Leistung erbracht hätten, die in der Branchen-Berichterstattung selten gewürdigt werde.

Ressort: Server ✦

Rack