GPUBreach Attack Allows CPU Privilege Escalation via GDDR6 Flips
Origines et historique
Genèse du problème RowHammer
RowHammer est une vulnérabilité matérielle liée à la conception des matrices DRAM, observée depuis la première décennie des années 2010. Sous certaines conditions, des accès répétés à une rangée de mémoire provoquent des perturbations électriques qui font basculer des bits dans des rangées voisines. Ces « bit-flips » sont le fruit de limitations physiques: couplage capacitif, densité de cellules et timings agressifs des contrôleurs mémoire. En 2016, l'exploit Drammer a montré la dangerosité opérationnelle de RowHammer en obtenant des privilèges root sur des appareils Android en exploitant des erreurs de DRAM².
Extension vers les GPU
Historiquement, RowHammer concernait la DRAM système. Avec la généralisation de modules mémoire dédiés aux cartes graphiques et l'adoption massive de GDDR6, la même classe de défauts a été observée côté GPU. Des travaux récents évoquent des attaques baptisées GPUBreach, GDDRHammer et GeForge, qui adaptent la mécanique de RowHammer à la topologie et aux timings des mémoires graphiques. Le passage du domaine CPU vers le domaine GPU n'a rien d'anecdotique: les contrôleurs GDDR6 peuvent présenter des marges électriques différentes et des fenêtres d'accès que des pilotes ou des API compute exposent aux applications utilisateur¹.
Dates et contexte récent
Une preuve d'attaque nommée GPUBreach a été rendue publique en avril 2026 et a attiré l'attention parce qu'elle documente des bit-flips dans de la GDDR6 menant, dans certains scénarios, à de la corruption de structures critiques et à une élévation de privilèges côté noyau¹. Les publications et démonstrations montrent que l'attaque peut s'appuyer sur des kernels compute et des buffers partagés pour générer les motifs d'accès nécessaires, puis exploiter une corruption pour modifier des métadonnées sensibles¹.
Fonctionnement technique
Architecture mémoire GDDR6 - points sensibles
La GDDR6 est conçue pour des débits très élevés par pin et pour des latences faibles, ce qui implique des timings serrés et une densité de cellules importante. Ces caractéristiques réduisent certaines marges de sécurité électrique et rendent plus critique l'implémentation du contrôleur mémoire. Selon le modèle et le firmware, un contrôleur peut exposer des chemins DMA, des mappings de VRAM accessibles depuis l'espace utilisateur ou des mécanismes de partage de mémoire entre processus et pilote. Ces différences d'implémentation expliquent pourquoi la vulnérabilité est spécifique à certains modèles et configurations¹.
Mécanique d'une attaque GDDRHammer / GPUBreach
- Reconnaissance locale: l'attaquant exécute du code utilisateur capable d'invoquer intensément la mémoire GPU, typiquement via des shaders compute ou des appels API bas niveau. Ce code vise à allouer et toucher de larges zones de VRAM, tout en observant le comportement du matériel.
- Localisation de rangées vulnérables: en instrumentant des motifs d'accès et en corrélant plantages, erreurs et latences, l'attaquant identifie des rangées susceptibles de subir des bit-flips.
- Hammering intensif: des kernels GPU optimisés effectuent des lectures/écritures répétées sur des rangées adjacentes pour maximiser les perturbations capacitives et provoquer des bit-flips dans les lignes cibles.
- Exploitation logique: un bit-flip est utilisé pour corrompre une structure critique telle qu'une table de pages, une entrée de descriptor ou une métadonnée de pilote. La corruption ouvre la possibilité d'une redirection d'écriture ou d'une élévation d'accès mémoire.
- Escalade: en enchaînant modifications et vérifications, l'attaquant peut injecter un payload ou altérer des permissions pour obtenir une exécution de code privilégié ou le contrôle de l'hôte.
Contraintes pratiques et innovations des chercheurs
L'adaptation de RowHammer au GPU impose de résoudre deux défis principaux: générer des motifs d'accès suffisamment intenses depuis des unités de calcul massivement parallèles et localiser de façon fiable les cellules vulnérables malgré le bruit provoqué par la contention et le scheduler GPU. Les équipes ont emprunté des méthodes issues du monde CPU, telles que des stratégies d'éviction et d'observation fine des timings, et les ont adaptées au contexte GPU. Elles ont aussi développé des moyens de réduire le bruit observable côté hôte pour améliorer la précision du ciblage¹.
Études de cas
Cas 1: GPUBreach (avril 2026)
La démonstration GPUBreach a montré qu'un processus non privilégié, en lançant des shaders compute et en manipulant des buffers partagés, peut provoquer des bit-flips dans de la GDDR6 et, sous conditions favorables, corrompre des structures exploitables pour atteindre le noyau¹. Les preuves indiquent que la réussite dépend fortement du modèle de GPU, de la version du pilote et des paramètres firmware.
Cas 2: Drammer - analogie historique
Drammer, publié en 2016, reste une référence pour comprendre la chaîne d'exploitation RowHammer: reconnaissance, hammering, détection de flips, puis exploitation des corruptions pour obtenir un accès root sur Android². GPUBreach reprend la même logique générale mais doit composer avec l'architecture GPU, la topologie VRAM et le modèle de pilote.
Cas 3: attaques cloud et implications multi-tenant
Les environnements cloud qui proposent des instances avec GPU partagé ou partitionné sont particulièrement exposés. Si la séparation logicielle ou matérielle entre locataires est incomplète, un locataire malveillant pourrait exécuter des workloads intensifs sur la GDDR6 et tenter de compromettre d'autres instances co-localisées. La menace devient critique lorsque des GPU sont utilisés pour l'inférence, le rendu ou des workloads hétérogènes qui nécessitent des mappings partagés ou des opérations en mode passthrough¹.
Perspectives
Mesures immédiates et court terme

Les équipes en charge des pilotes et de l'exploitation doivent restreindre les allocations et les mappings VRAM accessibles aux processus non privilégiés et limiter l'exposition d'API bas niveau qui permettent des motifs d'accès intenses. Les administrateurs systèmes doivent appliquer les mises à jour pilotes et firmware dès leur disponibilité et surveiller les charges GPU suspectes. En production, la journalisation des accès mémoire et des patterns d'utilisation anormaux aide à détecter des tentatives de hammering.
Mitigations matérielles et à moyen terme
Activer l'ECC sur les modules GDDR6 disponibles améliore significativement la résistance aux bit-flips, mais toutes les cartes grand public ne proposent pas cette option. Le Target Row Refresh (TRR) et des stratégies de refresh adaptatif réduisent également la probabilité de flips en rafraîchissant les rangées voisines de façon ciblée. À plus long terme, les contrôleurs mémoire GPU doivent intégrer des protections anti-hammering dès la phase de conception et rendre leurs mécanismes configurables par le firmware pour permettre des déploiements variés sans sacrifier la sécurité.
Implications pour l'industrie
Les fournisseurs cloud et les fabricants de matériel doivent réévaluer la posture de multi-tenancy pour les GPU et concevoir des politiques de segmentation plus strictes. Les opérateurs doivent préparer des compromis entre sécurité et performance: certaines mitigations auront un impact sur le débit et la latence. Sur le plan de la gouvernance, il faut intégrer ces vecteurs physiques dans les analyses de risque et les tests d'intrusion.
La transposition de RowHammer vers la mémoire graphique élargit la surface d'attaque et augmente la criticité des vulnérabilités matérielles. Les équipes sécurité, firmware et exploitation doivent coopérer pour réduire rapidement la surface exposée et préparer des correctifs durables qui s'attaquent à la racine du problème¹²³.