Dans la Mecque des bricoleurs informatiques, le quartier scintillant de néons de Akihabara, à Tokyo, au Japon, quelques geeks ont récemment vu apparaître des panonceaux peu ordinaires : des restrictions d’achat sur les disques durs et autres barrettes de mémoire vive (RAM), particulièrement utiles pour le stockage d’informations et la rapidité de traitement d’un ordinateur. Pas plus de huit articles dans le panier, signalent des affiches. Sur les sites spécialisés, les clients ont vite remarqué l’emballement : le prix de certaines RAM a crû de 500 %, celui de disques durs de 100 %. Tous les signes avant-coureurs d’une pénurie.
Quelques fabricants d’ordinateurs, comme Dell ou HP, l'ont confirmé sans détour ces dernières semaines : les prix vont grimper. Car ces composants représentent jusqu’à un cinquième de leur tarif final. Et la contagion pourrait s’étendre au-delà. Des smartphones aux véhicules modernes, en passant par les simples clés USB et les équipements médicaux : toute l’électronique mondiale a également besoin de ces pièces dédiées à la mémoire pour son bon fonctionnement. "Les appareils les plus touchés seront clairement les smartphones d’entrée de gamme à moins de 300 euros, mais chaque fabricant fixera sa stratégie en fonction de la variation du prix d’achat et sa capacité à bien négocier", a estimé un responsable de Motorola dans Le Parisien. La réaction d’Apple est très attendue. Que se passe-t-il au juste ?
Le boom des puces HBM
La cause se trouve loin des étals d’Akihabara : dans les salles climatisées des data centers. La demande en intelligence artificielle générative dope désormais la croissance en composants mémoire. Les agents de conversation comme ChatGPT, Claude, Gemini ou Le Chat en ont besoin pour mémoriser les conversations et y répondre de manière pertinente. Ces composants mémoire permettent aussi aux utilisateurs de réaliser des commandes (ou prompts) plus longues. Ce que l’on appelle le "contexte". Aux débuts de ChatGPT, il y a trois ans, celui-ci s’étendait à environ 4 000 "tokens" ou 3 000 mots - un très long article de presse. Aujourd’hui, il dépasse allègrement les 200 000 tokens, voire un million. Au moins cinq à dix romans complets.
Tous les serveurs IA requièrent donc aujourd’hui une puce spéciale, dite HBM (High Bandwitch Memory), pour mémoire à large bande passante. Moins stratégiques que les désormais célèbres puces "GPU", décisives pour le calcul, elles demeurent néanmoins indispensables pour la montée en gamme des modèles d'intelligence artificielle générative. Cela s’est d’ailleurs matérialisé dans les ventes. "Les produits mémoire occupaient la deuxième place en termes de ventes, avec une augmentation de 78,9 % en 2024 pour atteindre un total de 165,5 milliards de dollars", note l’une des principales associations de semi-conducteurs au monde, la SIA, dans son rapport 2025. La World Semiconductor Trade Statistics estime quant à elle que la mémoire devrait connaître le plus grand bond en termes de vente en 2026, avec plus de 40 % de croissance. La puce HBM y contribuera en majorité. OpenAI a notamment signé des accords préliminaires avec Samsung et SK Hynix pour son projet Stargate, qui demande jusqu’à 900 000 plaquettes HBM par mois d’ici 2029, ce qui représente le double de la production mondiale actuelle.
Le problème est que ce composant est fabriqué par les mêmes constructeurs que les autres puces mémoires qui alimentent les smartphones ou les ordinateurs, sur une technologie antérieure dite DRAM. Deux acteurs sud-coréens, SK Hynix et Samsung, ainsi qu’un américain, Micron, règnent sans partage sur ce marché. Or "la technologie HBM se vend plus cher que la DRAM, et les marges sont meilleures", note Khaled Maalej, patron de l’entreprise de semi-conducteurs Vsora. La tentation de délaisser la production des autres puces est forte. Micron a ainsi abandonné, cette semaine, la production de mémoire pour le grand public, se concentrant sur les usages professionnels liés à l’IA. Samsung a un temps pensé à faire de même, avant de rétropédaler, selon Reuters. SK Hynix a atteint des sommets en Bourse grâce au HBM, une catégorie qu’elle domine technologiquement à la manière de Nvidia dans les GPU. Pas de quoi, donc, arranger la pénurie naissante.
"L’irrationalité de l’IA n’a pas été envisagée"
Claire Troadec et Pierre Cambou, analystes au sein de Yole Group, une société spécialisée dans la recherche sur les semi-conducteurs, décrivent un "empilement de tensions". L’IA absorbe une part croissante de la capacité mondiale, les fabricants de smartphones remplissent leurs entrepôts pour la fin d’année et le Nouvel an chinois - des périodes de forte vente -, et la mémoire reste un produit historiquement volatil, dont les produits sont interchangeables. Trois forces qui, combinées, créent un marché instable, presque spéculatif.
Le retour à la normale ne se produira pas avant fin 2026, estiment Claire Troadec et Pierre Cambou : "Ce serait se mentir que de croire que la situation est temporaire." Il faut que de nouvelles usines soient construites. Mais l’industrie des puces ne lance pas ce genre de chantier à la légère. Certains cycles sont brutaux. Il y a deux ans, une chute de la demande en mémoire avait entraîné des pertes importantes au sein de plusieurs entreprises du secteur. Toutes ne se sont pas encore remises du choc. Une même prudence est observée dans le domaine du HBM. Si la "bulle IA" explose, les commandes pourraient se tarir.
En attendant, les alternatives à Micron, SK Hynix et Samsung sont rares. Toute première gamme de puces à avoir été lancées, les "mémoires" ont perdu de leur attrait au fil des décennies face aux puces logiques, comme les CPU ou les GPU. Aujourd’hui, ces dernières accaparent la majorité des investissements dans l’IA. Mais cette crise pourrait toutefois profiter à certains. Les fabricants chinois de mémoire DRAM d'entrée de gamme, comme ChangXin Memory Technologies (CXMT) ou YMTC, tiennent ici une opportunité unique de monter en gamme, observent les stratèges de Yole Group. Et de récupérer des parts de marché qu’abandonnent les fabricants sud-coréens et américains. L’Europe, elle, reste spectatrice. Depuis la faillite de l’allemand Qimonda en 2009, elle ne produit presque plus de puces mémoire sur son sol.
"L’industrie des puces n’a jamais vécu une croissance aussi forte sur la demande en computing, c’est un élément nouveau", pointe Khaled Maalej, qui y voit un bouleversement plus profond. "Un vrai retournement se produit. Avant, le marché des puces était dicté par le smartphone, le sans-fil (wireless). Maintenant c’est le data center." Un constat partagé par les analystes de Yole Group. "L’irrationalité de la demande en IA n’avait pas été envisagée. Depuis 2024, nous augmentons nos prévisions en termes de demande à chaque trimestre. Du jamais-vu. Il y a une dizaine de projets d’usines dans le monde, à plusieurs milliards de dollars. Et cela ne suffit toujours pas." D’autres secousses sont à prévoir.

il y a 10 hour
1











English (US) ·