Actualité : Claude Opus 4.7 : Anthropic déploie son modèle le plus puissant et creuse l'écart en codage agentique

il y a 1 day 1

Publicité, votre contenu continue ci-dessous

Publié le 16/04/26 à 18h29

Nos réseaux :

Lancé ce 16 avril 2026, Claude Opus 4.7 affiche des gains substantiels sur les benchmarks de référence, notamment en ingénierie logicielle autonome, et introduit un support visuel haute résolution inédit dans la gamme.

Anthropic déploie son modèle le plus puissant et creuse l'écart en codage agentique

Anthropic poursuit sa cadence soutenue de publications. Deux mois seulement après Opus 4.6, la firme met en production son successeur, disponible dès aujourd'hui pour les abonnés Pro, Max, Team et Enterprise, ainsi que via l'API, Amazon Bedrock, Vertex AI et Microsoft Foundry. Le tarif reste inchangé : 5 dollars par million de tokens en entrée, 25 en sortie.

Des performances mesurables sur les benchmarks agentiques

Les chiffres parlent d'eux-mêmes, puisque sur SWE-bench Pro, référence en codage agentique, Opus 4.7 atteint 64,3 %, contre 53,4 % pour son prédécesseur, 57,7 % pour GPT-5.4 et 54,2 % pour Gemini 3.1 Pro. Sur SWE-bench Verified, le score grimpe à 87,6 %. En raisonnement de niveau doctoral (GPQA Diamond), le modèle se hisse à 94,2 %, au coude-à-coude avec GPT-5.4 Pro (94,4 %).

Benchmarks comparés d'Opus 4.7 face à Opus 4.6, GPT-5.4, Gemini 3.1 Pro et Mythos Preview sur 13 évaluations.

Au-delà des scores bruts, Opus 4.7 traite les images à une résolution trois fois supérieure à celle d'Opus 4.6, un bond qui rejaillit directement sur la qualité des interfaces, diapositives et documents générés. Côté API, un nouveau palier d'effort baptisé "xhigh" s'intercale entre "high" et "max", offrant aux développeurs un contrôle plus fin du compromis entre profondeur de raisonnement et latence.

Opus 4.7 surpasse Opus 4.6 à chaque palier, avec un rendement supérieur pour un budget de tokens inférieur.

Un modèle taillé pour l'autonomie prolongée

L'ambition d'Anthropic est limpide sur le terrain : confier à Opus 4.7 des tâches longues et complexes avec un minimum de supervision. Le modèle auto-vérifie ses sorties avant de rendre la main, conserve sa cohérence sur l'intégralité de sa fenêtre de contexte d'un million de tokens et gère des projets multi-sessions de bout en bout.

Précision notable : Opus 4.7 n'est pas le modèle le plus puissant d'Anthropic, puisque Claude Mythos Preview, réservé à un cercle restreint de partenaires en cybersécurité dans le cadre du Project Glasswing, affiche 77,8 % sur SWE-bench Pro. Anthropic opère donc une stratégie à deux voies : Opus pour le commerce, Mythos pour la frontière.

Suivez toute l'actualité des Numériques sur Google Actualités et sur la chaîne WhatsApp des Numériques

Envie de faire encore plus d'économies ? Découvrez nos codes promo sélectionnés pour vous.

Publications qui peuvent vous intéresser

Lire l’article en entier