Les États-Unis forcent Anthropic à désactiver Claude Fable 5 et Mythos 5 : les coulisses du clash

Temps de lecture : 5 min

Points clés à retenir

  • Mythos 5 : un système si dangereux qu’il a identifié des failles dans tous les systèmes d’exploitation et navigateurs testés, réservé à 50 organisations sous contrat.
  • Fable 5 : version bridée de Mythos sortie il y a trois jours, déjà au centre d’une controverse sur un « jailbreak potentiel ».
  • Conséquences : Anthropic dénonce une décision qui, selon elle, « stopperait tous les déploiements de modèles frontaliers » si elle devenait la norme.

Le gouvernement américain a ordonné vendredi à Anthropic de désactiver immédiatement l’accès à ses deux modèles d’intelligence artificielle les plus puissants — Claude Fable 5 et Claude Mythos 5 — évoquant des préoccupations de sécurité nationale. Anthropic a annoncé sur X s’être conformé, mais a clairement fait savoir qu’elle estime que l’administration s’est trompée sur ce coup.

Ce qu’il faut comprendre : la directive, reçue vendredi à 17h21 heure de l’Est, oblige l’entreprise à désactiver les deux modèles pour tous les utilisateurs dans le monde. Pas seulement les ressortissants étrangers visés par le contrôle des exportations, comme le suggérait l’ordre initial. Les autres modèles d’Anthropic ne sont pas concernés.

Pourquoi Mythos 5 est-il dans le viseur ?

Mythos 5 est le modèle le plus avancé d’Anthropic. La société l’avait présenté en avril dernier et avait immédiatement choisi de le restreindre drastiquement en raison de ce qu’elle décrivait comme une capacité exceptionnelle à détecter des vulnérabilités dans les logiciels. En clair, lors des tests, Mythos a identifié des failles dans tous les systèmes d’exploitation et navigateurs majeurs soumis à son analyse.

Plutôt que de le diffuser largement, Anthropic a lancé un programme contrôlé baptisé Project Glasswing, partagé avec une cinquantaine d’organisations triées sur le volet, dont Amazon, Apple, Google, Microsoft et CrowdStrike, pour un usage défensif en cybersécurité.

Fable 5, la version « grand public » déjà controversée

Il y a tout juste trois jours, Anthropic a lancé Fable 5, une version de Mythos dotée de garde-fous censés bloquer les réponses dans des domaines à risque comme la cybersécurité et la biologie. L’objectif était de le rendre suffisamment sûr pour une diffusion générale. Selon les benchmarks de Vals AI, Fable 5 était immédiatement le modèle d’IA le plus performant accessible au public.

Dans les faits, le gouvernement a cadré son ordre comme une mesure de contrôle des exportations. Mais dans un long billet de blog, Anthropic révèle que la véritable inquiétude viendrait d’un « jailbreak potentiel, étroit et non universel » de Fable 5. Jusqu’ici, l’administration n’a fourni que des preuves orales. Selon Anthropic, il s’agirait simplement d’inciter le modèle à lire une base de code spécifique et à identifier des failles — une capacité déjà présente dans d’autres modèles publics, comme GPT-5.5 d’OpenAI.

La défense d’Anthropic : des garde-fous indépendants

Anthropic avance un argument technique de taille : ses protections les plus robustes reposent sur des systèmes classifieurs indépendants fonctionnant séparément du modèle lui-même. Autrement dit, même si quelqu’un convainc Fable de continuer à parler après un refus, les protections sous-jacentes contre les sorties les plus dangereuses restent opérationnelles.

Visiblement, cela n’a pas suffi. La frustration est palpable : « Nous ne croyons pas qu’un jailbreak potentiel, étroit et non universel, justifie le rappel d’un modèle commercial déployé auprès de centaines de millions de personnes », écrit Anthropic. La société prévient que si cette norme s’appliquait à l’ensemble du secteur, « cela stopperait tous les nouveaux déploiements de modèles frontaliers. »

Le timing gênant pour une future IPO

Anthropic est largement attendu sur le marché de l’introduction en Bourse (IPO) dans l’année. La société a bâti son image publique sur l’alternative safety-conscious face à ses concurrents. L’ironie de la situation n’échappe à personne : la prudence même dont Anthropic a fait preuve en restreignant Mythos — en le présentant comme un modèle si dangereux qu’il ne pouvait pas être diffusé — a attiré le regard du gouvernement, au point de perturber son activité.

Sam Altman, PDG d’OpenAI, n’aurait pas manqué de savourer le moment. En avril, il avait qualifié la communication d’Anthropic autour de Mythos de « marketing basé sur la peur ». « C’est clairement un marketing incroyable de dire : nous avons construit une bombe, nous allions la lâcher sur votre tête, nous allons vous vendre un abri anti-bombe pour 100 millions de dollars », avait-il lancé. Altman n’avait pas prédit d’interdiction gouvernementale, mais il avait identifié un risque : quand on passe des mois à dire au monde que son IA est dangereuse, le monde — y compris le gouvernement américain — a tendance à écouter.

En attendant, les développeurs et les entreprises qui utilisaient Fable 5 ne peuvent plus y accéder. La décision américaine pourrait créer un précédent dans la régulation des modèles d’IA les plus avancés. Ce qu’il faut retenir : désormais, la sécurité des modèles n’est plus un argument marketing — c’est un sujet politique et réglementaire de première importance.