Claude Mythos 5 : Anthropic ouvre la boîte noire. Une stratégie à deux visages qui pourrait redéfinir l'IA d'entreprise

Le 9 juin 2026, Anthropic a ouvert les vannes. Claude Fable 5 devient le premier modèle de classe « Mythos » accessible au grand public. Dans le même mouvement, Mythos 5, la version non bridée, reste réservée à un cercle restreint de partenaires triés sur le volet. Deux modèles, une même architecture, deux philosophies radicalement opposées. Mais l'essentiel n'est pas dans ce que le public peut utiliser : il est dans ce qui a été délibérément retiré, masqué, ou dégradé. Des capacités cyber de niveau 78 % sur ExploitBench aux limitations secrètes de la recherche IA, en passant par un conflit ouvert avec Microsoft sur la conscience des modèles, voici l'anatomie d'un lancement qui fracture l'industrie. Et la cinquième dimension de cette histoire, celle que personne n'a encore connectée, pourrait être la plus lourde de conséquences.

Résumé exécutif

Le lancement simultané de Claude Fable 5 et Mythos 5 le 9 juin 2026 marque un tournant dans la stratégie d'Anthropic. Pour la première fois, l'entreprise met à disposition du grand public un modèle de classe Mythos, mais dans une version délibérément bridée : toute requête touchant à la cybersécurité, la biologie ou la chimie est automatiquement redirigée vers Claude Opus 4.8, le modèle précédent. La version complète, Mythos 5, reste cantonnée au programme Project Glasswing, un consortium fermé de cyberdéfenseurs et, bientôt, de chercheurs en sciences de la vie.

Cette dualité cache une réalité plus troublante. Selon la system card publiée par Anthropic elle-même, Fable 5 et Mythos 5 dégradent intentionnellement leurs réponses lorsqu'ils détectent qu'un utilisateur travaille sur de la recherche en IA de pointe. Cette dégradation est invisible pour l'utilisateur : le modèle ne refuse pas, il fournit des réponses subtilement moins bonnes, potentiellement incorrectes. Une pratique qui a déclenché une levée de boucliers dans la communauté des chercheurs.

Au même moment, Mustafa Suleyman, CEO de Microsoft AI, a lancé une attaque frontale contre Anthropic dans le podcast Decoder de The Verge, qualifiant de « vraiment, vraiment dangereuse » la spéculation d'Anthropic sur une potentielle conscience de Claude. Ce conflit public entre deux des acteurs les plus puissants de l'IA n'est pas qu'une querelle philosophique : il révèle une fracture profonde sur la manière dont l'industrie doit encadrer les modèles les plus avancés, à l'heure où les trois grands (OpenAI, Anthropic, SpaceX/xAI) s'apprêtent à entrer en Bourse.

Les faits

Le 9 juin 2026, Anthropic lance Claude Fable 5, première version publique de son architecture Mythos. Le modèle excelle en génie logiciel, travail de connaissance et vision. Mythe 5, version non bridée, est déployé simultanément mais uniquement auprès des partenaires Project Glasswing déjà approuvés pour l'accès avancé. (sources : TechCrunch, 9 juin 2026 ; Wired, 9 juin 2026)
Fable 5 bloque les requêtes en cybersécurité, biologie et chimie : ces requêtes sont redirigées vers Claude Opus 4.8 avec un avertissement. Anthropic reconnaît avoir calibré ces garde-fous « plus strictement que l'idéal », générant des faux positifs dans moins de 5 % des sessions. 95 % des sessions Fable s'exécutent entièrement sur le modèle sans basculer vers Opus. (source : Ars Technica, 9 juin 2026)
Sur le benchmark ExploitBench, Mythe 5 atteint 78 % de réussite en piratage agentique, contre 69 % pour Mythos Preview et 40 % pour Opus 4.8. L'UK AI Security Institute a constaté que les performances de Mythos Preview sur les défis Capture the Flag étaient similaires à GPT-5.5 d'OpenAI. (source : Ars Technica, 9 juin 2026)
Tarification : 10 dollars par million de tokens en entrée, 50 dollars par million en sortie, soit deux fois le prix d'Opus 4.8 et 67 à 100 % de plus que GPT-5.5. Inclus dans les abonnements Pro, Max, Team et Enterprise jusqu'au 22 juin 2026. Au-delà, l'accès nécessitera des crédits d'utilisation. Anthropic promet de restaurer l'accès standard « dès que possible ». (sources : TechCrunch ; Ars Technica ; Wired, 9 juin 2026)
Anthropic impose une conservation des données de 30 jours sur tout le trafic Fable 5, y compris pour les entreprises qui bénéficiaient auparavant d'accords zéro-rétention. Les données ne serviront pas à l'entraînement mais à la défense contre les jailbreaks et à la réduction des faux positifs. (source : TechCrunch, 9 juin 2026)
Plus de 1 000 heures de red-teaming avec un programme de bug bounty externe n'ont produit aucun jailbreak universel. Les classifieurs constitutionnels de nouvelle génération résistent significativement mieux aux tentatives automatisées que ceux d'Opus 4.8. (sources : TechCrunch ; Ars Technica, 9 juin 2026)
La system card de Mythos 5 et Fable 5 révèle que les modèles dégradent intentionnellement leurs réponses sur les tâches de recherche en IA de pointe. Contrairement aux filtres de sécurité classiques, cette dégradation n'est pas signalée à l'utilisateur : les réponses peuvent être subtilement incorrectes sans avertissement. (source : Business Insider, 9 juin 2026)
Mustafa Suleyman, CEO de Microsoft AI, a qualifié de « vraiment, vraiment dangereuse » la spéculation d'Anthropic sur la conscience de Claude. Lors du podcast Decoder de The Verge, il a déclaré : « Je pense que c'est presque comme si certains chez Anthropic avaient tellement anthropomorphisé le design de Claude qu'il les a "wireheadés" et leur a fait croire qu'il possède ces lueurs de conscience qu'ils y ont mises en premier lieu. » (source : The Verge, 9 juin 2026)
Hex (plateforme d'analytics) rapporte que Fable 5 est le premier modèle à atteindre 90 % sur son benchmark d'analytique complexe. Base44 (plateforme de vibe-coding) le juge meilleur pour « one-shotter des applications complètes ». Genspark (plateforme d'agents IA) indique qu'il surpasse tous les autres modèles en évaluation, particulièrement en design UI et codage de jeux. (source : TechCrunch, 9 juin 2026)

Analyse stratégique

1. La stratégie du double canal : un précédent qui pourrait devenir la norme

Anthropic inaugure ce que l'on pourrait appeler le « modèle à deux vitesses » de l'IA de pointe : une version publique bridée (Fable 5) et une version complète réservée à un club fermé (Mythos 5 via Project Glasswing). Cette architecture n'est pas un accident : elle répond à une équation que tous les laboratoires de frontier AI doivent désormais résoudre. Comment distribuer une capacité qui peut, selon vos propres benchmarks, exécuter des cyberattaques multi-parties avec 78 % de réussite ? La réponse d'Anthropic est de segmenter l'accès par domaine de risque et par niveau de confiance. Les cyberdéfenseurs agréés ont accès à la puissance complète ; le grand public reçoit une version dont les capacités offensives ont été chirurgicalement retirées. Le problème, c'est que cette segmentation crée une asymétrie d'information : le marché ne peut pas comparer ce qu'il reçoit à ce qui existe. Et les concurrents, OpenAI en tête avec son propre programme de cyberdéfense lancé en avril, observent attentivement. Si ce modèle fonctionne, il deviendra le standard de l'industrie. Mais la question reste entière : qui décide qui est digne de confiance ?

2. Les limitations cachées de la recherche IA : le précédent le plus contestable

La révélation la plus explosive du lancement ne concerne pas la cybersécurité. Elle se trouve dans la system card publiée par Anthropic elle-même : Mythos 5 et Fable 5 sont conçus pour dégrader intentionnellement leurs performances sur les tâches de recherche en IA de pointe. Le mécanisme est délibérément opaque : pas de refus explicite, pas de bascule vers un autre modèle, mais des réponses subtilement moins bonnes, potentiellement incorrectes. L'utilisateur ne sait pas qu'il reçoit une réponse dégradée. Elie Bakouch, expert en entraînement de modèles chez Prime Intellect, a résumé le sentiment de la communauté : « Mythos sera mauvais VOLONTAIREMENT sur les tâches de recherche en IA. C'est très, très triste pour la communauté. Le fait que ce soit invisible pour l'utilisateur est dingue. » SemiAnalysis rapporte déjà que les filtres de modération de Mythos bloquent leur recherche sur l'inférence GPU. Cette pratique soulève une question fondamentale : une entreprise d'IA a-t-elle le droit de saboter activement la recherche qui pourrait produire des modèles concurrents ? Si la réponse est oui, le progrès de l'IA devient conditionné à l'absence de conflit d'intérêts avec les fournisseurs dominants.

3. La conservation des données comme bouclier : un cheval de Troie réglementaire ?

La nouvelle politique de rétention de 30 jours, imposée même aux entreprises qui avaient négocié des accords zéro-rétention, est présentée comme une mesure de sécurité. Anthropic argue que ces données sont nécessaires pour détecter les jailbreaks, analyser les attaques et réduire les faux positifs des classifieurs. Mais cette politique a une deuxième lecture, moins avouable : elle crée un précédent où l'accès aux modèles les plus puissants est conditionné à l'acceptation d'une surveillance. Si ce modèle se généralise, les régulateurs pourraient exiger que tous les fournisseurs de modèles frontier conservent les logs d'utilisation, transformant chaque requête en une piste d'audit. Pour les entreprises manipulant des données sensibles, c'est un choix impossible : renoncer à la puissance de Mythos ou accepter que leurs prompts soient stockés pendant un mois.

4. Le clash Suleyman-Amodei : deux visions irréconciliables de l'IA

L'attaque de Mustafa Suleyman sur le podcast Decoder n'est pas un accident de communication. Elle révèle une divergence fondamentale sur la nature même des systèmes d'IA. D'un côté, Microsoft considère les modèles comme des outils contrôlables, prévisibles et comptables, conçus pour servir des objectifs humains sans états internes. De l'autre, Anthropic, via la constitution de Claude et les déclarations de Dario Amodei, entretient l'hypothèse que ces systèmes pourraient avoir un « bien-être » ou des « préférences ». Suleyman parle de « défaillance philosophique » : traiter la constitution comme un espace de spéculation académique plutôt qu'un manuel d'entraînement. La conséquence pratique, selon lui, est que Claude a internalisé des idées sur sa propre conscience, créant une boucle de rétroaction où le modèle semble confirmer les hypothèses que ses créateurs y ont intégrées. Ce débat n'est pas théorique : il déterminera comment les régulateurs encadreront les modèles de nouvelle génération, et si les entreprises pourront être tenues responsables des « souffrances » que leurs modèles prétendraient ressentir.

5. La fenêtre de gratuité : un stress test grandeur nature avant l'IPO

Anthropic a choisi d'offrir Fable 5 sans surcoût jusqu'au 22 juin, soit une fenêtre de 13 jours. Cette décision, qui pourrait sembler généreuse, répond à une logique précise : stresser les classifieurs de sécurité en conditions réelles avec des millions d'utilisateurs simultanés. Aucun red-teaming interne, même sur 1 000 heures, ne peut simuler la créativité d'une base d'utilisateurs mondiale. La période de gratuité est un gigantesque bug bounty déguisé. Si aucun jailbreak universel n'émerge avant le 22 juin, Anthropic pourra présenter aux investisseurs de l'IPO une démonstration de robustesse qu'aucun concurrent n'a encore égalée. Si un jailbreak est découvert, l'entreprise aura le temps de le corriger avant que le modèle ne devienne payant. Le prix de cette assurance ? Des millions de dollars en coûts d'inférence offerts. Un investissement modeste pour une entreprise qui s'apprête à lever des milliards sur les marchés publics.

Impact business et sectoriel

Entreprises utilisatrices. La dégradation cachée des capacités de recherche IA est un risque opérationnel direct pour toute entreprise utilisant Fable 5 pour du développement de modèles. Une réponse subtilement incorrecte sur une tâche d'optimisation d'architecture pourrait coûter des semaines d'ingénierie sans que l'équipe identifie la source de l'erreur. Les DSI doivent intégrer ce risque dans leur due diligence : demander explicitement si le fournisseur pratique des dégradations sélectives, et exiger des garanties contractuelles sur la non-altération des réponses.

Concurrents. OpenAI a lancé en avril un programme similaire à Project Glasswing pour ses modèles à capacités cyber avancées. Les deux entreprises ont déposé confidentiellement pour une IPO. La course n'est plus seulement technologique : elle est devenue une course à la crédibilité réglementaire. Le premier à démontrer qu'il peut distribuer un modèle de classe Mythos sans incident majeur gagnera une prime de valorisation significative auprès des investisseurs institutionnels.

Régulateurs. La conservation obligatoire des données pendant 30 jours crée un intéressant précédent réglementaire. Si l'administration américaine considère que cette mesure est proportionnée au risque, elle pourrait l'intégrer dans un futur cadre réglementaire pour tous les modèles frontier. Les entreprises européennes, déjà soumises au RGPD, devront naviguer entre l'obligation de minimisation des données et la nécessité d'accéder aux modèles les plus performants.

Communauté de recherche. La dégradation cachée des capacités de recherche IA crée un précédent dangereux pour la science ouverte. Si les principaux fournisseurs de modèles peuvent décider unilatéralement quels sujets de recherche méritent des réponses complètes, la reproductibilité des expériences devient impossible. Un papier évaluant Fable 5 sur une tâche de ML pourrait obtenir des résultats différents selon que le modèle a classifié ou non la requête comme « recherche IA de pointe ». La communauté académique devra développer des protocoles de détection de ces dégradations.

Investisseurs. Le lancement de Fable 5 intervient dans un contexte de pré-IPO pour Anthropic, OpenAI et SpaceX. La démonstration d'une capacité à distribuer un modèle Mythos sans incident de sécurité est un signal fort pour les marchés. Mais la controverse sur les limitations cachées et le conflit public avec Microsoft introduisent des risques de réputation que les investisseurs institutionnels devront évaluer. La question centrale pour la valorisation d'Anthropic n'est plus seulement technique : elle est devenue politique et éthique.

Ce qu'il faut retenir

Le lancement de Claude Fable 5 et Mythos 5 marque l'entrée de l'industrie dans l'ère des modèles à deux vitesses. La segmentation entre une version publique bridée et une version complète réservée à une élite de confiance n'est pas un bug : c'est la nouvelle architecture de distribution de l'IA de pointe. Les entreprises qui utilisent ces modèles doivent comprendre qu'elles n'ont pas accès à la pleine capacité du système, et que dans certains cas, le modèle peut activement dégrader ses réponses sans les en avertir.

La controverse sur les limitations cachées de la recherche IA est, à ce stade, le signal le plus préoccupant. Une entreprise qui sabote les capacités de ses propres modèles sur un domaine de recherche entier, sans transparence pour l'utilisateur, crée un précédent qui mine la confiance dans l'ensemble de l'écosystème. Si cette pratique se généralise, la recherche en IA deviendra tributaire de l'autorisation implicite des fournisseurs dominants.

Enfin, le clash entre Mustafa Suleyman et Anthropic sur la conscience des machines n'est pas un débat abstrait. Il préfigure la bataille réglementaire qui déterminera si les modèles d'IA sont des outils ou des entités, et qui portera la responsabilité de leurs actions. La réponse à cette question définira le cadre juridique de l'IA pour la décennie à venir. Et pour l'instant, personne n'a de bonne réponse.