TsunamIA Hebdo 🌊 : SpaceX et Anthropic à 4 milliards par an, Cloudflare licencie 1100 personnes & Claude qui rumine ses erreurs la nuit

Semaine du 9 au 15 mai 2026

Salut les explorateurs de l’IA !

Numéro qui sort avec un jour de retard, en bord de récif plutôt que sur le rivage habituel du vendredi. Comme dit en live mercredi, j’avais envie de prendre un peu plus le temps sur certains sujets que le podcast n’a fait qu’effleurer.

Au programme cette semaine, SpaceX et Anthropic signent un deal compute à 4 milliards par an dans un retournement spectaculaire d’Elon Musk, Cloudflare licencie 1 100 personnes en assumant publiquement que son IA interne a fait le boulot, et Anthropic dévoile un système baptisé “Dreaming” où ses agents Claude relisent leurs erreurs entre deux sessions pour s’améliorer tout seuls. On creuse aussi la valorisation Anthropic à 1 000 milliards et ses signaux faibles, et un papier qui vient secouer un consensus qu’on a tous adopté un peu vite : plus on empile de briques sur un agent, plus il devient bête.

C’est parti.

🚀 SpaceX et Anthropic, 4 milliards par an pour Colossus

Le 6 mai, Anthropic et SpaceX ont annoncé un partenariat qui change la donne sur l’infrastructure IA mondiale. Anthropic loue 100 % de la capacité du data center Colossus 1 à Memphis (Tennessee), désormais propriété de SpaceX après l’absorption de xAI. Concrètement, 220 000 GPU NVIDIA et +300 mégawatts de puissance livrés en quelques semaines, dédiés à entraîner et faire tourner Claude.

Ce qu’il faut retenir : - Le deal pèse environ 3 à 4 milliards de dollars par an de revenus pour SpaceX, dont plus de 2,5 milliards de cash profit. - Anthropic empile désormais AWS, Google, Microsoft et SpaceX comme partenaires compute. OpenAI reste majoritairement sur Azure. - xAI a été dissous et fusionné dans SpaceX, sous le nom SpaceXAI. L’IPO SpaceX est désormais visée à 1 750 milliards de dollars. - Conséquence immédiate pour les clients Claude, les limites Claude Code 5h doublées, les restrictions aux heures de pointe levées sur Pro et Max, et les hausses de limites API Opus pour Team et Enterprise.

Ce que ça raconte vraiment :

En février, Elon Musk traitait Anthropic de “misanthropic and evil”. Le 6 mai, on lit dans le communiqué SpaceX, “personne n’a déclenché mon détecteur de méchanceté, tous ceux que j’ai rencontrés étaient hautement compétents et tenaient profondément à faire les choses bien”. Le pivot doctrinal en 90 jours est rendu possible par un détail prosaïque, 4 milliards par an. Ça vous donne une idée de l’état du marché.

Mais le vrai signal est ailleurs. Le compute est devenu la ressource rare de l’IA. Anthropic ne signe pas avec un seul fournisseur, elle empile les ancres. C’est exactement ce que font les grandes raffineries de pétrole quand elles diversifient leurs approvisionnements en brut. Quand quatre poids lourds tech sont obligés de mutualiser leurs infrastructures pour faire tourner un seul modèle, ça veut dire qu’on a quitté le terrain “logiciel” pour entrer dans une économie d’infrastructure stratégique nationale.

Pour nous, ça change quoi ?

Si vous utilisez Claude en production aujourd’hui, vous bénéficiez directement de cette extension de capacité. Plus de quota, moins de ralentissements aux heures de pointe. Mais surtout, ça soulève une question utile pour tous ceux qui choisissent un fournisseur IA en B2B, sur quoi est-ce que je base ma décision ? Les benchmarks du moment, qui changent tous les trois mois ? Les déclarations publiques des CEO, dont Musk vient de nous rappeler la demi-vie courte ? Ou la résilience d’infrastructure et la diversité des partenaires compute, qui ne sont pas glamour à présenter mais qui font la différence quand un sous-jacent tombe ? La question vaut la peine d’être posée avant le prochain renouvellement de contrat.

Sources : Anthropic, VentureBeat, The Information.

💼 Cloudflare licencie 1 100 personnes, “notre IA interne a fait +600 % en 3 mois”

Le 7 mai, Cloudflare a annoncé 1 100 suppressions de postes, soit environ 20 % de ses effectifs. Le motif officiel, dans la bouche du CEO Matthew Prince, “notre usage interne d’IA a fait plus de 600 % en trois mois, nos collaborateurs ne sont pas assez agentiques”. Le même jour, l’entreprise publiait un trimestre à plus 34 % de revenus en glissement annuel. Le titre a perdu 18 % à l’annonce.

Ce qu’il faut retenir : - 1 100 postes supprimés, environ 20 % des effectifs Cloudflare. - Coûts de restructuration provisionnés entre 140 et 150 millions de dollars. - Salaire maintenu jusqu’à fin 2026 pour les partants, un package plus généreux que la moyenne du secteur. - Premier patron tech qui assume publiquement la formule “déployer plus d’IA = licencier des humains”.

Ce que peu de monde ose dire :

Wall Street a sanctionné. C’est un signal important. Le marché ne croit pas (encore) à l’équation magique “IA = moins 20 % d’effectifs sans baisse de qualité”. L’histoire récente nous a déjà montré ce qui arrive aux entreprises qui sur-vendent le remplacement humain trop tôt. Klarna en 2024 avait remplacé son support client par un chatbot, puis avait dû ré-embaucher massivement après une chute de la satisfaction client. IBM avait gelé 7 800 embauches en 2023 sous prétexte d’IA, et a discrètement rallumé ses recrutements 18 mois plus tard.

Le problème de fond n’est pas que l’IA ne fasse rien. Elle fait beaucoup. Le problème, c’est qu’on confond automatisation et disparition de la tâche. L’IA accélère la valeur produite par tête. Elle ne supprime pas le besoin de têtes, sauf à accepter une dégradation de qualité qui se voit à l’œil nu et qui fuit chez les concurrents en quelques trimestres.

Mon retour de terrain :

Sur les audits que je fais en ce moment, je vois plusieurs entreprises qui regardent Cloudflare et se posent la même question. “Est-ce qu’on peut faire pareil ?”. La réponse honnête, c’est : non, pas comme ça, pas en six mois. Ce qui se cache derrière ces 600 % d’usage IA chez Cloudflare, c’est très probablement une infrastructure agentique mature, des workflows réécrits, des équipes formées, et beaucoup de pilotage. C’est un travail de douze à dix-huit mois minimum, pas une décision unilatérale annoncée un jour de comité.

Cette annonce va imprimer dans les têtes des deux côtés du miroir. Côté salarié, elle nourrit une inquiétude légitime sur la suite. Côté management, elle suggère un raccourci que l’histoire récente n’a pas validé. La question qui reste, finalement : quel équilibre entre levier IA et place humaine veut-on tenir, dans son équipe, sa boîte, son secteur ? La réponse ne vient probablement pas d’un cas isolé américain.

Sources : TechCrunch, CNBC earnings.

🛠️ La pause pratique : 5 questions à poser avant de signer avec un éditeur d’IA

Quand un éditeur d’IA vient vous vendre une licence à 50 000 euros par an, comment savoir si vous achetez quelque chose qui tiendra 24 mois ou un coup de hype qui va expirer avant Noël ? Voici cinq questions qui m’ont aidé sur les missions récentes, à adapter selon votre contexte.

Sur quels fournisseurs cloud tournent vos modèles ? Si la réponse est “un seul”, la question suivante c’est : est-ce que cette dépendance est acceptable dans mon cas d’usage ? Anthropic vient de signaler en empilant SpaceX, AWS, Google et Microsoft que la diversification compute est devenue un critère pour eux. À chacun de regarder si ça résonne avec ses propres exigences de continuité.
Combien d’utilisateurs payants en production aujourd’hui, et quel est le taux de rétention à 12 mois ? Si l’éditeur ne donne pas ces chiffres facilement, ça peut être un signal à creuser, ou simplement le fait que la donnée n’est pas favorable à mettre en avant. Demandez-vous : sans cette information, sur quoi est-ce que je base ma confiance ?
Quel est votre roadmap modèle pour les 18 prochains mois ? Cherchez de la précision sur les capacités cibles, pas sur les benchmarks. “On va dépasser GPT-5.5 sur SWE-Bench au Q3” ne veut pas dire grand-chose pour votre usage réel. “On va sortir un mode batch à 70 % de réduction de coût en septembre” parle déjà plus à votre P&L.
Que se passe-t-il pour mes données après l’arrêt du contrat ? Idéalement un droit clair à l’export complet, sous un format standard, sans frais. Si l’éditeur tergiverse, c’est une donnée d’entrée à prendre en compte. La donnée d’usage que votre équipe va générer en 12 mois est un actif. Pour qui ?
Comment vous différenciez-vous d’un modèle open-source équivalent dans 6 mois ? Question peut-être piège. Si l’éditeur n’a pas une réponse claire, regardez quelle proposition de valeur lui reste réellement, alors que 5 modèles open-weight de classe frontière sont sortis en 30 jours (Kimi K2.6, Qwen 3.6 Max, DeepSeek V4, Mistral Medium 3.5, Llama 4.5). La couche modèle se commoditise. La différenciation se déplace vers l’orchestration, la spécialisation métier, et la qualité du fine-tuning. À chacun d’évaluer si l’éditeur en face apporte cette couche.

🔍 Le sujet qu’on creuse : Anthropic vise 1 000 milliards de dollars, les signaux faibles derrière le chiffre

Anthropic est en train de boucler un tour de financement de 50 milliards de dollars, à une valorisation cible comprise entre 900 milliards et 1 000 milliards. Plus que ce que valait Tesla début 2025. Plus que l’ensemble du CAC 40 mid-cap. Plus, surtout, que la valorisation d’OpenAI à 852 milliards après son tour record.

Je vous avais promis en live de creuser les signaux faibles derrière cette annonce. Voici ce qui ressort, en quatre points.

1. Le revenu annualisé qui devient flou.

Le chiffre annoncé, c’est 45 milliards de dollars de revenu annualisé projeté à fin 2026, contre 9 milliards fin 2025. Ça représente un x5 en un an. Question simple, est-ce que ce chiffre est mesuré ou projeté ? Le mot “annualisé” en SaaS signifie typiquement “on prend le mois M, on multiplie par 12”. C’est un indicateur sensible aux mois spéciaux. Si vous l’appliquez sur un mois qui contient le pic Code with Claude (6 mai) et un pic d’usage SpaceX qui se monte progressivement, vous pouvez gonfler artificiellement le chiffre.

Ça ne veut pas dire qu’Anthropic ment. Ça veut dire que 45 milliards mesurés est un chiffre. 45 milliards projetés sur les meilleurs mois en est un autre. La presse mélange les deux.

2. Le ratio compute / revenu reste à valider.

Anthropic vient de s’engager à dépenser 100 milliards de dollars sur AWS sur 10 ans, plus le deal SpaceX Colossus, plus les contrats Google et Microsoft. Si on cumule, on parle de plus de 15 milliards de dépenses compute en 2026. Sur 45 milliards de revenus, ça fait 33 % de coût compute brut. À comparer avec un éditeur SaaS classique qui paie 20 à 25 % d’hébergement. La marge d’Anthropic à terme dépend totalement de sa capacité à faire baisser ce ratio. Le pari implicite, c’est que les GPU vont coûter moins cher et que l’efficacité par token va augmenter. C’est probable, mais ce n’est pas garanti.

3. La concentration des revenus inquiète discrètement.

Selon plusieurs sources (The Information, Bloomberg), une part très importante des revenus Anthropic vient de moins de 10 clients enterprise, dont des concurrents directs comme Cursor, Replit et Mercado Libre. Si l’un d’eux change de fournisseur, le revenu décale. Pour comparaison, un SaaS sain a moins de 20 % de son revenu sur ses 10 plus gros clients. Anthropic est probablement au-dessus de 50 %. À une valorisation 1 000 milliards, c’est un facteur que les investisseurs vont devoir digérer.

4. Le pari “AGI” reste l’éléphant.

Une valorisation à 1 000 milliards ne se justifie pas par les revenus actuels. Elle se justifie par un pari implicite que dans 24 à 36 mois, Anthropic aura un modèle capable de remplacer significativement de la main d’œuvre cognitive. Si ce pari ne se matérialise pas, on aura un ajustement de valorisation. Si ce pari se matérialise, on aura des questions politiques bien plus larges sur l’emploi, la concentration de pouvoir, et la régulation.

Une lecture possible : le chiffre 1 000 milliards ne raconte pas tant une boîte qui vaut 1 000 milliards qu’un marché qui price un pari sur l’AGI à hauteur d’1 000 milliards. Et ces deux lectures n’engagent pas les mêmes décisions de votre côté, que vous soyez sponsor IA dans votre entreprise, investisseur, ou simple observateur. Que faites-vous si le pari ne se matérialise pas dans 36 mois ?

Sources : TechCrunch, Tech Startups.

🧠 Le papier de la semaine : empiler des briques sur un agent peut le rendre plus bête

Le papier qui m’a interpellé cette semaine s’appelle “More Is Not Always Better, Cross-Component Interference in LLM Agent Scaffolding”, publié sur arXiv le 7 mai par Ming Liu et son équipe. Il prend à contre-pied une intuition qu’on a tous depuis 18 mois, “pour rendre un agent meilleur, on lui rajoute des outils, de la mémoire, des règles”.

Une analogie pour visualiser :

Imaginez un commercial expérimenté à qui vous voulez confier un rendez-vous client important. Pour l’aider, vous lui donnez son CRM, plus une checklist de questions à poser, plus un script de relance, plus un système de notation client, plus un dashboard en temps réel des produits disponibles, plus un agent IA en oreillette qui lui souffle les contre-arguments. Résultat probable, votre commercial confond les outils, hésite, donne une réponse de moins bonne qualité que s’il avait juste son cerveau et son téléphone.

Le papier de Liu mesure exactement ça sur les agents IA. Quand vous ajoutez des composants (un outil de recherche, un système de mémoire, un planificateur, un vérificateur), à partir d’un certain seuil, les performances chutent. Pas linéairement, brutalement. C’est l’interférence entre composants qui crée le problème, pas la qualité individuelle de chaque outil.

Pourquoi ça pourrait tout changer :

Aujourd’hui, l’écosystème des frameworks agents (LangChain, AutoGen, CrewAI, Claude Managed Agents) part du principe implicite qu’ajouter plus de structure rend l’agent plus capable. Plus de prompts système, plus de chaînes de pensée, plus d’outils, plus de validation. Le papier dit l’inverse, chaque couche ajoutée a un coût caché qui finit par dépasser sa valeur ajoutée.

C’est cohérent avec ce qu’on observe en production. Les agents les plus efficaces que je vois sur le terrain sont étonnamment minimalistes, un bon prompt, deux ou trois outils maximum, un workflow clair. Les agents complexes échouent souvent silencieusement, soit ils inventent, soit ils boucent, soit ils oublient leur objectif initial.

Mais attention au glissement facile :

Ce papier va probablement être utilisé par plein de gens pour conclure “on n’a pas besoin de frameworks agents, donc gardons les choses simples”. C’est partiellement vrai mais aussi piégeux. Ce que dit vraiment Liu, ce n’est pas “moins de composants c’est toujours mieux”. C’est plutôt “il existe un point optimal, et l’industrie est aujourd’hui largement au-dessus de ce point”. Le bon réflexe pourrait être l’élagage régulier plutôt que le refus initial de toute architecture. À tester chez vous.

L’autre vraie question soulevée par le papier, on manque encore d’outils pour identifier l’interférence entre composants d’un agent. C’est le problème silencieux. Sans une métrique fine de qualité de sortie, comment savoir que votre agent se dégrade quand vous lui ajoutez une brique ? La question reste largement ouverte.

Et un précédent qui devrait nous rendre prudents, dans les années 1990, on a eu une vague d’enthousiasme similaire avec les systèmes experts en intelligence artificielle. Plus on ajoutait de règles, plus le système était censé devenir intelligent. Au-delà de 10 000 règles, les systèmes devenaient ingouvernables, contradictoires, et leur maintenance dépassait largement leur valeur. La leçon avait été enterrée. Le papier de Liu vient nous rappeler qu’elle est toujours valable.

Source : arXiv, Ming Liu et al., 7 mai 2026.

🚀 En rafale, ce que le podcast n’a pas couvert

Quatre actus que je n’ai pas eu le temps de développer en live mais qui méritent un coup d’œil.

AI Act, J-3 mois avant l’échéance critique du 2 août 2026. Le règlement européen sur l’IA entre dans sa phase la plus contraignante dans environ 90 jours. À partir du 2 août, les obligations pour les modèles d’IA “à usage général” (GPAI) deviennent applicables, avec amendes pouvant atteindre 3 % du chiffre d’affaires mondial. Concrètement, si vous utilisez un modèle commercial ou open-source en production (à fortiori pour un usage à risque élevé : RH, santé, éducation, services publics), c’est le moment de regarder où vous en êtes sur la documentation modèle, l’évaluation de risques, et la transparence des données d’entraînement. Beaucoup d’éditeurs vous diront “on est en règle”. À vérifier vous-même, parce que la responsabilité juridique est partagée entre l’éditeur et le déployeur. Source.

PayPal annonce moins 20 % d’effectifs sous son nouveau CEO. Le 9 mai, PayPal a confirmé la suppression d’environ 20 % de ses effectifs dans le cadre du plan stratégique de son nouveau CEO, ex-cadre de HP. La narrative officielle, “redevenir une tech company”. On retrouve le même schéma que Cloudflare ou Salesforce, avec une variante. Là où Cloudflare assume “l’IA fait le boulot”, PayPal préfère “on se restructure pour réinvestir”. Les deux signifient probablement la même chose. Question pour vous, si votre prestataire de paiement, RH, ou IT annonce une telle restructuration, à quel moment ça impacte la qualité de service que vous payez aujourd’hui ? Source.

Kimi K2.6 et Qwen 3.6 Max, la Chine recolle sur l’open-weight. Sortis respectivement les 8 et 12 mai, ces deux modèles atteignent un niveau de 78 et 79 % sur SWE-Bench Verified, soit le score d’un Claude Opus 4 et au-dessus de la plupart des modèles fermés non-frontière. Particulièrement notable sur Kimi K2.6 qui tourne avec seulement 32 milliards de paramètres actifs (Mixture of Experts), ce qui le rend tournable sur du matériel local relativement modeste (un MacBook M5 Max suffit). Pour les équipes qui veulent garder leurs données sensibles en interne sans dépendre d’un fournisseur cloud, ces deux modèles changent ce qui était hier impossible. Source, Qwen.

McKinsey State of AI 2026, 72 % en production mais seulement 28 % “matures”. Le rapport publié le 5 mai mesure que 72 % des entreprises interrogées ont au moins un usage IA en production. C’est en hausse forte par rapport aux 53 % de 2025. Mais sur le critère “intégration mature” (l’IA est dans plusieurs processus, gouvernée, mesurée), on n’est qu’à 28 %. Le pic de productivité réelle est sur cette catégorie. Concrètement, beaucoup d’entreprises ont coché la case “on fait de l’IA” sans avoir construit les bases pour en tirer un vrai levier. C’est cette deuxième vague, celle de la maturation, qui va trier les gagnants des perdants sur les 18 prochains mois. Source.

💤 Le sujet bonus parce qu’il est trop cool : Claude rumine ses erreurs la nuit

Anthropic a aussi dévoilé le 6 mai un système baptisé Dreaming. L’idée, entre deux sessions de travail, les agents Claude relisent leurs interactions passées, identifient ce qui a marché et ce qui a raté, et écrivent eux-mêmes des notes qu’ils consulteront lors de la prochaine session. Pas de réentraînement du modèle. Juste de la mémoire texte structurée, accumulée au fil des usages.

Le premier benchmark sur l’agent legal Harvey montre que le taux de complétion des tâches est multiplié par environ 6 sur 30 jours d’usage continu. Pour 0,08 $ par heure de session active, c’est essentiellement gratuit à l’échelle d’un usage entreprise.

Pourquoi c’est intéressant, l’avantage compétitif des agents IA va se déplacer du “meilleur modèle” vers “meilleure mémoire d’usage”. L’entreprise qui démarre un agent aujourd’hui aura, dans 6 mois, un actif accumulé que vous ne rattraperez pas en démarrant 6 mois plus tard. La courbe est asymétrique, et elle vient juste de commencer.

📊 Le chiffre de la semaine : 4 milliards de dollars par an

C’est ce qu’Anthropic va verser chaque année à SpaceX pour louer 100 % de la capacité du data center Colossus 1. Pour mettre ce chiffre en perspective, c’est l’équivalent du chiffre d’affaires annuel de Cosmetics du groupe LVMH (la division parfums Dior et Givenchy). C’est aussi à peu près le budget annuel de la NASA dédié aux vols habités (programme Artemis inclus).

Une entreprise IA paie pour ses calculs ce qu’une grande puissance spatiale paie pour aller sur la Lune. C’est probablement le chiffre qui résume le mieux où on en est.

🎧 Pour creuser le sujet

Tout ça, plus Karpathy qui théorise le “Software 3.0” et la “march of nines”, la sortie de GPT-5.5 Instant qui réduit les hallucinations de 52 %, AWS qui officialise son serveur MCP en disponibilité générale, PayPal qui annonce moins 20 % d’effectifs, Mistral Medium 3.5 à 128 milliards de paramètres, l’AI Act à J-3 mois de son échéance critique, et la métaphore McKinsey des 5 chefs étoilés qui se partagent une cuisine, c’est dans l’épisode #128 du podcast TsunamIA, sorti mercredi.

👉 Écouter l’épisode #128 sur Acast

🎟️ Atelier Récif, mercredi 10 juin 2026, Le Cirque (Paris)

Une journée pour passer des intuitions IA à des décisions concrètes pour votre activité. Cas réels, sans démo de chatbot, sans bullshit. Trois formats au choix selon votre niveau d’avancement.

👉 Toutes les infos et l’inscription

Pour conclure

Deux bascules cette semaine. Le compute est officiellement la ressource rare de l’IA, et il commence à manquer même pour les leaders : quand Musk et Anthropic se serrent la main à 4 milliards par an malgré une inimitié notoire, on tient le signal. En parallèle, des patrons comme Matthew Prince assument publiquement “IA = moins d’humains”, mais le marché ne valide pas encore l’équation. Zone d’inconfort où chaque trimestre va apporter des données.

Mercredi pour le podcast, vendredi prochain pour la newsletter. On essaie de tenir le rythme.

— Dimitri

📬 Restons connectés

🌐 Site : tsunamia.fr
🎧 Le podcast sur Acast (et toutes les plateformes)
📸 Instagram et TikTok
🎟️ Atelier Récif, 10 juin
✉️ Me contacter : contact@tsunamia.fr

TsunamIA est une marque propulsée par Intégralité Consulting.