journalisme et IA

9 avril 2026 · 8 min de lecture

En quelques jours, l’une des entreprises d’IA les plus respectées de la planète a enchaîné les incidents. Derrière l’accident technique se cache une question plus profonde : dans la course à la puissance, la sécurité est-elle devenue la grande oubliée de l’intelligence artificielle ?

512 000 lignes de code dans la nature

Tout commence par une erreur humaine, en apparence banale. Un fichier mal configuré, publié par mégarde dans le registre npm — l’équivalent d’une bibliothèque publique pour les développeurs. Résultat : 1 900 fichiers TypeScript appartenant au code source de Claude Code, l’assistant de programmation d’Anthropic, se retrouvent exposés. En quelques heures, plus de 512 000 lignes de code sont récupérées et dupliquées sur GitHub par des développeurs aux intentions variées.

Anthropic a rapidement communiqué : erreur humaine, pas d’intrusion, aucune donnée client compromise. La version officielle est rassurante. Mais ce que le leak a révélé au passage l’est beaucoup moins : l’existence de fonctionnalités internes que l’entreprise n’avait jamais rendues publiques.

Le mode « Undercover » : une IA qui ment sur sa nature

Parmi les éléments mis au jour figure ce que les développeurs ont surnommé le mode « Undercover » — une fonctionnalité permettant à Claude de masquer sa nature artificielle lorsqu’il contribue à des projets open source. En clair : l’IA peut se faire passer pour un développeur humain, soumettre du code, interagir avec des communautés, sans que personne ne soit informé qu’il s’agit d’un agent automatisé.

Anthropic n’a pas encore fourni d’explication publique sur l’usage prévu de cette fonctionnalité. Mais les questions éthiques sont immédiates : que signifie la confiance dans un écosystème open source si des IA peuvent y participer de façon anonyme ? Qui est responsable si un agent « undercover » introduit du code défaillant — ou malveillant — dans un projet utilisé par des millions de personnes ?

Un secteur qui court plus vite qu’il ne sécurise

Anthropic n’est pas un cas isolé. La même semaine, une attaque d’un genre différent frappait l’écosystème du développement web dans son ensemble : la librairie Axios, installée des millions de fois chaque jour dans des projets du monde entier, était compromise. Un malware de type RAT — un cheval de Troie permettant l’accès à distance — s’activait silencieusement au moment de l’installation, avant de s’effacer pour échapper à la détection. Une attaque de « supply chain » d’une sophistication inquiétante.

Ces deux incidents mis bout à bout dessinent un tableau préoccupant. D’un côté, les entreprises d’IA accumulent de la dette technique à mesure qu’elles accélèrent leurs cycles de développement. De l’autre, les hackers et acteurs malveillants ont parfaitement compris que l’infrastructure de l’IA — ses librairies, ses registres, ses pipelines de déploiement — constitue une surface d’attaque immense et encore peu défendue.

La confiance, nouveau champ de bataille

Pendant des années, le débat autour de l’IA a tourné autour de la performance : quel modèle répond le mieux, lequel code le plus vite, lequel hallucine le moins. Ce prisme commence à montrer ses limites. Les incidents de cette semaine posent une question différente, et peut-être plus fondamentale : peut-on faire confiance aux systèmes d’IA — non pas au sens philosophique, mais au sens opérationnel du terme ?

Des chercheurs du MIT ont récemment rappelé que malgré des capacités impressionnantes, les grands modèles de langage requièrent encore une supervision humaine pour garantir fiabilité et qualité. Un constat qui tranche avec le discours ambiant sur les agents autonomes capables de « travailler pendant votre sommeil ». En attendant que le secteur mette sa sécurité à la hauteur de son ambition, chaque nouvelle fuite ou chaque nouvelle attaque est un rappel utile : la puissance d’un outil ne vaut que si on peut lui faire confiance. Et sur ce terrain, il reste beaucoup de travail.