Une vulnérabilité qui permet de contrôler les sorties des modèles d’IA

JFrog met en garde contre une faille critique touchant les systèmes d’IA basés sur le protocole MCP. Cette vulnérabilité, baptisée Prompt Hijacking, permettrait à un attaquant de contrôler les réponses générées par les modèles d’intelligence artificielle.

L’introduction massive de l’intelligence artificielle dans les flux de travail des entreprises est venue avec son lot de vulnérabilités, notamment dans le cycle de développement logiciel. L’équipe JFrog Security Research, de l’entreprise spécialisée dans la gestion du cycle de vie des logiciels, vient tout juste de décrire une nouvelle technique d’attaque qui affecte les écosystèmes d’IA utilisant le protocole MCP (Model Context Protocol).

Baptisée Prompt Hijacking, il s’agit d’une faille au niveau de la session qui cible l’intégrité du système d’adressage temporaire — ou ID de session — utilisé par les serveurs pour renvoyer les réponses aux clients.

« Même si le protocole MCP est conçu pour être utilisé avec des identifiants de session cryptographiquement sécurisés, nous avons constaté que des identifiants en double sont générés sur certains serveurs, ce qui montre à quelle vitesse les vecteurs d’attaque se développent pour contourner les mesures de sécurité », explique l’équipe de recherche.

Un vecteur hautement sensible

Si le serveur MCP utilise des identifiants prévisibles, un pirate peut exploiter les failles du canal de communication du modèle et dicter l’intégralité de la sortie d’un assistant d’IA. En théorie, un attaquant peut ainsi renvoyer des réponses contenant des invites ou des commandes empoisonnées dans la connexion active d’un utilisateur.

« La facilité avec laquelle les identifiants de session prévisibles, dans des implémentations vulnérables telles que oatpp-mcp (CVE-2025-6515), permettent cette prise de contrôle est particulièrement dangereuse », avertit JFrog. L’entreprise a d’ailleurs classé ce vecteur d’attaque comme hautement sensible.