Une base de référence axée sur la sécurité pour les agents IA actifs en permanence

Lorsqu'un agent d'IA fonctionne en continu, il cesse de se comporter comme quelque chose que vous invoquez occasionnellement et commence à se comporter comme un système dont vous êtes chargé de faire fonctionner, même si la majeure partie de cette opération se déroule à perte de vue et sans attention quotidienne.

Un tel système lit des informations non fiables, conserve des informations d'identification et prend des mesures sans attendre leur révision, ce qui signifie que le principal risque est rarement une réponse incorrecte ou un résultat étrange, mais que l'agent fasse exactement ce qu'il était autorisé à faire dans une situation que ses concepteurs n'avaient pas totalement anticipée.

La plupart des échecs lors des déploiements d'agents sont anodins pris isolément. Un jeton accordé lors de la configuration reste actif plus longtemps que prévu. Les autorisations sont étendues pour éliminer les frictions et ne sont jamais revisitées une fois que les choses semblent stables. Les journaux accumulent discrètement des matériaux sensibles car le stockage est peu coûteux et l'examen est différé. Une boucle de nouvelle tentative s'exécute jusqu'à ce que quelqu'un remarque une hausse des coûts. Rien de tout cela ne nécessite un acteur hostile ou un exploit inédit. Elle découle naturellement des habitudes de travail normales et d'une attention limitée.

Nous présenterons une base de référence axée sur la sécurité pour exécuter des agents d'IA sur des machines virtuelles cloud, y compris des machines virtuelles de calcul, sans lier l'approche à un cadre ou à un outil spécifique. L'objectif n'est pas de prévenir toutes les défaillances possibles, mais de maintenir les défaillances contenues, visibles et récupérables lorsqu'elles se produisent.

Le lieu d'hébergement est rarement déterminant

Les discussions sur la sécurité des agents portent souvent sur l'endroit où l'agent s'exécute, comme si le choix entre une machine locale et une machine virtuelle dans le cloud déterminait si le système se comportera en toute sécurité.

Dans la pratique, les deux environnements réussissent et échouent de la même manière. Un système local peut être limité et bien entretenu, ou être largement exposé et négligé. Une machine virtuelle cloud peut être renforcée avec soin ou configurée de manière à provoquer discrètement des problèmes. Ce qui compte, ce n'est pas le lieu, mais la portée.

La question pratique reste la même dans les deux cas : lorsque l'agent se comporte mal, intentionnellement ou non, à quoi peut-il parvenir et à quelle rapidité pouvez-vous intervenir ?

Conception précoce en vue du confinement

Les agents actifs en permanence ont tout intérêt à être conçus en tenant compte des défaillances, non pas parce qu'ils sont intrinsèquement peu fiables, mais parce que les systèmes complexes évoluent au fil du temps d'une manière difficile à détecter de l'intérieur.

L'isolation est le point de départ le plus fiable. Le fait de doter l'agent d'une machine virtuelle dédiée évite tout couplage accidentel avec des services indépendants et des flux de travail personnels, et permet de réduire les coûts émotionnels et opérationnels des reconstructions, une propriété sous-estimée des systèmes résilients.

L'exécution de l'agent en tant qu'utilisateur non root limite encore les conséquences des erreurs. Les flux de travail des agents les plus utiles ne nécessitent pas de privilèges élevés, et lorsque l'accès root devient une dépendance, même de petites erreurs peuvent se transformer en efforts de restauration prolongés.

Le contrôle d'accès doit être intentionnellement peu intéressant. L'authentification par clé, les connexions par mot de passe désactivées et l'authentification multifactorielle sur le compte cloud réduisent le nombre de moyens d'atteindre un système en cas de problème. L'accès à la console mérite la même attention que le SSH, car il permet de contourner de nombreuses hypothèses concernant les contrôles de périmètre.

Ces étapes n'empêchent pas les défaillances. Ils définissent jusqu'où l'échec peut se propager.

Start in seconds with the fastest, most affordable VMs.

Launch a vintrual machine in under a minute. Enjoy flexible pricing, powerful hardware, and 24/7 support. Scale as you grow—no long-term commitment needed.

Try VMs now

Les autorisations façonnent le comportement plus que les invites

Les déploiements d'agents ont tendance à échouer en raison d'autorisations excessives plutôt que d'une manipulation sophistiquée.

Lorsqu'un agent possède des informations d'identification qui lui permettent de lire et d'écrire de manière générale, même un petit malentendu ou une saisie trompeuse peut se transformer en incident significatif. À ce stade, le confinement dépend beaucoup plus du modèle d'autorisation que des capacités de raisonnement de l'agent.

Des informations d'identification distinctes par agent réduisent le couplage. Les oscilloscopes étroits réduisent la portée involontaire. L'accès en lecture seule réduit le coût des erreurs. Les limites de taux, les quotas et les plafonds de dépenses fournissent des limites externes lorsque la logique interne échoue. Ensemble, ces contrôles transforment un comportement imprévisible en quelque chose de viable.

Les actions dont l'impact est irréversible méritent une attention particulière. Si un agent peut fusionner du code, supprimer des données, envoyer des messages ou déclencher des paiements, l'introduction d'une confirmation humaine ralentit les choses au bon endroit, car le coût du retard est bien inférieur au coût du nettoyage.

Traitez les secrets comme fragiles par défaut

Les secrets s'échappent rarement par des brèches dramatiques. Ils sortent des journaux, des messages d'erreur, des captures d'écran et des raccourcis pratiques qui s'accumulent au fil du temps.

Le fait de garder les secrets hors du contrôle de la source, des documents partagés et de la sortie standard réduit immédiatement l'exposition. Un gestionnaire de secrets dédié simplifie le contrôle d'accès et la rotation tout en encourageant de meilleures habitudes. Lorsque le stockage local est inévitable, il doit être considéré comme un compromis qui exige de la discipline, avec des autorisations strictes, une séparation claire de l'espace de travail de l'agent, une rotation régulière et des garanties explicites contre l'impression ou la journalisation.

L'objectif n'est pas la propreté théorique. Il s'agit de réduire le nombre d'endroits où les secrets peuvent se retrouver et de faciliter la détection d'une exposition accidentelle.

Le trafic sortant définit la voie d'évacuation

Les contrôles entrants sont familiers et sont généralement traités rapidement. Le trafic sortant reçoit moins d'attention, même s'il détermine la manière dont les données quittent le système.

Au cours des premières expériences, l'accès sortant sans restriction est courant et souvent raisonnable. Dès qu'un agent gère des données sensibles, les chemins sortants méritent d'être revus. En sachant quelles destinations l'agent a besoin, en observant où il se connecte réellement et en acheminant le trafic via une infrastructure que vous contrôlez, tout cela permet de détecter et d'interrompre plus facilement les comportements inattendus.

Le confinement ne nécessite pas d'isolation par rapport au réseau. Cela nécessite que des chemins inattendus se démarquent.

Journalisation intentionnelle

Les journaux sont essentiels pour la responsabilisation et le diagnostic, mais l'exploitation inconsidérée comporte ses propres risques.

La journalisation axée sur les événements permet de trouver un meilleur équilibre. Le suivi des événements de démarrage et d'arrêt, de l'utilisation des outils et des appels de service externes fournit une visibilité opérationnelle sans créer d'archive de contenu sensible. Les instructions complètes, les transcriptions et le contenu des documents semblent utiles pendant le développement, mais ils deviennent souvent des problèmes plus tard, bien après que leur objectif initial se soit estompé.

Certains modes de défaillance sont spécifiques au comportement des agents plutôt qu'à la charge de l'infrastructure. Les nouvelles tentatives, les pics soudains de demandes sortantes ou l'utilisation prolongée des ressources sans cause claire indiquent souvent une boucle ou une mauvaise configuration plutôt qu'une demande.

Décider de la manière dont le système s'arrête

La clarté opérationnelle est primordiale avant le déploiement, lorsque le système semble encore simple.

Savoir comment arrêter le processus de l'agent, arrêter la machine virtuelle depuis le plan de contrôle et changer rapidement les informations d'identification permet de prendre rapidement des décisions stressantes. Le fait de noter ces étapes le plus tôt possible transforme un incident futur en liste de contrôle plutôt qu'en improvisation.

L'isolement et le moindre privilège sont payants ici. En cas de problème, la capacité de répondre à ce à quoi l'agent pourrait accéder, à ce qu'il pourrait faire et à ce qui doit être révoqué immédiatement détermine la rapidité avec laquelle le système redevient compréhensible.

Un minimum défendable

Pour les équipes qui se déplacent rapidement, un petit ensemble de commandes est très utile.

- Une machine virtuelle dédiée et un utilisateur de service non root limitent le rayon d'explosion.
- L'accès administratif sécurisé et les comptes cloud protégés réduisent les points d'entrée.
- Des informations d'identification séparées, dotées du moindre privilège, avec des limites pour limiter les dommages.
- Une journalisation propre et une gestion rigoureuse des secrets réduisent l'exposition silencieuse.
- Un plan d'arrêt et de rotation clair permet de faciliter la reprise.

Tout ce qui va au-delà n'est que raffinement. Souvent précieux, parfois nécessaire, mais toujours raffiné.

Un agent actif en permanence est un puissant logiciel qui fonctionne à côté de vos informations d'identification. Le traiter comme un système opérationnel dès le départ en fait quelque chose sur lequel vous pouvez compter plutôt que quelque chose qui vous inquiète discrètement.

‍

Your next workload belongs on Hivenet.

Pick one AI, compute, or storage workload and see the difference for yourself. Spin it up in minutes, or let our team map your fastest path to production.

Start now Contact sales

Check pricing Start building Talk through a workload

La sécurité est renforcée par un regard extérieur

Pourquoi Hivenet a lancé un programme de primes aux bogues et de divulgation responsable, et comment la recherche externe aide à protéger Store, Compute, les utilisateurs et l'infrastructure.