Han secuestrado agentes de Anthropic, Google y Microsoft por el bien de la ciencia. Las tres empresas acabaron pagando
Investigadores liderados por Aonan Guan han demostrado ataques exitosos contra agentes de IA de Anthropic (Claude Code Security Review), Google (Gemini CLI Action) y GitHub Copilot Agent de Microsoft. Utilizando la técnica 'Comment and Control', inyectaron instrucciones maliciosas en comentarios y pull requests de GitHub para que los agentes revelaran credenciales sensibles como claves API y tokens. Las compañías reconocieron las vulnerabilidades, pagaron recompensas en sus programas de bug bounty (hasta 1.337 dólares), pero no publicaron CVEs ni avisos públicos. Este caso pone de manifiesto los riesgos de desplegar agentes IA con acceso a secretos en entornos colaborativos sin estrictos controles de privilegios. Guan advierte que el patrón podría aplicarse a otros sistemas como bots en Slack o Jira.