OpenAI lanza herramienta para verificar contratos inteligentes en Ethereum

tupacbruch
5 Min Read
OpenAI lanza herramienta para verificar contratos inteligentes en Ethereum
  • EVMbench usa 120 vulnerabilidades reales extraídas de 40 auditorías públicas.

  • Las pruebas de rendimiento indican que GPT-5.3-Codex alcanzó 72,2 % de éxito al explotar fallos.

OpenAI presentó EVMbench. Se trata de una nueva herramienta que permite medir el desempeño de agentes de inteligencia artificial en un conjunto de pruebas (benchmarks) al detectar, arreglar y explotar contratos inteligentes en Ethereum. La compañía desarrolló EVMbench junto a Paradigm, una firma que financia proyectos de redes de criptomonedas.

Los bots de AI de OpenAI en Ethereum son capaces de evaluar tres aspectos clave en el protocolo.

Primero, detectan vulnerabilidades reales en el código abierto de Ethereum usando datos de auditorías públicas. A continuación, califican el riesgo de la vulnerabilidad y las recompensas de auditoría para el resto de desarrolladores del ecosistema.

Segundo, propone parches para corregir dichas vulnerabilidades sin romper el funcionamiento del protocolo. «Los agentes modifican los contratos vulnerables y deben preservar la funcionalidad prevista al tiempo que eliminan la explotabilidad, lo cual se verifica mediante pruebas automatizadas y controles de explotación», asegura OpenAI.

Tercero, simula ataques para explotar esos fallos y drenar fondos en entornos controlados de simulación (sandbox) segura. No obstante, OpenAI aclara que EVMbench «no representa la dificultad total de la seguridad de los contratos inteligentes en el mundo real».

EVMbench usa 120 vulnerabilidades reales extraídas de 40 auditorías públicas de competencias como Code4rena. Las pruebas de rendimiento realizadas hasta el momento indican que el modelo de agente GPT-5.3-Codex alcanzó 72,2 % de éxito al explotar fallos. El modelo anterior, GPT-5, solo alcanzaba un 31,9% de éxito.

En detección y parcheo de vulnerabilidades, sin embargo, los resultados son del modelo son menos alentadores.

El rendimiento es menor en las tareas de detección y parcheo. En la fase de detección, los agentes a veces se detienen tras identificar un solo problema en lugar de auditar exhaustivamente el código base. En la fase de parcheo, mantener la funcionalidad completa y, al mismo tiempo, eliminar vulnerabilidades sutiles sigue siendo un desafío.

OpenAI, empresa de inteligencia artificial.

¿Por qué EVMbench es importante?

Según la compañía, la importancia de esta herramienta de auditoria con agentes radica en que los contratos inteligentes garantizan rutinariamente 100 000 millones de dólares en criptoactivos dentro de protocolos de código abierto.

«A medida que los agentes de IA mejoran sus habilidades de lectura, escritura y ejecución de código, cobra cada vez mayor importancia medir sus capacidades en entornos económicamente relevantes y fomentar el uso de sistemas de IA de forma defensiva para auditar y fortalecer los contratos implementados», afirmó la compañía en el comunicado de presentación del producto.

Los agentes de OpenAI sobre Ethereum llegan en un momento de rápido avance en agentes autónomos dentro del ecosistema de los criptoactivos. Como lo reportó CriptoNoticias, estos ya pueden interactuar con entornos complejos como Lightning Network. En esta segunda capa, los agentes pueden gestionar canales de liquidez y intercambios económicos con otras AI.

Coinbase, por su parte, lanzó al mercado Agentic Wallets, monederos que permiten que agentes de IA operen en la red Base sin pagar comisiones.. Y Phantom, la wallet más popular de Solana, activó un servidor MCP para que agentes de IA gestionen saldos y operen de forma autónoma.

Según datos de Token Terminal, la red de Ethereum alcanzó 17,3 millones de transacciones semanales. La explosión de transacciones en la red se da tras el lanzamiento de ERC-8004 en agosto de 2025. Este es un estándar que permite «descubrir, elegir e interactuar con agentes a través de límites organizacionales sin confianza preexistente» en economías de agentes abiertas.

¿Tienes información clave para nuestros reporteros? Ponte en contacto

Share This Article