El último modelo de Anthropic, Claude Mythos Preview, es tan potente que no lo van a hacer disponible para el público general y han creado el proyecto Glasswing para que un reducido grupo de empresas lo valoren como herramienta de ciberdefensa.
Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, y Palo Alto Networks son algunos de los elegidos.
Si queréis ver la ficha completa del modelo, la tenéis aquí:
En este artículo del Red Team de Anthropic, evalúan las capacidades de este nuevo modelo para identificar vulnerabilidades, y comentan que el 99% de las que han descubierto usándolo, aún no están parcheadas. Imaginemos esto en manos de los malos...
red.anthropic.com
En el New York Times, Thomas L. Friedman escribe un artículo de opinión sobre el tema que invita a pensar dónde vamos a llegar...
Normalmente, ahora mismo estaría escribiendo sobre las implicaciones geopolíticas de la guerra con Irán, y estoy seguro de que lo haré pronto de nuevo. Pero quiero interrumpir ese pensamiento para destacar un avance sorprendente en inteligencia artificial — uno que llegó antes de lo esperado y que tendrá implicaciones geopolíticas igualmente profundas.
La empresa de inteligencia artificial Anthropic anunció el martes que lanzaría la última generación de su gran modelo de lenguaje, denominada Claude Mythos Preview, pero solo para un consorcio limitado de unas 40 empresas tecnológicas, entre ellas Google, Broadcom, Nvidia, Cisco, Palo Alto Networks, Apple, JPMorganChase, Amazon y Microsoft. Algunos de sus competidores están entre estos socios porque este nuevo modelo de IA representa un "cambio radical" en el rendimiento que tiene implicaciones críticamente importantes tanto positivas como negativas para la ciberseguridad y la seguridad nacional de Estados Unidos.
La buena noticia es que Anthropic descubrió, durante el desarrollo de Claude Mythos, que la IA no solo podía escribir código de software con mayor facilidad y complejidad que cualquier modelo disponible actualmente, sino que, como consecuencia de esa capacidad, también podía encontrar vulnerabilidades en prácticamente todos los sistemas de software más populares del mundo con mayor facilidad que antes.
La mala noticia es que, si esta herramienta cae en manos de actores malintencionados, podrían hackear prácticamente todos los grandes sistemas de software del mundo, incluidos todos los fabricados por las empresas del consorcio.
Esto no es una maniobra publicitaria. En la antesala de este anuncio, representantes de las principales empresas tecnológicas han mantenido una conversación privada con la administración Trump sobre las implicaciones para la seguridad de Estados Unidos y de todos los demás países que utilizan estos ahora vulnerables sistemas de software, me dijeron los tecnólogos implicados.
Y con razón. Como dijo Anthropic en su comunicado escrito el martes, solo en el último mes, "Mythos Preview ya ha encontrado miles de vulnerabilidades de alta gravedad, incluyendo algunas en todos los principales sistemas operativos y navegadores web. Dado el ritmo de progreso de la IA, no pasará mucho tiempo antes de que tales capacidades proliferen, potencialmente más allá de los actores que se comprometieron a desplegarlas de forma segura. Las consecuencias — económicas, de seguridad pública y de seguridad nacional — podrían ser graves.»
Project Glasswing, el nombre que Anthropic da al consorcio, es un proyecto para trabajar con las empresas tecnológicas más grandes y de mayor confianza y proveedores de infraestructuras críticas, incluidos los bancos, "para poner estas capacidades en uso con fines defensivos", añadió la compañía, y para dar a las principales empresas tecnológicas una ventaja inicial en la búsqueda y parcheo de esas vulnerabilidades.
"No planeamos hacer que Claude Mythos Preview esté disponible en general, pero nuestro objetivo final es permitir que nuestros usuarios desplieguen modelos de clase Mythos de forma segura a gran escala — para fines de ciberseguridad, pero también por la multitud de otros beneficios que aportarán estos modelos tan capaces", dijo Anthropic.
Mi traducción: ¡Madre mía! La IA superinteligente está llegando más rápido de lo previsto, al menos en esta zona. Sabíamos que se estaba volviendo increíblemente bueno para permitir que cualquiera, por muy hábil que fuera con informática, escribiera código de software. Pero ni siquiera Anthropic supuestamente anticipó que llegaría a ser tan bueno, tan rápido, encontrando formas de encontrar y explotar fallos en el código existente.
Anthropic dijo que encontró exposiciones críticas en todos los principales sistemas operativos y navegadores web, muchos de los cuales gestionan redes eléctricas, sistemas de abastecimiento de agua, sistemas de reservas aéreas, redes de venta al por menor, sistemas militares y hospitales en todo el mundo.
Si esta herramienta de IA llegara a estar ampliamente disponible, significaría que la capacidad de hackear cualquier sistema de infraestructura importante —un esfuerzo duro y costoso que antes era esencialmente dominio exclusivo de expertos y organizaciones de inteligencia del sector privado— estaría disponible para todos los actores criminales, organizaciones terroristas y países, por pequeños que sean.
No estoy exagerando cuando digo que los niños podrían desplegar esto por accidente. Mamá y papá, preparaos para:
"Cariño, ¿qué hiciste después del colegio hoy?"
"Bueno, mamá, mis amigos y yo hemos cortado la red eléctrica. ¿Qué hay de cenar?"
Por eso Anthropic está dando versiones cuidadosamente controladas a los principales proveedores de software para que puedan encontrar y corregir las vulnerabilidades antes que los malos — o tus hijos.
En momentos como este prefiero profundizar con mi tutor de tecnología, Craig Mundie, exdirector de investigación y estrategia en Microsoft, miembro del Consejo Asesor Presidencial en Ciencia y Tecnología del presidente Barack Obama y autor, junto con Henry Kissinger y Eric Schmidt, de un libro sobre inteligencia artificial llamado "Génesis."
En nuestra opinión, ningún país del mundo puede resolver este problema por sí solo. La solución —esto puede sorprender a la gente— debe comenzar con las dos superpotencias de la inteligencia artificial, Estados Unidos y China. Ahora es urgente que aprendan a colaborar para evitar que actores malintencionados accedan a este nuevo nivel de capacidad cibernética.
Una herramienta tan poderosa los amenazaría a ambos, dejándolos expuestos a actores criminales dentro de sus países y a grupos terroristas y otros adversarios externos. Podría convertirse fácilmente en una amenaza mayor para cada país de lo que los dos países lo son entre sí.
De hecho, este es potencialmente un punto de inflexión tan fundamental y significativo como lo fue la aparición de la destrucción mutua asegurada y la necesidad de la no proliferación nuclear. Estados Unidos y China deben trabajar juntos para protegerse a sí mismos, así como al resto del mundo, de los humanos y las IA autónomas que usan esta tecnología — mucho más de lo que deberían preocuparse por Rusia.
Esto es tan importante y urgente que debería ser un tema principal en la agenda de la cumbre entre Trump y el presidente Xi Jinping en Pekín el próximo mes.
"Lo que antes era territorio de grandes países, grandes ejércitos, grandes empresas y grandes organizaciones criminales con grandes presupuestos — esta capacidad para desarrollar sofisticadas operaciones de ciberataque — podría estar fácilmente disponible para actores pequeños", explicó Mundie. "Lo que estamos a punto de ver no es otra cosa que la completa democratización de las capacidades de ciberataque."
Significa que los gobiernos responsables, en colaboración con las empresas que desarrollan estas herramientas de IA e infraestructura de software, deben hacer tres cosas con urgencia, argumenta Mundie.
Para empezar, dice, necesitamos "controlar cuidadosamente la publicación de estos nuevos modelos superinteligentes y asegurarnos de que solo lleguen a los gobiernos y empresas más responsables."
Luego necesitamos aprovechar el tiempo que esto nos da para distribuir herramientas defensivas a los actores buenos "para que el software que ejecuta su infraestructura clave pueda ver todos sus fallos encontrados y corregidos antes de que los hackers inevitablemente consigan estas herramientas de una forma u otra." (Por cierto, el coste de corregir las vulnerabilidades que seguramente se descubrirán en sistemas de software heredados, como los de las compañías telefónicas, será significativo. Luego multiplica eso por toda nuestra base industrial.)
Por último, sostiene Mundie, debemos trabajar con China y todos los países responsables para construir espacios de trabajo seguros y protegidos, dentro de todas las redes clave, públicas y privadas, en las que empresas y gobiernos de confianza "puedan trasladar todos sus servicios críticos — para que estén protegidos frente a futuros ataques de hacking."
Será interesante ver qué recuerda más la historia sobre el 7 de abril de 2026: el aplazamiento del lanzamiento de bombas por parte de Estados Unidos sobre Irán o la cuidadosamente controlada publicación de la Previa de Claude Mythos por parte de Anthropic y sus aliados técnicos.


