El hecho de que un modelo de IA se comporte de manera tan básica, similar a jugar «Pokémon», resulta inquietante. No debería ser así en absoluto.

El año 2013 marcó un momento clave en la evolución de la inteligencia artificial, aunque en esa época, pocos conocían a Profundo. Esta pequeña startup estaba incursionando en el mundo de la inteligencia artificial, y sus investigadores se embarcaron en un proyecto fascinante: enseñar a su sistema a jugar videojuegos, específicamente para vencerlos. Utilizaron como herramientas de entrenamiento varios títulos de la icónica consola Atari, lo que resultó en un enfoque innovador en la formación de modelos de IA. Para documentar estos esfuerzos, realizaron un detallado informe que reflejaba su progreso.

Entre los videojuegos seleccionados estaba «Brote», conocido fuera de España como «Arkanoid». En un video de esa época, se puede observar cómo, tras solo 10 minutos de juego, la IA no mostraba signos de habilidad. Sin embargo, después de dos horas de juego constante, demostró una notable competencia, similar a la de un jugador experimentado.

Lo más sorprendente ocurrió cuando, a las cuatro en punto, la máquina encontró un «truco» ingenioso para maximizar su eficiencia: logró crear un «túnel» que le permitía lanzar la pelota sin esfuerzo, prácticamente completando el nivel en un abrir y cerrar de ojos. Este descubrimiento subrayó la capacidad de la IA para innovar en el ámbito del videojuego.

Desde ese momento, utilizar videojuegos como herramienta de entrenamiento ha pasado a ser una práctica común en la industria para evaluar modelos de inteligencia artificial y su capacidad para adaptarse y superar desafíos. Esta misma metodología fue adoptada por Anthropic cuando lanzó Claude 3.7 hace unas semanas.

Este modelo híbrido de IA se ha destacado en áreas como la programación y el razonamiento. En un audaz intento por explorar sus capacidades, los desarrolladores de Anthropic decidieron desafiar a Claude 3.7 en un entorno específico: el videojuego «Pokémon».

La IA enfrenta un desafío

En este experimento, los responsables de Anthropic estaban interesados en evaluar si los sistemas de IA pueden «apoyarse en habilidades cada vez más complejas». No solo se trataba de acumular datos a través de la capacitación, sino de permitir que la IA utilizara argumentos y razonamientos a medida que se encontraba en situaciones más complejas y desafiantes.

A pesar de que las versiones anteriores de Claude tenían dificultades incluso para comenzar a jugar, Claude 3.7 viene con lo que se ha denominado «Pensamiento expandido». Este nuevo enfoque le permite «planificar de antemano», recordar sus objetivos y adaptarse cuando sus estrategias iniciales no son efectivas, algo que los modelos anteriores no lograban hacer.

El objetivo de los expertos de Anthropic con estas mejoras es abordar problemas del mundo real. Situaciones cotidianas que son sencillas para los humanos, como controlar un videojuego o resolver un rompecabezas visual, son especialmente desafiantes para los modelos de IA, como lo demuestra el Benchmark Arc-Aagi 2.

Fuente: antrópico.

A pesar del notable progreso de Claude 3.7, el desempeño de la IA no puede considerarse un éxito total. Como se menciona en un artículo de ARS Technica, Claude ha quedado atrapado en una sección del videojuego conocida como Montaña Slénite, lo que ha sido objeto de varios espectáculos en vivo en el canal de Twitch que fue creado por Anthropic. En este canal, se pueden observar los intentos continuos de Claude por avanzar, mostrando cómo intenta «pensar» y «razonar», pero sin lograr superar los obstáculos del juego.

A lo largo de estos intentos, se evidencia que Claude está lidiando con la complejidad del videojuego, a pesar de que su diseño sencillo parece fácil para los jugadores humanos. Este progreso debe ser valorado adecuadamente, ya que el modelo Claude 3.7 no se encontró simplemente «programado» para jugar el videojuego: tuvo que aprender y adaptarse durante el proceso.

La IA avanza con determinación

A pesar de lo mencionado, Claude muestra un desempeño notable en las partes del juego donde se presentan elementos textuales, lo que le permite identificar mejor las acciones a seguir en esos momentos. Sin embargo, un desafío significativo radica en su «memoria» limitada; puede manejar hasta 200,000 tokens. Si se supera esta capacidad, Claude debe recurrir a resúmenes, lo que puede derivar en la pérdida de detalles críticos que son claves para la progresión en el juego.

El camino por recorrer sigue siendo largo, pero los progresos son indiscutiblemente impresionantes y marcan un futuro donde los modelos de IA jueguen de manera autónoma y excepcional en diversos géneros. Es un desarrollo que sigue la estela de lo que DeepMind logró con su compleja interpretación de «Arkanoid», mostrando el potencial que la inteligencia artificial tiene en el ámbito del entretenimiento y más allá.

En conclusión, el avance de la IA en videojuegos es un claro indicador de su capacidad de aprendizaje y adaptación. Sin duda, contribuye a moldear un futuro en el que estas tecnologías puedan ofrecer interacciones más ricas y variadas en muchos aspectos de la vida cotidiana.

Para más detalles sobre estos avances, te invitamos a leer en | El último Google es una IA que juega videojuegos. La clave: ¿Entiende el lenguaje natural?