Google DeepMind no se anda con juegos. La compañía de inteligencia artificial está formando un equipo de alto calibre para trabajar en una de las metas más ambiciosas en el campo de la IA: desarrollar sistemas capaces de entender y replicar el mundo físico. Estos sistemas, conocidos como world models o modelos del mundo, prometen acercar a la humanidad un paso más hacia la tan discutida IA General (AGI, por sus siglas en inglés).
Te puede interesar: [Microsoft quiere que la inteligencia artificial se ejecute de forma local en tu computador]
Pero, ¿qué hace tan especial este nuevo enfoque?
¿Qué Son los “World Models”?
En términos simples, un world model es un algoritmo diseñado para crear una representación interna del mundo físico, algo así como un modelo mental en el que una IA puede predecir eventos futuros y entender cómo las cosas interactúan.
Imagina, por ejemplo, que una IA ve un balón de baloncesto botar. Un modelo generativo tradicional puede reconocer que la pelota está rebotando, pero no tiene ni idea de por qué sucede. Por otro lado, un world model puede analizar el rebote y entender las leyes físicas detrás de él: el peso del balón, la fuerza aplicada, la gravedad.
Básicamente, estos algoritmos buscan replicar la intuición humana, esa capacidad de razonar sobre el mundo basándose en conocimientos implícitos y experiencia previa.
DeepMind: Construyendo Mundos Virtuales
El proyecto está liderado por Tim Brooks, conocido por su trabajo como excodirector del proyecto Sora en OpenAI. Según Brooks, los planes de DeepMind son “ambiciosos”, y no lo dice a la ligera. En una publicación reciente en redes sociales, compartió detalles del enfoque de la compañía: crear modelos generativos masivos capaces de simular entornos físicos completos.
Para ello, DeepMind ya ha comenzado a reclutar a los mejores ingenieros e investigadores. Las ofertas de trabajo mencionan que buscan expertos en entrenamiento de modelos generativos a gran escala, selección de datos y sistemas multimodales de lenguaje. ¿El objetivo? Crear una tecnología que pueda predecir con precisión eventos físicos y optimizar la interacción entre máquinas y entornos complejos.
Te puede interesar: [Por culpa de Siri: Apple deberá pagar una multa de 95 millones de dólares]
¿Por Qué Son Importantes los “World Models”?
Los world models son un paso importante hacia la creación de máquinas que no solo hagan cálculos rápidos, sino que también razonen con sentido común. Un artículo de TechCrunch explica que, actualmente, las IA son buenas en reconocer patrones, pero carecen de una comprensión real del contexto. Por ejemplo, una IA puede identificar un video donde un vaso se rompe, pero no entiende por qué cayó o cuál fue la fuerza que lo rompió.
En contraste, un world model podría comprender el evento completo: la inclinación de la mesa, el momento exacto en que el vaso perdió equilibrio, y hasta predecir dónde caerían los pedazos tras el impacto. Este tipo de razonamiento no solo tiene aplicaciones en simulaciones, sino también en vehículos autónomos, planificación urbana, robots interactivos y, claro, videojuegos más inmersivos.
Yann LeCun y la Carrera por la IA General
El concepto de los world models no es exclusivo de Google DeepMind. Según Yann LeCun, científico jefe de IA en Meta, estos sistemas son cruciales para alcanzar la IA General, es decir, una inteligencia artificial que pueda realizar cualquier tarea intelectual al nivel de los humanos (o incluso mejor).
En una conferencia reciente, LeCun señaló que, para llegar a la AGI, las máquinas necesitan entender el mundo en términos humanos. Deben recordar cosas, tener intuición, razonar y aplicar sentido común. Nada de eso es posible con las IA actuales, pero los world models están diseñados precisamente para cerrar esa brecha.
Te puede interesar: [¿La Nintendo Switch 2 usará inteligencia artificial para mejorar el escalado de imágenes?]
Otros Jugadores
DeepMind no está solo en esta carrera. Varias organizaciones tecnológicas están apostando por los world models y sus aplicaciones.
Un ejemplo es World Labs, una startup cofundada por pesos pesados como Fei-Fei Li y Justin Johnson. Según Johnson, los modelos del mundo serán esenciales para crear entornos completamente virtuales e interactivos en 3D. Aunque actualmente el costo y el tiempo de procesamiento son elevados, Johnson cree que estas herramientas revolucionarán campos como el entretenimiento, el diseño y la simulación científica.
Por otro lado, Nvidia también se unió a la conversación al presentar Cosmos, su nueva plataforma que combina modelos generativos avanzados para crear sistemas de IA capaces de operar vehículos autónomos y robots en entornos físicos complejos.
¿Un Paso Más Cerca de la IA General?
Los expertos coinciden en que los world models son una pieza clave para lograr la IA General. Este tipo de tecnología no solo mejorará la capacidad de las máquinas para interactuar con su entorno, sino que también permitirá que ejecuten tareas con una precisión y eficiencia comparables (o superiores) a las de los humanos.
Imagínalo así: en lugar de una IA que simplemente obedece comandos, tendrás una máquina que entiende lo que estás pidiendo y por qué lo necesitas. Desde simular escenarios complejos hasta planificar ciudades inteligentes o predecir eventos físicos, los world models podrían cambiarlo todo.
La apuesta de Google DeepMind por los world models no es solo ambiciosa, es revolucionaria. Con el objetivo de dotar a las máquinas de razonamiento, intuición y sentido común, la compañía está dando un gran paso hacia la próxima generación de inteligencia artificial.