Si Google es el buscador más poderoso de Internet, incluso desde una era sin inteligencia artificial (IA) y nos revolucionó, ahora puede llevarnos quién sabe hasta donde.
En el vertiginoso mundo de la inteligencia artificial, la compañía de Mountain View está a punto de lanzar un proyecto que podría cambiar el juego por completo. Se llama Gemini y es la apuesta del gigante tecnológico para convertirse en la “inteligencia artificial más poderosa” del mundo.
Este movimiento, como explica Decrypt, coloca a Google en una posición de enfrentamiento directo con OpenAI, el creador de ChatGPT, que ha causado sensación desde su lanzamiento en noviembre pasado.
Gemini, según un informe de The Information, ya se encuentra en pruebas con empresas seleccionadas, lo que sugiere que su lanzamiento para consumidores podría estar a la vuelta de la esquina. Pero, ¿qué hace que Gemini sea tan especial?
Lo que debes saber de Gemini
La clave de Gemini radica en su capacidad multimodal. Esto significa que puede procesar y entender diferentes tipos de datos de manera nativa, como texto, imágenes, audio y más.
Sundar Pichai, CEO de Google, afirmó en un discurso reciente: “Gemini fue creado desde cero para ser multimodal. Aunque todavía es temprano, ya estamos viendo impresionantes capacidades multimodales que no se ven en modelos anteriores”.
Esta capacidad multimodal podría representar un desafío significativo para ChatGPT, que, aunque es altamente elogiado por su capacidad conversacional, se enfoca principalmente en texto. Las empresas de diversas industrias, desde fintech hasta atención médica, están invirtiendo grandes sumas de dinero para aprovechar las habilidades conversacionales de ChatGPT.
No obstante, Sundar Pichai parece confiado en el enfoque de Google. Cuando se le preguntó si la empresa debería haber lanzado un competidor de ChatGPT antes, Pichai respondió: “No me queda del todo claro que hubiera funcionado tan bien”.
Google ha estado aumentando su inversión en IA desde 2016 y, según Pichai, se necesitaba más tiempo para perfeccionar sus modelos antes de lanzar Gemini. “Me siento muy cómodo con dónde estamos”, afirmó.
Gemini y la sombra de Bard
El camino hacia Gemini no ha estado exento de desafíos. El lanzamiento inicial de Google de su chatbot Bard, basado en LaMDA, en febrero, fue un fracaso después de que fallara en datos básicos sobre el telescopio James Webb. Sin embargo, Bard ha recibido una importante actualización para aprovechar el nuevo modelo multimodal PaLM 2 de Google, que ha demostrado superar significativamente a su predecesor.
En comparación con ChatGPT Plus, Bard ofrece traducciones más rápidas y contextuales, y ha demostrado ser competente en la generación de código en más de 20 lenguajes de programación. Sin embargo, ChatGPT ha respondido a este desafío con su herramienta Advanced Data Analytics, convirtiéndose en una máquina de codificación poderosa.
La integración de Bard con el vasto índice de búsqueda en tiempo real de Google le ha dado una ventaja al responder preguntas sobre eventos actuales. Además, Google es el principal inversor en Anthropic, la startup detrás de Claude AI, el competidor más poderoso de ChatGPT hasta la fecha. Claude puede manejar más de 100,000 tokens de contexto, superando a ChatGPT en términos de calidad en muchas ocasiones.
Además, Google está siguiendo un enfoque de “ecosistema” centrado en la IA, integrando capacidades generativas en productos como Docs, Maps y Search. Recientemente, anunció nuevas actualizaciones de IA destinadas a mejorar la forma en que las personas encuentran y asimilan información en línea.
Con Gemini a punto de hacer su entrada, el imperio de IA de OpenAI podría estar enfrentando su desafío más grande hasta ahora. Sin embargo, por ahora, Sundar Pichai está contento de tomar un enfoque lento y constante en su búsqueda por liderar la próxima era de la inteligencia artificial.