En un giro inesperado del cada vez más competido mercado de la Inteligencia Artificial (AI) la gente de Alphabet / Google, ha comenzado a distribuir demos muy cerradas de su nueva plataforma multimodal denominada Gemini, la cual, según los primeros reportes, sería mucho más potente y precisa que GPT-4 y por lo tanto superior a ChatGPT y DALL-E 3.
PUBLICIDAD
De hecho, OpenAI sacudió internet hace pocos días con la liberación de DALL-E 3, la evolución de su plataforma de Inteligencia Artificial capaz de generar imágenes a través de instrucciones de texto.
En aquel momento, al analizar las nuevas funciones, nuestra impresión franca es que finalmente se convertiría en un competidor a la altura de todo lo que puede lograr Midjourney, la IA generativa de imágenes que se ha posicionado como líder en ese segmento.
Pero ahora, han comenzado a surgir los primeros reportes en torno a Gemini de Google, donde todo apunta a que su liberación podría sacudir por completo el terreno y modificar de manera permanente la inercia de este sector.
Esto sólo significaría una cosa: problemas graves para Sam Altman y su compañía OpenAI, ya que estaría a punto de perder la delantera en el competido mercado.
Gemini de Google aplastaría a Chat-GPT, DALL-E 3 y GPT-4 de OpenAI
De acuerdo con un reporte de The Information, Alphabet / Google ha comenzado a distribuir a clientes, compañías y desarrolladores muy selectos, el acceso a la demos de Gemini, su nuevo Inteligencia Artificial multimodal que lanzaría pronto para competir contra OpenAI.
Esta nueva AI será capaz de procesar más de un tipo de datos. Por lo que se asume que el modelo podrá procesar imágenes y texto, permitiendo funciones como el análisis escrito de gráficos visuales. De hecho Gemini estaría tan cerca de ser lanzada que por ello el gigante tecnológico ha estado entregando una primera versión del modelo a un pequeño grupo de empresas.
PUBLICIDAD
A la par que la compañía estaría trabajando ya en su siguiente iteración, donde competiría de lleno contra Copilot de Microsoft, también vinculado a OpenAI. Donde en esa etapa también podría integrar generación de imágenes tan complejas como las de Midjourney.
El reporte del sitio detalla la experiencia de una persona que había probado la tecnología de Gemini, confirmando que superaría a por amplio margen a GPT-4, el núcleo que acciona a ChatGPT.
Ya que la IA aprovecha los datos de Google sobre el usuario generados desde sus productos de consumo, así como la información recopilada de Internet para generar respuestas más robustas y consistentes.
Este detalle confirma que el modelo sería capaz de comprender con mayor precisión las intenciones e instrucciones del usuario, a partir de ese respaldo de datos.
El factor más inquietante es que Gemini también genera menos respuestas incorrectas y su porcentaje de “alucinaciones”, es mucho menor que con la Inteligencia Artificial de OpenAI.
Estamos tal vez ante el probable inicio de una nueva era en este sector, a meses del estallido generado por ChatGPT.