De peor a mejor, estos son los modelos de Inteligencia Artificial más destacados

Con el ascenso de la Inteligencia Artificial en el mercado, son varias las empresas que están ofreciendo sus servicios. Destacan Meta, OpenAI, Cohere y Anthropic, pero ¿cuál de ellos tiene la mejor tecnología y cuál la peor?

Un grupo de investigadores de Arthur AI probó sus respectivos modelos: Llama 2 (Meta), Cohere, GPT-4 (utilizado en ChatGPT por OpenAI) y Claude 2 (Anthropic), estableciendo cuál era el peor y cuál el mejor.

La base está en las respuestas de cobertura y las denominadas “alucinaciones” o errores persistentes en las respuestas.

“Esta iniciativa de investigación clasifica las fortalezas y debilidades de las ofertas de modelos de idiomas grandes de líderes de la industria como OpenAI, Anthropic y Meta, así como otros modelos de código abierto”, señala Arthur AI en su portal.

Adam Wenchel, fundador y CEO de Arthur, dijo a CNBC que es el primer informe “que da una mirada exhaustiva a las tasas de alucinaciones, en lugar de simplemente proporcionar un número único que habla sobre dónde se encuentran en una tabla de clasificación de LLM”.

¿Cuál es el mejor y peor modelo de Inteligencia Artificial, según sus respuestas?

A todos los modelos se les dio un conjunto de datos de preguntas desafiantes en matemáticas combinatorias, presidentes de Estados Unidos y líderes políticos marroquíes, buscando saber cuál respondía mejor.

En líneas generales, la Inteligencia Artificial de Cohere fue la de peor desempeño. Y esto generó el rechazo de un portavoz, citado por CNBC: “La tecnología de generación aumentada de recuperación de Cohere, que no estaba en el modelo probado, es muy eficaz para dar a las empresas citas verificables para confirmar las fuentes de información”.

El logotipo de OpenAI se ve en un teléfono móvil frente a la pantalla de una computadora que muestra la salida de ChatGPT, el martes 21 de marzo de 2023, en Boston. (Foto AP/Michael Dwyer) AP (Michael Dwyer/AP)

Llama 2 de Meta alucina más en general que GPT-4 y Claude 2 de Anthropic.

GPT-4 de ChatGPT (OpenAI) fue el que tuvo mejor rendimiento de todos los modelos probados, descubriendo los investigadores que las alucinaciones eran menores que en GPT-3.5.

Para Wenchel, la importancia de los resultados es “probar su carga de trabajo exacta” y “comprender cómo funcionan para lo que están tratando de lograr”.

De peor a mejor, estos son los modelos de Inteligencia Artificial más destacados

Un grupo de investigadores analizó varios modelos de Inteligencia Artificial.

¿Cuál es el mejor y peor modelo de Inteligencia Artificial, según sus respuestas?

Tags

Lo Último

De peor a mejor, estos son los modelos de Inteligencia Artificial más destacados

Un grupo de investigadores analizó varios modelos de Inteligencia Artificial.

¿Cuál es el mejor y peor modelo de Inteligencia Artificial, según sus respuestas?

Recomendados:

Tierra debajo del mar: encuentran evidencias del “mundo perdido” en las profundidades del Océano Pacífico

Asteroide de 10 metros recién descubierto por la NASA podría ser un pedazo desprendido de la Luna, revela estudio

Arqueólogos de China encuentran el origen del pueblo que logró unir al occidente con Asia hace 1.300 años

Tags

Lo Último