No dia 30 de novembro de 2022, o ChatGPT foi lançado ao público. Um chatbot criado pela OpenAI, que oferecia uma resposta rápida por meio da Inteligência Artificial às perguntas das pessoas.
Mais de um ano deste acontecimento - que poderíamos catalogar como histórico - a IA não serve apenas para fazer perguntas. Atualmente, o ChatGPT permite criar imagens, códigos e uma infinidade de aplicativos em sua versão paga.
O problema? A competição neste setor é entre titãs. Por um lado, temos o Copilot da Microsoft, que até trouxe um novo botão em seu hardware, e o Gemini do Google, anteriormente conhecido como Bard.
Esta última se perfila como a mais recente inovação em inteligência artificial, com um modelo de linguagem que promete transformar a interação entre usuários e tecnologia.
Revolucionando a IA
O Gemini, desenvolvido pelo Google AI, chama a atenção em primeiro lugar pelo seu enfoque ‘multimodal’, capaz de processar e gerar informações a partir de uma variedade de dados, como texto, imagens, áudio e código, ao contrário do ChatGPT, que por enquanto trabalha principalmente com texto.
Este modelo de linguagem grande (LLM) é um investimento do Google em uma inteligência artificial mais sofisticada e versátil, em comparação com o ChatGPT.
Dessa forma, ele oferece recursos destacados como multimodalidade, raciocínio avançado, escalabilidade e eficiência em diferentes plataformas, prometendo respostas mais precisas e relevantes graças ao seu sistema de análise de dados, ainda mais com sua versão paga: Gemini Ultra.
No entanto, o Gemini ainda não gera imagens, como o ChatGPT faz através do Dall-E. Por enquanto, o Google antecipa a inclusão dessa funcionalidade em um futuro próximo, mas não forneceu datas exatas.
Disponível tanto para computadores quanto para celulares através de seu site, o Gemini está ganhando força e busca se posicionar como a ferramenta de inteligência artificial mais poderosa.