La creación de imágenes generativas basadas en inteligencia artificial (IA) es una forma fascinante de explorar la creatividad digital. Sin embargo, a veces el proceso puede ser lento debido a la complejidad de los algoritmos y otros factores. Pero el futuro parece prometedor, ya que Snap, la empresa matriz de Snapchat, ha anunciado un avance en este campo.
En una reciente publicación de blog, Snap Research reveló su nuevo método llamado SnapFusion, que tiene el potencial de acelerar significativamente el tiempo necesario para crear imágenes generativas utilizando IA.
Según la empresa, citada en Neowin, este método revolucionario reduce el tiempo de generación de imágenes a menos de dos segundos, estableciendo un nuevo estándar en la comunidad académica como el tiempo más rápido logrado hasta ahora.
Snap Research logró este avance mediante la optimización de la arquitectura de la red y el proceso de eliminación de ruido, lo que permite un rendimiento increíblemente eficiente sin comprometer la calidad de la imagen. Esto significa que en un futuro cercano, será posible ejecutar el modelo de generación de imágenes basadas en indicaciones de texto y obtener resultados claros y nítidos en solo unos segundos, directamente desde dispositivos móviles.
Superaría todo lo visto hasta ahora
Esta mejora significativa en el tiempo de procesamiento supera a las investigaciones anteriores que requerían minutos u horas para completar el proceso.
El trabajo de investigación detalla en profundidad el funcionamiento de SnapFusion, presentando ejemplos de obras de arte creadas con esta nueva técnica.
Se destaca el uso de una UNet eficiente para identificar redundancias en el modelo original y reducir los cálculos del decodificador de imágenes mediante la destilación de datos. Además, se exploraron estrategias de entrenamiento y se introdujo la regularización a partir de una guía sin clasificadores para mejorar aún más la destilación.
Aunque el nuevo método aún no está disponible para el público en general, Snap asegura que tiene el potencial de mejorar las experiencias de inteligencia artificial generativa en dispositivos móviles en el futuro.