Connect with us

Tecnología

Google presenta Lumiere: un modelo revolucionario de texto a video

El modelo es capaz de generar videos realistas a partir de una amplia gama de indicaciones de texto

Foto del avatar

Publicado

/

Caracas / Foto Portada: archivo.- Google presentó esta semana Lumiere, un modelo de difusión de texto a video que representa un gran avance en la síntesis de videos. Según explica la compañía, Lumiere es capaz de generar videos que retratan movimientos realistas, diversos y coherentes, un desafío que hasta ahora ha limitado el desarrollo de esta tecnología.

Lea también: WhatsApp estrena la función de compartir pantalla en videollamadas

La clave de la innovación de Lumiere reside en su arquitectura Espacio-Tiempo U-Net. Esta arquitectura permite que el modelo genere la duración temporal completa del video de una sola vez, en lugar de sintetizar fotogramas clave distantes y luego hacer una superresolución temporal. Este enfoque único asegura una coherencia temporal global en el video final, algo que no se logra con los métodos tradicionales.

Lumiere también se beneficia de un modelo de difusión de texto a imagen previamente entrenado. Esto permite al modelo generar directamente un video de baja resolución y velocidad de cuadros completa, procesándolo en múltiples escalas espacio-temporales.

Los resultados de Lumiere son realmente impresionantes, asegura Google. El modelo es capaz de generar videos realistas a partir de una amplia gama de indicaciones de texto.



Advertisement

Tendencias