Google ha abierto a desarrolladores y clientes empresariales la API de Gemini Omni Flash, su modelo de generación y edición de vídeo con inteligencia artificial. La novedad no está solo en crear clips desde texto, sino en poder editar una pieza mediante instrucciones conversacionales, manteniendo el contexto de cambios anteriores.
Para un equipo de marketing, esto significa pedir un vídeo de producto, corregir el encuadre, cambiar un elemento visual o adaptar una escena sin reiniciar todo el proceso desde cero. La promesa es reducir la cadena habitual de guion, rodaje, edición, revisión y nueva edición en piezas cortas de uso interno, formación o redes sociales.
El modelo se lanza con límites claros. Gemini Omni Flash genera clips de entre 3 y 10 segundos a 720p, en formatos horizontal y vertical. También puede trabajar con referencias visuales, aunque Google reconoce restricciones en consistencia de personajes, extensión de escenas y uso de referencias de audio. Para campañas premium, esos límites siguen siendo importantes.
El precio anunciado, 0,10 dólares por segundo generado a 720p, coloca el producto en una franja agresiva para iterar piezas breves. Un clip de 10 segundos ronda un dólar por generación, sin contar las repeticiones necesarias hasta obtener una versión aprobable. La economía real dependerá de cuántas vueltas necesite cada equipo antes de publicar.
Google acompaña el lanzamiento con medidas de procedencia. Los vídeos incorporan SynthID y credenciales de contenido C2PA, dos capas pensadas para identificar material generado por IA. Es un punto relevante para empresas que necesitan controlar uso de marca, derechos y trazabilidad de contenido.
La competencia en vídeo generativo se está acelerando. OpenAI, ByteDance, Alibaba y otros actores quieren capturar presupuestos de producción audiovisual. Google intenta diferenciarse con edición conversacional y una integración directa en su ecosistema de desarrollo.
La pregunta ya no es si la IA generará vídeos aceptables, sino qué parte del flujo profesional puede absorber sin romper calidad, derechos ni confianza.
