Google ha dado un nuevo paso en la generación audiovisual con inteligencia artificial al presentar Veo 3.1, una evolución significativa de su modelo capaz de transformar imágenes fijas y texto en secuencias de video con sonido realista. Esta versión incorpora herramientas creativas mejoradas que permiten mayor control narrativo y fidelidad visual.
Según la compañía, Veo 3.1 representa una mejora considerable respecto a su predecesor, ofreciendo “audio más rico, mayor coherencia narrativa y un realismo visual superior”. El sistema también responde de manera más precisa a las indicaciones del usuario, generando contenido con una calidad optimizada en todos los niveles.
El modelo ya está integrado en Flow, la plataforma de edición cinematográfica impulsada por IA de Google. Con esta actualización, herramientas como «Ingredientes a video» —que convierte varias imágenes de referencia en clips animados con personajes, objetos y estilo definidos— ahora incluyen audio sincronizado. Lo mismo ocurre con «Fotogramas a video», que genera una transición fluida entre dos imágenes clave, y «Extender», que amplía automáticamente un video a partir de su segundo final, respetando la estética original.
Además, Flow ha sumado capacidades de edición más precisas, como la posibilidad de añadir o eliminar elementos en una escena, ajustando automáticamente la iluminación y las sombras para mantener la coherencia visual.
“El avance de Veo 3.1 marca un hito en la narración generativa, al ofrecer resultados de mayor calidad, edición detallada y sonido integrado en todas las herramientas disponibles en Flow”, señaló el equipo de desarrollo de Google.
Además de su integración en Flow, Veo 3.1 también estará disponible en la aplicación de Gemini y a través de las API de Vertex y Gemini, ampliando su acceso tanto a usuarios creativos como a desarrolladores y empresas.
Sin embargo, el avance tecnológico también ha despertado preocupación. El realismo alcanzado por Veo 3.1 hace cada vez más difícil distinguir entre lo generado por IA y lo capturado en el mundo real. Esta capacidad, aunque impresionante, ha reavivado el debate sobre la proliferación del fenómeno conocido como AI slop o “basura digital”: contenido sintético que inunda las plataformas, diluyendo la autenticidad y generando desconfianza entre los usuarios.
Silvia Martínez Martínez, profesora de la Universitat Oberta de Catalunya, advierte que esta saturación puede afectar negativamente la experiencia del usuario y aumentar el escepticismo hacia todo tipo de contenido, incluso si no fue creado con IA.
Google, por su parte, no ha divulgado detalles técnicos sobre el entrenamiento de Veo 3.1. No obstante, una investigación reciente de CNBC apunta a que la compañía ha utilizado parte del enorme archivo de YouTube —más de 20,000 millones de videos— para entrenar modelos como Gemini y Veo. Google asegura que solo emplea contenidos autorizados y que ha establecido acuerdos con creadores para proteger su propiedad intelectual.
“Siempre hemos usado contenido de YouTube para mejorar nuestros productos, y eso se mantiene en la era de la inteligencia artificial”, declaró un portavoz. También afirmó que han implementado salvaguardas para que los creadores mantengan el control sobre su imagen y producción.
Aun así, varios creadores afirman no haber sido informados de estos usos ni de los acuerdos supuestamente vigentes. El informe advierte que estas prácticas podrían derivar en una crisis de propiedad intelectual, al alimentar sistemas que compiten directamente con quienes produjeron el contenido base, sin ofrecer reconocimiento, consentimiento ni compensación.
