La carrera armamentística de la inteligencia artificial sigue en pleno apogeo, y Google no pretende quedarse atrás en absoluto. Su nuevo as bajo la manga es Veo 3, la versión más reciente de su modelo de generación de vídeos que incluye una novedad clave: los vídeos que crea ahora pueden tener música e incluso voz, con un nivel de sincronización labial que asusta.
Así es Veo 3, la nueva IA de Google que puede crear vídeos con voz y música
El pasado 20 de mayo, Google celebraba su evento anual de desarrolladores, el Google I/O. Como parte de esta presentación, la compañía ha sorprendido al mundo presentando a Veo 3, la versión más actualizada de su modelo de generación de vídeos Veo. La principal novedad que ofrece es que el contenido generado ahora cuenta con música e incluso voz, no solo haciendo mucho más sencillo y llevadero el proceso para los usuarios, sino además garantizando mejores resultados.
Se trata de un grandísimo hito en el terreno de la IA. A primera vista, no hay problemas en la generación como cambios en la anatomía o la morfología del sujeto —el marinero—, quien se mueve de manera natural. Además, la breve narración cuenta con una sincronización labial prácticamente perfecta, por lo que da la impresión de que estamos ante un pequeño clip de vídeo procedente de alguna serie, película o documental. Es algo más relevante de lo que parece, y no es descabellado afirmar que estamos ante un pequeño gran hito en el terreno de las inteligencias artificiales y modelos de lenguaje.
Según Google, Veo 3 “excede las expectativas” a la hora de plasmar vídeos a partir de entradas de texto e imágenes. Su entendimiento a la hora de crear lo que el usuario le pide es enorme, y las físicas son lo suficientemente convincentes como para ofrecer un resultado solvente. Veo 3 está disponible desde el 20/05/2025 para los suscriptores Ultra de la app Gemini en Estados Unidos, y también está disponible para empresas a través de Vertex AI.
Otros anuncios importantes del Google I/O: Flow, Imagen 4, Veo 2…
Aunque Veo 3 ha acaparado toda la atención dentro de esta presentación, también se han anunciado otras novedades relevantes en el terreno de las IAs de Google. Por un lado, Veo 2 ha sido actualizado para hacerlo más “hollywoodiense”: la compañía ha trabajado codo con codo con expertos de la industria cinematográfica para mejorar varios planos y movimientos de cámara realistas en los clips generados.
Por otra parte, Flow es la nueva IA profesional de generación de vídeo de Google, que integra los modelos más avanzados de DeepMind: Veo, Imagen y Gemini. Mientras que Veo 4 genera vídeos con buenos resultados, está pensado para usuarios básicos, mientras que Flow ofrece una mayor libertad creativa y ha sido concebida para realizadores de vídeo profesionales. Con una simple descripción como elenco, ubicación, objetos en escena y estilo visual, Flow genera escenas de película.
Flow está disponible desde el 20/05/2025 para los suscriptores de Google AI Pro y Ultra en Estados Unidos, y próximamente estará disponible para los usuarios de otros países.
Habrá The Last of Us 3, pero no es el nuevo juego de Naughty Dog
Por último, pero no menos importante, Imagen 4 es el modelo más reciente de generación de imágenes de Google. Las principales novedades que ofrece son mayor verosimilitud y nivel de detalle en elementos como gotas de agua, tejidos, materiales textiles o pieles de animales, redundando en un mayor realismo. Imagen 4 está disponible desde el 20/05/2025 a través de la app Gemini, Whisk, Vertex AI y en Workspace de Google.
En definitiva: ante el avance de otras IAs como Grok de X y Sora y ChatGPT de OpenAI, Google da un puñetazo sobre la mesa presentando las versiones más recientes y actualizadas de sus modelos de generación de vídeo e imágenes. Los avances presentados por la compañía no son baladí; aunque los servicios de OpenAI gozan de gran popularidad, todavía sigue sin haber un claro ganador en la guerra de las IA, una dura pugna tecnológica en la que estas empresas multimillonarias luchan entre sí por ofrecer los mejores productos y servicios a sus usuarios. Solo el tiempo dirá quién se queda por el camino, y quién sigue dentro de la pelea.
Tomado de Diario AS