Le dernier modèle vidéo de Google, intégrant l’intelligence artificielle, démontre une amélioration marquée dans sa compréhension des lois physiques.
Résumé
- Google dévoile une nouvelle version de son outil vidéo, Veo 2.
- Veo 2 affiche une meilleure maîtrise des lois physiques et du mouvement humain.
- Des améliorations sont également apportées au modèle de texte tích L’image, Imagen 3.
Google introduit Veo 2 et améliore Imagen 3
La célèbre entreprise technologique Google a récemment débuté le déploiement de son IA générative Veo auprès de ses clients professionnels. Aujourd’hui, elle annonce rapidement une nouvelle version de son outil vidéo, Veo 2, aux premiers utilisateurs.
Maîtriser le langage cinématographique
Comme l’indique Google, Veo 2 « saisit le langage cinématographique ». Cela signifie que vous pouvez mentionner un genre, un effet ou un objectif spécifique en interagissant avec le modèle.
Optimisation de la compréhension des lois physiques et du mouvement humain
En outre, Google garantit que ce modèle comprend mieux les lois de la physique réelles et le mouvement humain. Modéliser des humains en mouvement pose souvent des difficultés pour les modèles génératifs. Ainsi, l’assertion de Google sur l’efficacité accrue de Veo 2 concernant ces défis est particulièrement significative. Toutefois, les exemples présentés par l’entreprise ne permettent pas encore de tirer des conclusions définitives. Le véritable enjeu pour Veo 2 se situera lorsqu’il s’agira de générer une vidéo d’une performance de gymnaste.
Optimisations d’Imagen 3
Parallèlement, Google introduit des améliorations pour Imagen 3, son modèle de texte en image. La société affirme que cette nouvelle version génère des images plus éclatantes et mieux organisées. Elle propose également une plus grande variété de styles artistiques avec davantage de précision. En même temps, elle excelle dans l’exécution des demandes de manière plus précise.
Ces avancées technologiques témoignent des efforts constants de Google pour perfectionner ses modèles d’IA, visant à offrir des outils d’une performance accrue à ses utilisateurs. Le déploiement progressif de Veo 2 auprès des utilisateurs de Google Labs aux États-Unis, ainsi que les améliorations d’Imagen 3, accessibles dans plus de 100 pays, illustrent cette démarche ambitieuse.

