Google lance l'API Veo 3 pour les développeurs à 0,75 $ par seconde

Google a publié son générateur vidéo d'IA le plus avancé, Veo 3, pour les développeurs, en lançant aujourd'hui une version préliminaire payante via l'API Gemini et Vertex AI. Cette décision, qui tarife la vidéo 720p avec audio synchronisé à 0,75 $ par seconde, constitue une étape importante dans la stratégie de Google visant à monétiser ses puissants outils de création.

Cela permet aux développeurs d'intégrer le modèle, qui génère des vidéos, des dialogues et des effets sonores haute définition à partir d'une seule invite, directement dans leurs propres applications. La version de l’API fait suite à une série rapide de mises à jour qui ont récemment apporté des fonctionnalités de conversion d’image en vidéo et un accès mondial aux abonnés IA de Google.

De l'application grand public à l'API développeur

Lenouvel accès développeurIl s'agit d'une extension essentielle pour un modèle qui, jusqu'à présent, était principalement destiné au consommateur. L'API prend actuellement en charge la génération de texte en vidéo, Google promettant que des fonctionnalités d'image en vidéo sont en route. Un mode « Veo 3 Fast » plus rapide et plus rentable est également prévu pour une future version de l'API.

La principale force du modèle réside dans sa capacité à créer des résultats cohérents et réalistes. Eli Collins, vice-président de Google DeepMind, a noté que « Veo 3 excelle depuis les invites de texte et d'images jusqu'à la physique du monde réel et à la synchronisation labiale précise. » Cette capacité était un élément clé de la révélation initiale, le PDG Demis Hassabis déclarant qu'avec cette technologie, "nous sortons de l'ère silencieuse de la génération vidéo".

Pour aider les développeurs à démarrer, Google propose un modèle SDK et une application de démarrage pourprototypage rapide dans Google AI Studio. Cela permet une expérimentation rapide avant de s’engager dans une intégration à grande échelle, une étape cruciale compte tenu des coûts basés sur l’utilisation.

Premières expériences : de l'animation 3D aux cinématiques de jeux

Pour démontrer la valeur pratique de l'API au-delà des simples démonstrations techniques, Google souligne comment les premiers partenaires utilisent Veo 3 pourréfléchissez au contenu, itérez rapidement et améliorez l'efficacité. Ces premiers exemples pointent vers des flux de travail professionnels hautement spécialisés où le coût du modèle peut être justifié par le gain de temps et l’accélération de la créativité.

Par exemple,société d'animation Cartwheela développé un système qui traduit la vidéo 2D du mouvement humain en animation 3D prête à la production. L'entreprise utilise Veo 3 pour générer des actions humaines réalistes et fluides qui servent de données fondamentales à son pipeline, transformant les résultats de l'IA en animations de personnages truquées pour les clients.

De la même manière,studio de jeux Volleyexploite le modèle pourproduire des cinématiques vidéo dans le jeuqui font avancer l’histoire dans son prochain RPG, Wit’s End. Cela permet à ses concepteurs d’expérimenter rapidement de nouvelles idées narratives et visuelles, un avantage clé dans le cycle itératif de développement de jeux.

Ces cas d'utilisation soigneusement sélectionnés sont particulièrement spécialisés, ce qui peut suggérer que des intégrations plus larges et plus courantes ne sont pas encore prêtes à être annoncées publiquement. Il s’agit d’une stratégie courante visant à déployer de nouvelles technologies puissantes mais coûteuses, en se concentrant d’abord sur des secteurs de niche capables d’absorber immédiatement les coûts.

La structure tarifaire souligne cette orientation professionnelle. SelonLes tarifs officiels de Google, un clip de huit secondes coûte 6 $, tandis qu'une vidéo de cinq minutes coûterait 225 $. Étant donné que générer un résultat parfait nécessite souvent plusieurs tentatives, les coûts réels peuvent augmenter rapidement.

Comme le souligne une analyse, la création de cinq minutes de séquences utilisables pourrait nécessiter de générer dix fois ce montant, poussant potentiellement le coût total à 2 250 $. Google parie que pour certains cas d’utilisation, cela reste nettement moins cher que les méthodes de production vidéo traditionnelles.

Le dernier élément d’une stratégie d’IA plus large

Ce lancement d'API marque la fin d'un mois de déploiements agressifs pour Veo 3, le transformant d'un nouveau modèle prometteur en un produit aux multiples facettes. L’accès des développeurs fait suite à la sortie mondiale du modèle pour les abonnés AI Pro début juillet et à l’ajout de fonctionnalités d’image en vidéo la semaine dernière.

Cette décision renforce la position de Veo 3 en tant que pilier central de la stratégie clarifiée d’abonnement à l’IA à deux niveaux de Google. Cette structure crée une distinction claire entre le forfait AI Pro grand public à 19,99 $/mois, destiné à l'exploration créative générale, et le forfait AI Ultra haut de gamme à 249,99 $/mois pour les professionnels.

Apprendre encore plus:Cloudflare lance le paiement par exploration, permettant aux éditeurs de facturer l'IA pour le contenu

Josh Woodward, vice-président de Google Labs, a précédemment présenté l'offre premium comme une expérience exclusive, déclarant que "vous pouvez considérer ce plan Ultra comme votre pass VIP pour Google AI". L’API offre désormais une troisième voie distincte pour accéder à la technologie, destinée directement à l’intégration commerciale plutôt qu’à l’utilisation individuelle.

Cette version permet à Google de rivaliser plus directement avec des concurrents comme OpenAI dans la course cruciale visant à fournir des modèles d'IA fondamentaux aux développeurs et aux entreprises. En fixant un prix sur son modèle vidéo le plus avancé, Google affiche clairement ses ambitions commerciales sur le marché de l’IA générative.

Pour répondre aux inévitables préoccupations concernant les utilisations abusives et les deepfakes, toutes les vidéos générées via l'API incluront un filigrane numérique SynthID. Il s’agit d’un élément essentiel de l’engagement déclaré de Google en faveur du développement responsable de l’IA et de la transparence des médias générés par l’IA. Toutefois, cette technologie n’est pas une solution miracle, carétudes universitairesont noté que les filigranes ne sont pas infaillibles.

En fin de compte, l’API ouvre de nouvelles voies puissantes aux créateurs. En tant que cinéaste Darren AronofskycommentéSur le potentiel de ces outils, « le moment est venu d’explorer ces nouveaux outils et de les façonner pour l’avenir de la narration ».

Related Posts