Google spouští Veo 3 API pro vývojáře za 0,75 $ za sekundu

Google uvolnil vývojářům svůj nejpokročilejší AI video generátor, Veo 3, a dnes spustil placenou ukázku prostřednictvím Gemini API a Vertex AI. Tento krok, který oceňuje 720p video se synchronizovaným zvukem na 0,75 $ za sekundu, je významným krokem ve strategii společnosti Google zpeněžit své výkonné kreativní nástroje.

To umožňuje vývojářům integrovat model, který generuje video s vysokým rozlišením, dialogy a zvukové efekty z jediné výzvy, přímo do jejich vlastních aplikací. Vydání API následuje po rychlé sérii aktualizací, které nedávno přinesly funkce pro přenos obrazu do videa a globální přístup předplatitelům AI společnosti Google.

Od spotřebitelské aplikace po vývojáře API

Thenový přístup pro vývojářeje kritickým rozšířením pro model, který byl až dosud primárně určen pro spotřebitele. Rozhraní API v současné době podporuje generování textu na video, přičemž Google slibuje, že možnosti převodu obrázků na video jsou na cestě. Pro budoucí vydání API je naplánován také rychlejší a cenově výhodnější režim „Veo 3 Fast“.

Hlavní síla modelu spočívá v jeho schopnosti vytvářet soudržné a realistické výstupy. Viceprezident Google DeepMind Eli Collins poznamenal, že „Veo 3 vyniká od textových a obrazových výzev po reálnou fyziku a přesnou synchronizaci rtů.“ Tato schopnost byla klíčovou součástí počátečního odhalení, přičemž generální ředitel Demis Hassabis prohlásil, že s touto technologií „vycházíme z tiché éry generování videa“.

Abychom vývojářům pomohli začít, poskytuje Google šablonu SDK a startovací aplikacirychlé prototypování v Google AI Studio. To umožňuje rychlé experimentování, než se pustíte do úplné integrace, což je zásadní krok vzhledem k nákladům založeným na použití.

Rané experimenty: Od 3D animace po herní kinematografii

Aby Google demonstroval praktickou hodnotu API nad rámec jednoduchých technologických ukázek, zdůrazňuje, jak první partneři používají Veo 3 kbrainstormujte obsah, rychle jej opakujte a zlepšujte efektivitu. Tyto počáteční příklady ukazují na vysoce specializované, profesionální pracovní postupy, kde lze náklady modelu ospravedlnit úsporou času a kreativním zrychlením.

Například,animační společnost Cartwheelvyvinula systém, který převádí 2D video lidského pohybu do 3D animace připravené pro produkci. Společnost používá Veo 3 ke generování realistických a plynulých lidských akcí, které slouží jako základní data pro její potrubí a mění výstup AI na zmanipulované animace postav pro klienty.

Podobně,herní studio Volleyvyužívá model kvytvářet in-game video cutscénykteré posouvají příběh ve svém nadcházejícím RPG Wit’s End. To umožňuje jeho designérům rychle experimentovat s novými narativními nápady a vizuálními prvky, což je klíčová výhoda v iterativním cyklu vývoje her.

Tyto pečlivě vybrané případy použití jsou zvláště specializované, což může naznačovat, že větší, více mainstreamové integrace ještě nejsou připraveny na veřejné oznámení. Toto je běžná strategie pro zavádění výkonných, ale drahých nových technologií se zaměřením nejprve na specializovaná odvětví, která mohou okamžitě absorbovat náklady.

Cenová struktura podtrhuje toto profesionální zaměření. PodleOficiální sazby Google, osmisekundový klip stojí 6 $, zatímco pětiminutové video vyjde na 225 $. Protože generování dokonalého výsledku často vyžaduje více pokusů, reálné náklady mohou rychle eskalovat.

Jak poukazuje jedna analýza, vytvoření pěti minut použitelného záznamu může vyžadovat vygenerování desetinásobku tohoto množství, což potenciálně tlačí celkové náklady k 2 250 USD. Google sází na to, že pro určité případy použití je to stále výrazně levnější než tradiční metody produkce videa.

Poslední kus širší strategie umělé inteligence

Toto spuštění API je vyvrcholením měsíce agresivního zavádění Veo 3, které jej přeměňuje ze slibného nového modelu na mnohostranný produkt. Přístup pro vývojáře následuje po globálním vydání modelu pro předplatitele AI Pro na začátku července a po přidání funkcí pro převod obrazu do videa teprve minulý týden.

Tento krok upevňuje pozici Veo 3 jako ústředního pilíře vyjasněné dvouúrovňové strategie předplatného AI společnosti Google. Tato struktura vytváří jasný rozdíl mezi běžným plánem AI Pro za 19,99 $ měsíčně, zaměřeným na obecný kreativní průzkum, a špičkovým plánem AI Ultra za 249,99 $ měsíčně pro profesionály.

Další informace:Cloudflare spouští platbu za procházení a umožňuje vydavatelům účtovat AI za obsah

Viceprezident Google Labs Josh Woodward dříve označil prémiovou nabídku za exkluzivní zážitek a uvedl, že „tento plán Ultra můžete považovat za svůj VIP průkaz pro umělou inteligenci Google.“ API nyní poskytuje třetí, odlišnou cestu pro přístup k technologii, která je zaměřena přímo na komerční integraci spíše než na individuální použití.

Toto vydání umožňuje Googlu přímo konkurovat konkurentům, jako je OpenAI, v klíčovém závodě o poskytování základních modelů umělé inteligence vývojářům a podnikům. Umístěním cenovky na svůj nejpokročilejší model videa dává Google jasné prohlášení o svých komerčních ambicích na trhu generativní umělé inteligence.

Abychom vyřešili nevyhnutelné obavy ze zneužití a deepfakes, budou všechna videa generovaná prostřednictvím API obsahovat digitální vodoznak SynthID. Jedná se o hlavní část deklarovaného závazku společnosti Google k zodpovědnému vývoji umělé inteligence a poskytování transparentnosti médiím generovaným umělou inteligencí. Nicméně, technologie není stříbrná kulka, jakakademických studiípoznamenali, že vodoznaky nejsou spolehlivé.

V konečném důsledku otevírá API pro tvůrce mocné nové cesty. Jako filmař Darren Aronofskykomentovalo potenciálu těchto nástrojů, „nyní je čas prozkoumat tyto nové nástroje a utvářet je pro budoucnost vyprávění příběhů“.

Related Posts