Az Adobe Firefly új mesterséges intelligencia eszköze hangeffektusokat generál hangból és szövegből

Az Adobe kibővítette Firefly generatív mesterséges intelligencia platformját egy új „Hangeffektusok generálása” eszközzel, amely július 17-én lépett bétaverzióba. A funkció aFirefly webalkalmazás, lehetővé teszi az alkotók számára, hogy szöveges promptokból egyéni hangot állítsanak elő.

Egyedülálló megközelítésben az eszköz azt is lehetővé teszi a felhasználók számára, hogy rögzítsék saját hangjukat – olyan hangokat adva, mint a „whhoosh” vagy „clip-clop” –, hogy irányítsa az AI-t az effektusok létrehozásában meghatározott időzítéssel és intenzitással. Ez a bevezetés az Adobe átfogóbb stratégiájának része, amely egy teljes, kereskedelmi szempontból biztonságos eszköztár létrehozására irányul.

A „Hangeffektusok generálása” eszköz fokozza a versenyt a mesterséges intelligencia hangalkotásának uralására irányuló versenyben, szembeállítva az Adobe-t olyan riválisokkal, mint a Meta, az ElevenLabs, a Stability AI és az NVIDIA.

A „Whosh”-tól a Soundscape-ig: A hanggenerálás új módja

2025. július 17-én bejelentették aúj Hangeffektusok generálása eszközjelentős előrelépést jelent az intuitív tartalomkészítés terén. Ahelyett, hogy pusztán a szövegre hagyatkoznának, az alkotók most vokális jelzésekkel alakíthatják ki a végső hangkimenetet. Ezt a hangvezérelt felszólítást először csúfoltákAz Adobe Project Super Sonic kísérlete.

További információ:Keltse életre ötleteit mobileszközön az Adobe Firefly generatív eszközeivel

A rendszer elemzi a felhasználó felvételének ütemét és ritmusát, hogy a hangeffektusokat pontosan oda helyezze el a videó idővonalán, ahol azok tartoznak. Ennek az innovatív munkafolyamatnak az a célja, hogy áthidalja a szakadékot az alkotó szándéka és az AI értelmezése között, ami a generatív eszközök közös súrlódási pontja.

Beyond Sound: Firefly kiterjesztett videó- és partnereszközkészlete

Ez az audiogenerátor csak egy darabja a Firefly videoképességeinek nagyobb frissítésének. Az Adobe bemutatta a „Composition Reference” funkciót is, amely lehetővé teszi a felhasználók számára, hogy referenciavideót töltsenek fel, hogy tükrözzék annak összetételét egy új, mesterséges intelligencia által generált klipben. Ezáltal az alkotók jobban irányíthatják a felvételek megkomponálását és konzisztenciáját.

A frissítés tartalmazza a „Stílus-előbeállításokat” is, amelyek segítségével egyetlen kattintással alkalmazhat olyan vizuális stílusokat, mint például az agyagozás vagy az anime, valamint a „Kulcskép kivágása” a szerkesztési munkafolyamatok egyszerűsítésére. A méretezhető tartalom iránti növekvő keresletre rábólintva az Adobe elindította a „Text to Avatar (béta)” nevű programot is, amely a forgatókönyveket digitális műsorvezető által vezetett videókká alakítja.

Ökoszisztémáját tovább bővítve, az Adobe harmadik féltől származó mesterséges intelligencia modelleket integrál a Firefly-be olyan partnerektől, mint a Runway, a Google, a Pika és a Luma AI. Az Adobe Generative AI vezetője, Alexandru Costin azt javasolta, hogy „hasonló vezérlők és előbeállítások a jövőben elérhetők lesznek harmadik féltől származó mesterséges intelligencia modellekhez”, jelezve a jövőt, ahol a Firefly a különféle generatív technológiák központi központjaként működik.

Navigálás a zsúfolt és vitás AI-audio piacon

Az Adobe belépése a mesterséges intelligencia hanggenerálásába kiélezett versenyhelyzetbe helyezi. Az ElevenLabs még 2024 júniusában elindította saját hangeffektus-eszközét, hangsúlyozva az etikus forrásból származó adatok felhasználását a Shutterstockkal kötött partnerség révén.

Eközben a Stability AI és az Arm 2025 májusában kiadott egy nyílt forráskódú, eszközön található modellt, amely a szerzői jogi viták elkerülése érdekében a jogdíjmentes hangra összpontosít. A Meta 2023-ban elindította az AudioCraftot, egy generatív mesterséges intelligencia platformot, amely lehetővé teszi a felhasználók számára, hogy néhány kattintással eredeti zenét és audiotartalmakat hozzanak létre.

Az ipar azonban továbbra is óvatos. Az NVIDIA 2024 novemberében mutatta be fejlett Fugatto modelljét, de etikai aggályai miatt visszatartotta a nyilvánosságra hozatalát. Bryan Catanzaro, az Nvidia alelnöke,– mondta a Reutersnekakkoriban „bármilyen generatív technológia mindig rejt magában bizonyos kockázatokat, mert az emberek felhasználhatják azt olyan dolgok létrehozására, amelyeket mi jobban szeretnénk, ha nem” – hangsúlyozva a visszaélések kockázatát. Ez az óvatos hozzáállás tükrözi azokat a jogi csatákat, amelyekkel más AI-cégek szembesülnek a szerzői jogok megsértése miatt.

Azzal, hogy modelljeit kereskedelmileg biztonságos adatkészletekre építi, és több eszközt egyetlen platformba integrál, az Adobe a Firefly-t megbízható és átfogó megoldásként pozicionálja a kreatív szakemberek számára.