Az Openai hang- és képkeresési lehetőséget hoz a chatgpt számára

Az Openai mindig is jelentős fejlesztéseket eredményezett a forradalmi chatbot chatgpt -ben. Ezúttal ez a hangjellemző, amelyet a chatbotnak adtak, amely lehetővé teszi a felhasználók számára, hogy felszólítsák a hangjuk használatát. A CHATGPT közelgő frissítése lehetővé teszi a felhasználók számára, hogy egy hangot válasszanak, és könnyen megadják a ChatGPT -t.

Az Openai nem hagy megfordíthatatlan követ, amikor biztosítja, hogy a Chatgpt folyamatosan fenntartsa kiváló helyét a mesterséges intelligencia világában. Korábban a felhasználók csak az AI chatbotot adhatták meg a szöveg segítségével, de most a hangon és a képeken keresztül gyors kéréseket lehet biztosítani.

Ahogy az Openai mondja, „A chatgpt most már láthatja, hallani és beszélni”Az AI chatbot képes lesz hatékonyan reagálni a képek vagy hangjegyek útján küldött utasításaira. Függetlenül attól, hogy elküld egy körözött matematikai problémát, vagy meg akar beszélni egy gyönyörű látványt, amelyben csak a hangos beszélgetésen keresztül tanúja volt a hazafelé, megteheti mindent!

A CHATGPT azonnal válaszol a felszólításokra, ha beszélsz veled, és úgy érzi, hogy tényleges telefonhívási beszélgetést folytat egy barátjával. Ez egy nagyszerű módja annak, hogy kapcsolatba lépjünk a chatbotdal.

A frissítés világszerte megkezdte a felhasználók számára. Az Openai hivatalos blogbejegyzése megemlítette: „A Chatgpt -ben a hangot és a képeket a Plus and Enterprise felhasználók számára készítjük a következő két hétben. A hang az iOS-on és az Androidon érkezik (opt-in a beállításokban), és a képek minden platformon elérhetők lesznek. ”

Az új hang funkció eléréséhez az alkalmazás beállításaira kell lépnie, és kattintson az új funkciókra. Ezután keresse meg a fejhallgató gombot a jobb felső sarokban. Öt hangopció lesz, és Önnek ki kell választania az egy preferált lehetőséget.

Az Openai elmagyarázta, hogy a hangjellemzőt egy szöveg-beszéd modell hajtja. A blogbejegyzésben megemlítették: „Együttműködtünk a professzionális hangszereplőkkel az egyes hangok létrehozása érdekében. A Whisper, a nyílt forrású beszédfelismerő rendszerünket is használjuk, hogy átírjuk a beszélt szavait szövegbe ”.

Eközben a kép funkcióját a tápláljaMultimodális GPT-3.5 és GPT-4 modellek- A kép megértése ezen modellek nyelvi érvelési képességein keresztül lehetővé teszi a chatbot számára, hogy megértse a képek széles skáláját, beleértve a szöveges dokumentumokat, a képernyőképeket és a fényképezőgépfotókat.

A hangjellemzővel a Chatgpt kissé közelebb kerül a többi AI hangsegédhez, mint például az Amazon Alexa, az Apple Siri és mások. Ezek a képességek javítják a felhasználói élményt, és lehetővé teszik a felhasználók számára, hogy gyakrabban, szélesebb körben és hatékonyabban használják a CHATGPT -t.

Related Posts