OpenAI přináší možnost vyhledávání hlasu a obrázků pro chatgpt

OpenAI vždy přišel s významnými vylepšeními ve svém revolučním chatbot chatgptu. Tentokrát je to hlasová funkce, která byla poskytnuta chatbot, aby umožnila uživatelům schopni vyvolat pomocí svého hlasu. Nadcházející aktualizace ChatGPT umožní uživatelům zvolit hlas a snadno dát výzvu k tomu, aby to Chatgpt.

Openiai nenechává žádný kámen, pokud jde o zajištění toho, aby Chatgpt neustále udržoval své vynikající místo ve světě umělé inteligence. Dříve uživatelé mohli vydat výzvu pouze pro AI Chatbot pomocí textu, ale nyní lze poskytnout rychlé výzvy prostřednictvím hlasu i obrázků.

Jak říká OpenAI, “Chatgpt nyní může vidět, slyšet a mluvit“, AI chatbot bude schopen efektivně reagovat na vaše výzvy odeslané prostřednictvím obrázků nebo hlasových poznámek. Ať už posíláte obrázek zakrouceného matematického problému nebo chcete diskutovat o krásném pohledu, kterého jste právě byli svědky na cestě zpět domů prostřednictvím hlasového rozhovoru, můžete to udělat všechno!

Chatgpt okamžitě reaguje na vaše výzvy tím, že se s vámi povídáte, abyste se cítili, jako byste měli skutečný rozhovor s telefonem s přítelem. To je skvělý způsob, jak se zapojit do chatbota.

Aktualizace se začala rozšiřovat pro uživatele po celém světě. Oficiální blogový příspěvek OpenAI se zmínil: „Během příštích dvou týdnů zavádíme hlas a obrázky v Chatgpt a podnikové uživatele. Voice přichází na iOS a Android (přihlášení do vašeho nastavení) a obrázky budou k dispozici na všech platformách. “

Chcete -li získat přístup k nové funkci hlasu, budete muset přejít na nastavení aplikace a kliknout na nové funkce. Pak vyhledejte tlačítko pro sluchátka v pravém horním rohu. Bude zde pět možností hlasu a budete muset zvolit svou jednu preferovanou možnost.

OpenAI vysvětlil, že hlasová funkce je napájena modelem textu na řeč. V blogovém příspěvku uvedli: „Spolupracovali jsme s profesionálními hlasovými herci na vytvoření každého z hlasů. Používáme také Whisper, náš systém rozpoznávání řeči s otevřeným zdrojovým kódem, k přepisu vašich mluvených slov do textu “.

Mezitím je funkce obrazu napájenaMultimodální modely GPT-3,5 a GPT-4. Porozumění obrázkům prostřednictvím jazykových dovedností těchto modelů umožňuje chatbotovi porozumět velké řadě obrázků včetně textových dokumentů, snímků obrazovek a fotografií z fotoaparátu.

S hlasovou funkcí se Chatgpt trochu blíží ostatním hlasovým asistentům AI, jako je Amazon Alexa, Apple's Siri a další. Tyto schopnosti zlepší uživatelský zážitek a umožní uživatelům používat chatgpt častěji, široce a efektivněji.

Related Posts