OpenAI ger ett röst- och bildsökningsalternativ för chatgpt

OpenAI har alltid kommit med stora förbättringar i sin revolutionära chatbot chatgpt. Den här gången är det röstfunktionen som har beviljats chatbot för att göra det möjligt för användare att kunna uppmana med sin röst. Den kommande uppdateringen av Chatgpt gör det möjligt för användare att välja en röst och enkelt ge uppmaningen att chatgpt genom den.

Openai lämnar ingen sten omvänd när det gäller att säkerställa att chatgpt ständigt upprätthåller sin överlägsna plats i den konstgjorda intelligensvärlden. Tidigare kunde användare bara ge prompten till AI Chatbot med text men nu kan man ge snabba instruktioner genom såväl röst som bilder.

Som Openai säger: ”Chatgpt kan nu se, höra och tala”, AI Chatbot kommer att kunna svara effektivt på dina instruktioner som skickas genom bilder eller röstanteckningar. Oavsett om du skickar in en bild av ett cirkulerat matematikproblem eller vill diskutera en vacker syn som du just sett på väg hem genom röstsamtal, kan du göra allt!

Chatgpt kommer omedelbart att svara på dina instruktioner genom att prata tillbaka med dig så att du känner att du har en verklig telefonsamtal med en vän. Detta är ett bra sätt att engagera sig i chatboten.

Uppdateringen har börjat rulla ut för användarna globalt. Openais officiella blogginlägg nämnde: ”Vi rullar ut röst och bilder i Chatgpt till Plus och Enterprise -användare under de kommande två veckorna. Röst kommer på iOS och Android (opt-in i dina inställningar) och bilder kommer att finnas tillgängliga på alla plattformar. ”

För att komma åt den nya röstfunktionen måste man gå till appinställningarna och klicka på nya funktioner. Leta sedan efter hörlurknappen i det övre högra hörnet. Det kommer att finnas fem röstalternativ och du kommer att behöva välja ditt enda föredragna alternativ.

OpenAI förklarade att röstfunktionen drivs av en text-till-tal-modell. I blogginlägget nämnde de: ”Vi samarbetade med professionella röstskådespelare för att skapa var och en av rösterna. Vi använder också Whisper, vårt öppna källkodssystem, för att transkribera dina talade ord till text ”.

Under tiden drivs bildfunktionen avMultimodal GPT-3.5 och GPT-4-modeller. Bildförståelse genom dessa modellernas språkresonesfärdigheter gör det möjligt för Chatbot att förstå ett stort utbud av bilder inklusive textdokument, skärmdumpar och kamerafotografier.

Med röstfunktionen kommer Chatgpt lite närmare de andra AI -röstassistenterna som Amazon Alexa, Apples Siri och andra. Dessa funktioner kommer att förbättra användarupplevelsen och gör att användarna kan använda chatgpt oftare, mer allmänt och mer effektivt.

Related Posts