Openai ha sempre escogitato importanti miglioramenti nel suo chatbot rivoluzionario. Questa volta è la funzionalità vocale che è stata concessa al chatbot per consentire agli utenti di essere in grado di chiedere l'utilizzo della propria voce. Il prossimo aggiornamento di CHATGPT consentirà agli utenti di scegliere una voce e di dare facilmente il prompt a Chatgpt.
Openai non lascia nulla di intentato quando si tratta di garantire che GATGPT mantenga costantemente il suo punto superiore nel mondo dell'intelligenza artificiale. In precedenza, gli utenti potevano solo dare il prompt all'IA Chatbot usando il testo, ma ora si possono fornire rapidi istruzioni tramite voce e immagini.
Come dice Openai, "Chatgpt ora può vedere, ascoltare e parlare", L'IA Chatbot sarà in grado di rispondere in modo efficace alle istruzioni inviate tramite immagini o note vocali. Sia che tu invii un'immagine di un problema di matematica cerchiato o che desideri discutere di uno spettacolo bellissimo che hai appena assistito alla via del ritorno a casa attraverso la conversazione vocale, puoi fare tutto!
Il chatgpt risponderà immediatamente ai tuoi suggerimenti parlando con te facendoti sentire come se stessi avendo una vera conversazione per le telefonate con un amico. Questo è un ottimo modo per interagire con il chatbot.
L'aggiornamento è iniziato a lanciare per gli utenti a livello globale. Il post sul blog ufficiale di Openi ha menzionato: "Stiamo lanciando voce e immagini in Chatgpt agli utenti di Plus e Enterprise nelle prossime due settimane. La voce è in arrivo su iOS e Android (opt-in nelle tue impostazioni) e le immagini saranno disponibili su tutte le piattaforme. "
Per accedere alla nuova funzionalità vocale, è necessario andare alle impostazioni dell'app e fare clic su nuove funzionalità. Quindi cerca il pulsante per cuffie nell'angolo in alto a destra. Ci saranno cinque opzioni vocali e ti verrà richiesto di scegliere l'opzione preferita.
Openai ha spiegato che la funzionalità vocale è alimentata da un modello text-to-speech. Nel post del blog, hanno menzionato: “Abbiamo collaborato con i doppiatori professionisti per creare ciascuna delle voci. Usiamo anche Whisper, il nostro sistema di riconoscimento vocale open source, per trascrivere le tue parole pronunciate nel testo ”.
Nel frattempo, la funzione di immagine è alimentata damodelli multimodali GPT-3.5 e GPT-4. La comprensione dell'immagine attraverso le capacità di ragionamento linguistico di questi modelli consente al chatbot di comprendere una vasta gamma di immagini tra cui documenti di testo, schermate e fotografie della fotocamera.
Con la funzione vocale, Chatgpt si avvicina un po 'agli altri assistenti vocali di AI come Amazon Alexa, Siri di Apple e altri. Queste funzionalità miglioreranno l'esperienza dell'utente e consentiranno agli utenti di utilizzare CHATGPT più frequentemente, più ampiamente e più efficacemente.