Openai heeft altijd grote verbeteringen bedacht in zijn revolutionaire chatbot chatgpt. Deze keer is het de spraakfunctie die aan de chatbot is verleend om gebruikers in staat te stellen hun stem te kunnen aanzetten. Met de komende update van ChatGPT kan gebruikers een stem kiezen en de prompt gemakkelijk geven aan chatgpt erdoorheen.
Openai laat geen steen ongemoeid als het gaat om ervoor te zorgen dat Chatgpt voortdurend zijn superieure plek in de kunstmatige intelligentiewereld onderhoudt. Eerder konden gebruikers de AI -chatbot alleen de prompt geven met behulp van tekst, maar nu kan men snelle aanwijzingen geven via spraak en afbeeldingen.
Zoals Openai zegt: "Chatgpt kan nu zien, horen en spreken”De AI -chatbot kan effectief reageren op uw prompts die zijn verzonden via afbeeldingen of spraaknotities. Of u nu een afbeelding van een omcirkeld wiskundeprobleem verzendt of een prachtig gezicht wilt bespreken dat u zojuist hebt gezien op weg naar huis door spraakgesprek, u kunt het allemaal doen!
De chatgpt zal onmiddellijk op uw prompts reageren door terug te praten met u, waardoor u het gevoel hebt dat u een echt telefoongesprek met een vriend hebt. Dit is een geweldige manier om met de chatbot om te gaan.
De update is begonnen met uitrollen voor de gebruikers wereldwijd. Openai's officiële blogpost vermeldde: “We worden de komende twee weken stem- en afbeeldingen uitrollen in Chatgpt naar Plus en Enterprise -gebruikers. Voice komt op iOS en Android (opt-in in uw instellingen) en afbeeldingen zijn beschikbaar op alle platforms. ”
Om toegang te krijgen tot de nieuwe spraakfunctie, moet men naar de app -instellingen gaan en op nieuwe functies klikken. Zoek vervolgens naar de koptelefoonknop in de rechteronderhoek. Er zijn vijf spraakopties en u moet uw voorkeursoptie kiezen.
OpenAI heeft uitgelegd dat de spraakfunctie wordt aangedreven door een tekst-naar-spraakmodel. In de blogpost zeiden ze: “We hebben samengewerkt met professionele stemacteurs om elk van de stemmen te maken. We gebruiken ook Whisper, ons open-source spraakherkenningssysteem, om uw gesproken woorden in tekst te transcriberen ”.
Ondertussen wordt de afbeeldingsfunctie aangedreven doorMultimodale GPT-3.5- en GPT-4-modellen. Image -begrip via de taalvaardigheden van deze modellen stelt de chatbot in staat om een breed scala aan afbeeldingen te begrijpen, waaronder tekstdocumenten, screenshots en camerapoto's.
Met de stemfunctie komt Chatgpt een beetje dichter bij de andere AI -stemassistenten zoals Amazon Alexa, Apple's Siri en anderen. Deze mogelijkheden zullen de gebruikerservaring verbeteren en de gebruikers in staat stellen om chatgpt vaker, breder en effectiever te gebruiken.