OpenAI biedt een stem- en beeldzoekoptie voor ChatGPT

OpenAI heeft altijd grote verbeteringen aangebracht in zijn revolutionaire chatbot ChatGPT. Deze keer is het de stemfunctie die aan de chatbot is toegekend, zodat gebruikers met hun stem kunnen vragen. Met de komende update van ChatGPT kunnen gebruikers een stem kiezen en daarmee eenvoudig de prompt aan ChatGPT geven.

OpenAI laat geen middel onbeproefd als het erom gaat ervoor te zorgen dat ChatGPT voortdurend zijn superieure positie in de wereld van kunstmatige intelligentie behoudt. Eerder konden gebruikers de AI-chatbot alleen via tekst een prompt geven, maar nu kunnen gebruikers zowel via spraak als via afbeeldingen snelle prompts geven.

Zoals OpenAI zegt: “ChatGPT kan nu zien, horen en spreken", de AI-chatbot kan effectief reageren op uw aanwijzingen die via afbeeldingen of spraaknotities worden verzonden. Of u nu een afbeelding van een omcirkeld wiskundeprobleem instuurt of via een spraakgesprek een prachtig schouwspel wilt bespreken dat u zojuist op weg naar huis hebt gezien, u kunt het allemaal!

De ChatGPT reageert onmiddellijk op uw aanwijzingen door met u terug te praten, waardoor u het gevoel krijgt dat u een echt telefoongesprek voert met een vriend. Dit is een geweldige manier om met de chatbot in contact te komen.

De update is wereldwijd voor gebruikers uitgerold. In de officiële blogpost van OpenAI stond: "We rollen de komende twee weken spraak en afbeeldingen in ChatGPT uit naar Plus- en Enterprise-gebruikers. Stem komt op iOS en Android (opt-in in uw instellingen) en afbeeldingen zullen beschikbaar zijn op alle platforms."

Om toegang te krijgen tot de nieuwe spraakfunctie, moet je naar de app-instellingen gaan en op Nieuwe functies klikken. Zoek vervolgens naar de koptelefoonknop in de rechterbovenhoek. Er zijn vijf stemopties en u moet uw enige voorkeursoptie kiezen.

OpenAI legde uit dat de spraakfunctie wordt aangedreven door een tekst-naar-spraak-model. In de blogpost vermeldden ze: "We hebben samengewerkt met professionele stemacteurs om elk van de stemmen te creëren. We gebruiken ook Whisper, ons open-source spraakherkenningssysteem, om uw gesproken woorden in tekst om te zetten".

Ondertussen wordt de afbeeldingsfunctie mogelijk gemaakt doormultimodale GPT-3.5- en GPT-4-modellen. Door het begrijpen van beelden via de taal-redeneervaardigheden van deze modellen kan de chatbot een breed scala aan afbeeldingen begrijpen, waaronder tekstdocumenten, schermafbeeldingen en camerafoto's.

Met de stemfunctie komt ChatGPT een beetje dichter bij de andere AI-stemassistenten zoals Amazon Alexa, Apple's Siri en anderen. Deze mogelijkheden zullen de gebruikerservaring verbeteren en de gebruikers in staat stellen ChatGPT vaker, breder en effectiever te gebruiken.

Related Posts