Openai apporte une option de recherche vocale et d'image pour chatppt

OpenAI a toujours trouvé des améliorations majeures dans son chatbot révolutionnaire Chatgpt. Cette fois, c'est la fonction vocale qui a été accordée au chatbot pour permettre aux utilisateurs de pouvoir inviter à utiliser leur voix. La prochaine mise à jour de Chatgpt permettra aux utilisateurs de choisir une voix et de donner facilement l'invite à le chatppt.

Openai ne laisse aucune pierre non retournée lorsqu'il s'agit de garantir que le chatpt maintient constamment sa place supérieure dans le monde de l'intelligence artificielle. Plus tôt, les utilisateurs ne pouvaient donner l'invite au chatbot AI en utilisant du texte, mais maintenant, on peut fournir des invites rapides via la voix ainsi que les images.

Comme le dit Openai, «Chatgpt peut maintenant voir, entendre et parler», Le chatbot AI pourra répondre efficacement à vos invites envoyées via des images ou des notes vocales. Que vous envoyiez une image d'un problème de mathématiques encerclé ou que vous souhaitiez discuter d'une belle vue dont vous venez de rentrer chez vous à travers une conversation vocale, vous pouvez tout faire!

Le Chatgpt répondra instantanément à vos invites en vous parlant avec vous, ce qui vous donne l'impression d'avoir une véritable conversation pour un appel téléphonique avec un ami. C'est un excellent moyen de s'engager avec le chatbot.

La mise à jour a commencé à déployer pour les utilisateurs du monde entier. Le billet de blog officiel d'OpenAI a mentionné: «Nous déployons la voix et les images dans Chatgpt aux utilisateurs de plus et d'entreprise au cours des deux prochaines semaines. La voix arrive sur iOS et Android (opt-in dans vos paramètres) et des images seront disponibles sur toutes les plates-formes. »

Pour accéder à la nouvelle fonctionnalité vocale, il faudra aller aux paramètres de l'application et cliquer sur de nouvelles fonctionnalités. Recherchez ensuite le bouton du casque dans le coin supérieur droit. Il y aura cinq options vocales et vous devrez choisir votre option préférée.

OpenAI a expliqué que la fonction vocale est alimentée par un modèle de texte vocal. Dans le billet de blog, ils ont mentionné: «Nous avons collaboré avec des acteurs de voix professionnels pour créer chacune des voix. Nous utilisons également Whisper, notre système de reconnaissance vocale open source, pour transcrire vos mots prononcés en texte ».

En attendant, la fonction d'image est alimentée parModèles multimodaux GPT-3.5 et GPT-4. La compréhension de l'image à travers les compétences de raisonnement en langue de ces modèles permet au chatbot de comprendre une vaste gamme d'images, notamment des documents texte, des captures d'écran et des photographies de l'appareil photo.

Avec la fonction vocale, Chatgpt se rapproche un peu des autres assistants vocaux de l'IA comme Amazon Alexa, Siri d'Apple et d'autres. Ces capacités amélioreront l'expérience utilisateur et permettront aux utilisateurs d'utiliser Chatgpt plus fréquemment, plus largement et plus efficacement.

Related Posts