OpenAI traz uma opção de pesquisa de voz e imagem para chatgpt

O Openai sempre criou grandes melhorias em seu revolucionário Chatbot ChatGPT. Desta vez, é o recurso de voz que foi concedido ao chatbot por permitir que os usuários possam solicitar o uso de sua voz. A próxima atualização do ChatGPT permitirá que os usuários escolham uma voz e forneçam facilmente o prompt para conversar com ele.

O Openai não deixa pedra sobre pedra quando se trata de garantir que o Chatgpt mantenha constantemente seu ponto superior no mundo da inteligência artificial. Anteriormente, os usuários só podiam fornecer o prompt ao chatbot da IA ​​usando o texto, mas agora, é possível fornecer instruções rápidas através da voz e das imagens.

Como diz o Openai, “Chatgpt agora pode ver, ouvir e falar”, O AI Chatbot poderá responder efetivamente às suas solicitações enviadas por imagens ou notas de voz. Se você envia uma imagem de um problema de matemática circulante ou deseja discutir uma bela visão que você acabou de testemunhar no caminho de volta para casa através da conversa por voz, você pode fazer tudo!

O ChatGPT responderá instantaneamente às suas instruções conversando com você fazendo você sentir que está tendo uma conversa de telefone real com um amigo. Esta é uma ótima maneira de se envolver com o chatbot.

A atualização começou a ser lançada para os usuários globalmente. O post oficial do OpenAI mencionou: “Estamos lançando voz e imagens no Chatgpt para Plus e usuários corporativos nas próximas duas semanas. A voz está chegando no iOS e no Android (optar em suas configurações) e as imagens estarão disponíveis em todas as plataformas. ”

Para acessar o novo recurso de voz, é necessário acessar as configurações do aplicativo e clicar em novos recursos. Em seguida, procure o botão de fone de ouvido no canto superior direito. Haverá cinco opções de voz e você precisará escolher sua única opção preferida.

O OpenAI explicou que o recurso de voz é alimentado por um modelo de texto em fala. Na postagem do blog, eles mencionaram: “Colaboramos com atores de dubladores profissionais para criar cada uma das vozes. Também usamos o Whisper, nosso sistema de reconhecimento de fala de código aberto, para transcrever suas palavras faladas para o texto ”.

Enquanto isso, o recurso de imagem é alimentado porModelos multimodais GPT-3.5 e GPT-4. O entendimento da imagem através das habilidades de raciocínio de idiomas desses modelos permite que o chatbot compreenda uma vasta gama de imagens, incluindo documentos de texto, capturas de tela e fotografias de câmera.

Com o recurso de voz, o ChatGpt chega um pouco mais perto dos outros assistentes de voz da IA, como Amazon Alexa, Siri da Apple e outros. Esses recursos aprimorarão a experiência do usuário e permitirão que os usuários usem o ChatGPT com mais frequência, mais amplamente e mais eficiência.

Related Posts