Openai wprowadza opcję wyszukiwania głosu i obrazu dla Chatgpt

Openai zawsze wymyślił znaczące ulepszenia rewolucyjnego chatbota chatgpt. Tym razem jest to funkcja głosowa, która została przyznana chatbotowi dla umożliwienia użytkownikom monitorowania za pomocą głosu. Nadchodząca aktualizacja CHATGPT pozwoli użytkownikom wybrać głos i łatwe podanie monit o Chatgpt przez niego.

Openai nie pozostawia kamienia obróconego, jeśli chodzi o zapewnienie, że Chatgpt nieustannie utrzymuje swoje lepsze miejsce w świecie sztucznej inteligencji. Wcześniej użytkownicy mogliby tylko podawać monit do chatbota AI za pomocą tekstu, ale teraz można dostarczyć szybkie podpowiedzi poprzez głos i obrazy.

Jak mówi Openai: „Chatgpt może teraz widzieć, słyszeć i mówić”, AI Chatbot będzie mógł skutecznie odpowiedzieć na twoje podpowiedzi wysyłane przez obrazy lub notatki głosowe. Niezależnie od tego, czy wyślesz zdjęcie okrążenia problemu matematycznego, czy chcesz przedyskutować piękny widok, którego właśnie był świadkiem w drodze powrotnej do domu poprzez rozmowę głosową, możesz to wszystko zrobić!

Chatgpt natychmiast zareaguje na twoje monity, rozmawiając z tobą, dzięki czemu czujesz się, jakbyś prowadził faktyczną rozmowę telefoniczną z przyjacielem. To świetny sposób na zaangażowanie się w chatbot.

Aktualizacja zaczęła się rozwijać dla użytkowników na całym świecie. Oficjalny post na blogu Openai wspomniał: „W ciągu najbliższych dwóch tygodni wprowadzamy głos i obrazy w Chatgpt do Plus i Enterprise. Głos nadchodzi na iOS i Android (opt-in w swoich ustawieniach), a obrazy będą dostępne na wszystkich platformach. ”

Aby uzyskać dostęp do nowej funkcji głosowej, trzeba przejść do ustawień aplikacji i kliknąć nowe funkcje. Następnie poszukaj przycisku słuchawkowego w prawym górnym rogu. Będzie pięć opcji głosowych i będziesz musiał wybrać jedną preferowaną opcję.

Openai wyjaśnił, że funkcja głosu jest zasilana modelem tekstu na mowę. W poście na blogu wspomnieli: „Współpracowaliśmy z profesjonalnymi aktorami głosowymi, aby stworzyć każdy z głosów. Używamy również Whispera, naszego systemu rozpoznawania mowy w open source, aby transkrybować twoje słowa do tekstu ”.

Tymczasem funkcja obrazu jest zasilana przezMODZINY MODARZEMU GPT-3.5 i GPT-4. Zrozumienie obrazu za pośrednictwem umiejętności rozumowania językowego tych modeli umożliwia chatbotowi zrozumienie szerokiej gamy obrazów, w tym dokumentów tekstowych, zrzutów ekranu i fotografii aparatu.

Dzięki funkcji głosu Chatgpt zbliża się nieco do innych asystentów głosowych AI, takich jak Amazon Alexa, Siri Apple i inni. Możliwości te zwiększą wrażenia użytkownika i pozwolą użytkownikom częściej, szerzej i skuteczniej korzystać z Chatgpt.

Related Posts