OpenAI bringt eine Option für Sprach- und Bildsuche für ChatGPT

OpenAI hat immer wichtige Verbesserungen in seinem revolutionären Chatbot -Chatgpt vorgestellt. Diesmal ist es die Sprachfunktion, die dem Chatbot für die Ermöglichung von Benutzern erteilt wurde, mithilfe ihrer Stimme formuliert zu werden. Das bevorstehende Update von ChatGPT ermöglicht es den Benutzern, eine Stimme auszuwählen und die Eingabeaufforderung für ChatGPT einfach zu geben.

Openai lässt nichts unversucht, wenn es darum geht, sicherzustellen, dass Chatgpt in der Welt der künstlichen Intelligenz ständig seinen überlegenen Platz beibehält. Früher konnten Benutzer den KI -Chatbot nur über Text geben, aber jetzt kann man schnelle Eingabeaufforderungen sowohl über Voice als auch Bilder liefern.

Wie Openai sagt, “Chatgpt kann jetzt sehen, hören und sprechenDer KI -Chatbot kann effektiv auf Ihre Eingabeaufforderungen reagieren, die durch Bilder oder Sprachnoten gesendet werden. Egal, ob Sie ein Bild eines eingekreisten Mathematikproblems senden oder einen schönen Anblick besprechen möchten, den Sie gerade auf dem Weg nach Hause durch Sprachgespräch gesehen haben, Sie können alles tun!

Der ChatGPT wird sofort auf Ihre Eingabeaufforderungen antworten, indem Sie mit Ihnen zurückgesprochen haben, damit Sie das Gefühl haben, ein tatsächliches Telefongespräch mit einem Freund zu führen. Dies ist eine großartige Möglichkeit, sich mit dem Chatbot zu beschäftigen.

Das Update hat für die Benutzer weltweit begonnen. OpenAIS offizieller Blog -Beitrag erwähnte: „Wir haben in den nächsten zwei Wochen Sprach- und Bilder in Chatgpt zu Plus- und Enterprise -Benutzern aus. Voice kommt auf iOS und Android (Opt-in in Ihre Einstellungen) und Bilder werden auf allen Plattformen verfügbar sein. “

Um auf die neue Sprachfunktion zuzugreifen, muss man zu den App -Einstellungen gehen und auf neue Funktionen klicken. Suchen Sie dann in der oberen rechten Ecke nach dem Kopfhörerknopf. Es gibt fünf Sprachoptionen und Sie müssen Ihre einzige bevorzugte Option auswählen.

OpenAI erklärte, dass das Sprachmerkmal von einem Text-zu-Sprach-Modell angetrieben wird. Im Blog -Beitrag erwähnten sie: „Wir haben mit professionellen Sprachakteuren zusammengearbeitet, um jede der Stimmen zu erstellen. Wir verwenden auch Whisper, unser Open-Source-Spracherkennungssystem, um Ihre gesprochenen Wörter in Text zu transkribieren. “

In der Zwischenzeit wird die Bildfunktion von Strom versorgt vonmultimodale GPT-3,5- und GPT-4-Modelle. Das Bildverständnis durch die Fähigkeiten der Sprachbekämpfung dieser Modelle ermöglicht es dem Chatbot, eine Vielzahl von Bildern zu verstehen, darunter Textdokumente, Screenshots und Kamerafotos.

Mit der Sprachfunktion kommt Chatgpt den anderen AI -Sprachassistenten wie Amazon Alexa, Apples Siri und anderen etwas näher. Diese Funktionen verbessern die Benutzererfahrung und ermöglichen es den Benutzern, ChatGPT häufiger, häufiger und effektiver zu verwenden.

Related Posts