OpenAI приносить опцію пошуку голосу та зображень для чатгпта

OpenAI завжди придумав великі вдосконалення в його революційному чат -чат. Цього разу це голосова функція, яка була надана чату, щоб дозволити користувачам змогти підказати їх голос. Майбутнє оновлення Chatgpt дозволить користувачам вибрати голос і легко надати оперативні Chatgpt через нього.

OpenAI не залишає жодного каменю, коли справа стосується того, щоб Чатгпт постійно підтримував своє чудове місце у світі штучного інтелекту. Раніше користувачі могли надати підказку лише чату AI за допомогою тексту, але тепер можна надати швидкі підказки через голосові, а також зображення.

Як каже OpenAi, "Chatgpt тепер може бачити, чути і говорити”, Чатбот AI зможе ефективно відповісти на ваші підказки, надіслані через зображення чи голосові нотатки. Незалежно від того, чи надсилаєте ви зображення обведеної математичної проблеми або хочете обговорити прекрасне видовище, яке ви щойно були свідками повернення додому через голосову розмову, ви можете все це зробити!

Chatgpt миттєво відповість на ваші підказки, розмовляючи з вами, змушуючи вас відчути, що ви ведете справжню розмову про телефонний дзвінок з другом. Це прекрасний спосіб спілкуватися з чатом.

Оновлення почало впроваджувати для користувачів у всьому світі. Офіційна публікація в блозі OpenAI згадувала: "Ми розгортаємо голос та зображення в Chatgpt для користувачів плюс та підприємства протягом наступних двох тижнів. Голос надходить на iOS та Android (Opt-In у ваших налаштуваннях), а зображення будуть доступні на всіх платформах ».

Щоб отримати доступ до нової функції Voice, потрібно буде перейти до налаштувань програми та натиснути на нові функції. Потім шукайте кнопку навушників на верхньому правому куті. Буде п’ять голосових варіантів, і вам потрібно буде вибрати один бажаний варіант.

OpenAi пояснив, що голосова функція працює від моделі тексту-мовлення. У публікації в блозі вони згадували: «Ми співпрацювали з професійними голосовими акторами, щоб створити кожен з голосів. Ми також використовуємо Шепіт, нашу систему розпізнавання мови з відкритим кодом, щоб переписати ваші розмовні слова в текст ».

Тим часом функція зображення працює відМультимодальні моделі GPT-3,5 та GPT-4. Розуміння зображень через навички міркувань цих моделей дозволяє чату, щоб зрозуміти величезний спектр зображень, включаючи текстові документи, скріншоти та фотографії камери.

Завдяки функції Voice, Chatgpt наближається до інших помічників голосу AI, таких як Amazon Alexa, Apple Siri та інші. Ці можливості покращать досвід користувачів та дозволять користувачам користуватися Chatgpt частіше, більш широко та ефективніше.

Related Posts