OpenAI продовжує розвивати свого чатбота, додаючи йому нові функції. Цього разу компанія, за її власною заявою, дозволила штучному інтелекту “бачити, чути й говорити”, взаємодіючи з користувачем.
Як пише 24, розробники вже почали впроваджувати нові голосові та графічні можливості. Вони дадуть змогу “вести розмову голосом або показувати ChatGPT, про що ви говорите”.
Розробники навели кілька прикладів роботи нових функцій:
- Користувач зможе сфотографувати якусь річ або пам’ятку архітектури й розпитати бота про них або обговорити цікаві деталі.
- Можна буде сфотографувати вміст холодильника і разом з ChatGPT придумати, що приготувати.
- Щоб зосередитися на певній частині зображення, ви можете скористатися інструментом малювання й обвести конкретну ділянку, яку треба аналізувати.
- Розв’язати математичну задачу з підручника, сфотографувавши її та попросивши у ChatGPT підказку.
- Ви можете використовувати голос, щоб вести діалог зі своїм асистентом, як із Siri, Alexa чи Google Асистентом. Наприклад, попросити розказати казку для дитини наніч або попросити озвучити ті чи іншу інформацію.
Голосова функція заснована на новій моделі перетворення тексту в мовлення, яка здатна генерувати звучання, схоже на людське, з тексту і декількох секунд зразка мовлення.
Ми співпрацювали з професійними акторами, щоб створити кожен голос. Ми також використовуємо Whisper, нашу систему розпізнавання мови з відкритим вихідним кодом, щоб перетворити ваші вимовлені слова в текст,
– пишуть розробники.
Протягом наступних двох тижнів нові можливості запустять для користувачів тарифних планів Plus і Enterprise. Голосовий режим з’явиться на iOS та Android, а зображення будуть доступні на всіх платформах.
Читайте: ChatGPT тепер доступний для Android – Україна є серед країн, які можуть завантажити застосунок