OpenAI представила GPT-4o (GPT-4 Omni, або скорочено «O») — модель, яка не обов’язково «розумніша» за GPT-4, але виділяється своєю здатністю обробляти текстові, візуальні та аудіодані одночасно з практично без затримок і неймовірно людський голос. На відміну від інших чат-ботів, які страждають від високої затримки, GPT-4o пропонує швидкі відповіді, створюючи плавну та природну розмову. Він також витончено обробляє переривання та призупиняє відповідь, коли про це говорять.
Низька затримка GPT-4o пояснюється його здатністю обробляти всі три форми введення (текст, зображення та аудіо) одночасно, не покладаючись на окремі моделі. Ця інтеграція дозволяє швидко надавати послідовні відповіді. Технічний директор OpenAI Міра Мураті підкреслила, що GPT-4o зберігає інтелект GPT-4, але працює набагато швидше, покращуючи природні та легкі взаємодії.
Демонстрація продемонструвала голосові можливості Omni, коли бот відповідає невимушено, як у людини, доповнюючи природними паузами та навіть сміхом, створюючи дивовижну людську якість. Однак дозвіл двом версіям бота спілкуватися одна з одною дещо зменшив цю ілюзію, виявивши більш механічну природу. Незважаючи на деякі незручні моменти, такі як координація дуету між ботами, голосові можливості GPT-4o вражають.
Окрім GPT-4o, OpenAI оголосила про випуск настільної програми ChatGPT для macOS, а версія для Windows очікується пізніше цього року. Наразі додаток відкритий для платних користувачів GPT, а безкоштовну версію буде запущено пізніше. Веб-версія ChatGPT вже використовує GPT-4o, і модель буде доступна для безкоштовних користувачів з деякими обмеженнями.
Джерело новини: TechSpot
Posted: FOCUS (Dubai)