OpenAI анонсировала новую ИИ-модель GPT-4o
OpenAI анонсировала мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o. Новая модель может анализировать звук, изображение и текст в режиме реального времени, указано на сайте американской компании.
В компании собираются внедрить новую ИИ-модель в свои продукты в течение ближайших недель.
Символ «о» в названии ИИ-модели означает omni и переводится как «всесторонний». Как утверждают в компании, он указывает на мультимодальность GPT-4o. У новой ИИ-модели имеется интеллект уровня GPT-4, улучшенные возможности по работе с изображениями и текстом, а также с аудио и голосом. GPT-4o обладает контекстным окном из 128 тыс. токенов.
OpenAI уверена, что GPT-4o значительно улучшит работу чат-бота ChatGPT. Новая модель направлена на более глубокое взаимодействие с чат-ботом как с помощником, например его можно будет прервать во время ответа. GPT-4o может улавливать эмоции в голосе пользователя и реагировать на это в режиме реального времени. Помимо этого, с помощью новой модели улучшатся и визуальные возможности ChatGPT, а в дальнейшем чат-бот сможет смотреть спортивную игру в прямом эфире и объяснять правила.
GPT-4o доступна как в платной, так и в бесплатной версии чат-бота. Платные подписчики ChatGPT Plus и Team смогут отправить в пять раз больше сообщений, чем бесплатные пользователи. При превышении лимита бесплатные пользователи перейдут на GPT-3.5, а платные — на GPT-4.
Бесплатные пользователи также получат доступ к поиску информации в интернете, созданию графиков, анализу данных, работе с файлами и изображениями, а также возможность запоминать предыдущие взаимодействия с пользователем. Кроме того, будет доступен GPT Store.
Напомним, ранее OpenAI представила новую нейросеть Voice Engine, которая может по отрывку голоса в 15 секунд скопировать его и озвучить написанный текст.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.