OpenAI анонсировала новую ИИ-модель GPT-4o

14 мая 2024, Инна Горбачева | 👁 22141

OpenAI анонсировала новую ИИ-модель GPT-4o

OpenAI анонсировала мультимодальную модель генеративного искусственного интеллекта (ИИ) GPT-4o. Новая модель может анализировать звук, изображение и текст в режиме реального времени, указано на сайте американской компании.

«GPT-4o - это шаг к более естественному взаимодействию человека и компьютера. Он принимает на вход любую комбинацию текста, звука и изображения и генерирует на выходе любую комбинацию текста, звука и изображения», - указано на сайте OpenAI.

В компании собираются внедрить новую ИИ-модель в свои продукты в течение ближайших недель.

Символ «о» в названии ИИ-модели означает omni и переводится как «всесторонний». Как утверждают в компании, он указывает на мультимодальность GPT-4o. У новой ИИ-модели имеется интеллект уровня GPT-4, улучшенные возможности по работе с изображениями и текстом, а также с аудио и голосом. GPT-4o обладает контекстным окном из 128 тыс. токенов.

OpenAI уверена, что GPT-4o значительно улучшит работу чат-бота ChatGPT. Новая модель направлена на более глубокое взаимодействие с чат-ботом как с помощником, например его можно будет прервать во время ответа. GPT-4o может улавливать эмоции в голосе пользователя и реагировать на это в режиме реального времени. Помимо этого, с помощью новой модели улучшатся и визуальные возможности ChatGPT, а в дальнейшем чат-бот сможет смотреть спортивную игру в прямом эфире и объяснять правила.

GPT-4o доступна как в платной, так и в бесплатной версии чат-бота. Платные подписчики ChatGPT Plus и Team смогут отправить в пять раз больше сообщений, чем бесплатные пользователи. При превышении лимита бесплатные пользователи перейдут на GPT-3.5, а платные — на GPT-4.

Бесплатные пользователи также получат доступ к поиску информации в интернете, созданию графиков, анализу данных, работе с файлами и изображениями, а также возможность запоминать предыдущие взаимодействия с пользователем. Кроме того, будет доступен GPT Store.

Напомним, ранее OpenAI представила новую нейросеть Voice Engine, которая может по отрывку голоса в 15 секунд скопировать его и озвучить написанный текст.

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.

Комментарии 0

Зарегистрируйтесь или , чтобы оставлять комментарии.