«Яндекс» представил нейросеть YandexART для бизнес-задач и творчества
«Яндекс» представил новую нейросеть Yandex AI Rendering Technology (YandexART), которая формирует изображения и анимацию в ответ на текстовые запросы пользователей, а также помогает в работе при создании рекламных объявлений в «Яндекс Бизнесе», сообщает компания.
ИИ формирует изображения и анимацию методом каскадной диффузии, то есть сначала генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями. Поколение диффузионной модели используемое в YandexART создаёт более реалистичную и детализированную графику, по сравнению с той, которая используется в «Шедевруме». По итогам внутренней оценки асессоров «Яндекса» её результаты лучше в 60% случаев.
Для усовершенствования эффективности работы нейросети, компания увеличила объем обучающего набора данных на полтора раза, достигнув 330 миллионов изображений с соответствующими текстовыми описаниями. Отбор подходящих изображений для обучения YandexART осуществляется при помощи трех уровней фильтрации. Согласно утверждениям компании, новый алгоритм распознавания текста значительно повышает понимание потребностей пользователей.
Кроме того, нейросеть теперь более детально анализирует особенности лиц, глаз и рук, что позволяет ей создавать фотореалистичные портреты. С целью улучшения качества генерации, проводится «обучение с подкреплением»: специалисты изучают созданные с использованием YandexART изображения различных объектов, отбирая наиболее удачные и неудачные. Благодаря этому подходу, нейросеть находит лучшее представление о том, как правильно изобразить животных, персонажей, объекты, явления и другие элементы.
Недавно нейросеть «Сбербанка» Kandinsky 2.2 научилась генерировать анимационные видеоролики по текстовому описанию.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.