В основе платформы лежит сервис Evolution Distributed Train. Это инструмент для обучения и дообучения моделей машинного обучения, их ускоренного развертывания и совместной работы команд дата-сайентистов. Платформа объединяет инструменты для разработки, управления экспериментами и мониторинга в единую экосистему.
В Evolution Stack.ML пользователи могут запускать изолированные рабочие пространства для более чем 200 команд одновременно. Механизмы очередей, приоритетов, аллокаций и слотов помогают оптимально распределять нагрузку между задачами, повышая уровень использования GPU-инфраструктуры с 35% до 90%.
По данным компании, платформа позволяет сократить расходы на серверные мощности и окупить их менее чем за три месяца. Совместное использование кластеров также помогает увеличить скорость обучения и разработки новых ИИ-решений на 20%.
Встроенные механизмы восстановления автоматически обнаруживают сбои оборудования, перезапускают задачи и заменяют GPU-ноды. Это должно обеспечивать стабильную работу распределенных задач обучения даже на больших кластерах. OSS-слой в составе облачной платформы Cloud.ru позволяет отслеживать загрузку инфраструктуры и контролировать расходы.
Решение рассчитано на компании с высокими требованиями к безопасности, включая организации государственного и финансового сектора, операторов ЦОДов и промышленные предприятия. В Cloud.ru отмечают, что инфраструктура соответствует требованиям регуляторов к обработке и хранению персональных и финансовых данных, а также размещению государственных информационных систем и критической информационной инфраструктуры.
Исследование Cloud.ru показало, что в России растет спрос бизнеса на гибридные сценарии. Среди наиболее востребованных направлений компания называет задачи, связанные с обработкой данных и использованием ИИ, разработку и тестирование в облаке, а также георезервирование и аварийное восстановление. В таких случаях гибридная модель позволяет сочетать контроль над критической инфраструктурой с гибкостью облачных ресурсов.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.