Positive Technologies создала нейросеть ByteDog для обнаружения вирусов через анализ байтов файлов
Российская компания Positive Technologies представила нейросетевую модель ByteDog, предназначенную для выявления вредоносного программного обеспечения. Разработка основана на архитектуре трансформер, аналогичной той, что применяется в больших языковых моделях. По информации компании, новая система анализирует файлы непосредственно в виде байтовых последовательностей, что позволяет повысить точность детектирования угроз на 20% по сравнению с классическими подходами машинного обучения. Это первая подобная разработка в сфере информационной безопасности в России и Европе.
Андрей Кузнецов, ML-директор Positive Technologies, заявил: «Обучение и тестирование ByteDog проводились образцах из реальных киберинцидентов на протяжение года. Модель продемонстрировала превосходство над классическими ML-моделями по качеству детектирования и скорости анализа — разница составила более 20%. ByteDog будет интегрирована в ряд продуктов и сервисов Positive Technologies по обнаружению киберугроз».
Традиционные методы использования искусственного интеллекта в кибербезопасности требуют предварительной ручной подготовки данных, включающей извлечение специфических признаков из файлов. Модель ByteDog исключает этот этап, анализируя байты напрямую, в том виде, в котором они хранятся на устройствах или в облачных сервисах. Это позволяет системе самостоятельно выявлять закономерности и обнаруживать ранее неизвестные угрозы, превосходя решения, основанные на жестких правилах.
На практике это означает, что при получении, например, файла по электронной почте, ByteDog, работая на устройстве пользователя, анализирует его как последовательность байтов, минуя этапы распаковки и извлечения кода. Это позволяет обнаруживать вредоносное ПО, скрытое сложными способами. Ключевой технической задачей при создании модели стала обработка больших объемов данных, так как файлы могут содержать миллионы байт. Для решения этой проблемы анализ проводится по фрагментам с последующим формированием общей картины. Обученная модель не требует графического ускорителя для работы и может функционировать на персональных компьютерах и смартфонах.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.