Skymizer создала ИИ-ускоритель для запуска моделей на 700 млрд параметров
Тайваньская компания Skymizer представила ИИ-ускоритель HTX301, который может локально запускать языковые модели размером до 700 млрд параметров на одной PCIe-карте. Устройство использует 28-нм чипы и стандартную память LPDDR4/LPDDR5, а не современные компоненты. Об этом сообщает Wccftech.
Ключевая ставка Skymizer — не на вычислительную мощность, а на объем памяти и энергоэффективность. Карта HTX301 имеет до 384 ГБ памяти, распределенных между шестью чипами HyperThought HTX301. Все устройство потребляет около 240 Вт, что значительно меньше, чем у ускорителей Nvidia и AMD.
Компания заявляет, что карта способна выдавать до 30 токенов в секунду при работе с гигантскими моделями и до 240 токенов в секунду на более компактных, например Llama2 7B. Для этого используются специальные алгоритмы сжатия весов и KV-кэша.
Решение Skymizer устраняет одну из главных проблем корпоративного ИИ — необходимость строить дорогую инфраструктуру с GPU-кластерами. HTX301 рассчитан на установку в обычные серверы с воздушным охлаждением без модернизации дата-центров. Разработчики также делают ставку на локальный запуск ИИ-моделей внутри компаний для предотвращения утечек данных и зависимости от облачных сервисов.
Пока все показатели HTX301 существуют только в презентациях компании. Независимые тесты карты должны пройти на выставке Computex 2026 в начале июня.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.