В России запустили первый открытый продуктовый бенчмарк для комплексной оценки решений с применением искусственного интеллекта в реальных бизнес-задачах — RRNCB (Russian RAG Normative-Corporate Benchmark). Новый бенчмарк позволит составить рейтинг лучших ИИ-продуктов для бизнеса на российском рынке. Прием заявок от разработчиков RAG-продуктов открыт до 21 ноября, результаты будут опубликованы в декабре. Среди участников бенчмарка ожидаются такие решения, как GigaChat от Сбера, «Нейроэксперт» от Яндекса, Cotype от МТС, Prefentum от Softline, а также продукты от Авито, Точка Банк, Just AI и других ключевых игроков ИИ-рынка в России.
Компания «Аватар Машина» при поддержке Ассоциации лабораторий искусственного интеллекта (АЛРИИ) запустила RRNCB (Russian RAG Normative-Corporate Benchmark) – первый в России открытый продуктовый бенчмарк для комплексной оценки RAG-решений. Инициатива призвана решить проблему отсутствия прозрачных критериев оценки эффективности ИИ-решений для бизнеса: RRNCB протестирует полные RAG-пайплайны на реальных корпоративных задачах.
Принять участие в бенчмарке призывают все российские компании, разрабатывающие и продающие собственные ИИ-продукты бизнесу. Участие в первом независимом российском бенчмарке дает компаниям объективное подтверждение качества продукта и инструмент для продаж. Организаторы ожидают заявки от команд разработки из Сбера (“GigaChat”), Яндекса (“Нейроэксперт”), МТС (“Cotype”), Softline (“Preferentum”), Авито, Точка Банка, Just AI и других ключевых игроков рынка. Свое участие подтвердили разработчики ИИ-решений от «Дюк Технологии», AutoFAQ.ai, AI Research, Новосибирского государственного университета, Simbirsoft и других.
Компании-разработчики RAG-решений могут подать заявку на участие до 21 ноября через форму на сайте бенчмарка. Первый этап тестирования пройдет с 22 по 28 ноября, второй — с 29 ноября по 10 декабря. Публикация результатов и рейтинга лучших ИИ-решений запланирована на 12 декабря. Подробная информация о методологии, датасетах и процессе участия доступна на сайте бенчмарка.
Бенчмарк проводится при поддержке Ассоциации лабораторий разработки искусственного интеллекта (АЛРИИ), которая обеспечивает экспертное сопровождение и методологическую поддержку проекта.
Эксперты участвуют в оценке результатов участников и формировании финальных выводов бенчмарка.
Подписывайтесь на наш Telegram-канал, чтобы быть в курсе всех новостей и событий Рунета.