21 Ноября 2025 17:17 21 Ноя 2025 17:17 |

Представлен MERA Multi — первый российский мультимодальный бенчмарк

Официально представлен MERA Multi – новый бенчмарк для комплексной оценки мультимодальных способностей современных моделей на русском языке. Бенчмарки экосистемы MERA – это независимая система тестов для проверки возможностей больших языковых моделей на русском языке. Ранние версии MERA включали текстовые тесты и специализированные разделы (например, MERA Code для задач программирования и MERA Industrial для отраслевых сценариев). Об этом CNews сообщили представители «Альянса в сфере ИИ».

С выпуском MERA Multi экосистема расширяется: теперь модели оцениваются также по задачам на понимание изображений, аудио и видео. Это первый открытый мультимодальный бенчмарк, созданный экспертами с учетом языковой и культурной специфики России.

MERA Multi включает 18 новых задач, разработанных по методологии бенчмарка MERA Text. Эти задачи проверяют ключевые мультимодальные умения моделей.

Визуальное восприятие: способность анализировать изображения – распознавать объекты, интерпретировать сцены и соотносить их с текстовым описанием. Это важно для систем генерации и поиска по картинкам, а также для применения ИИ в системах безопасности.

Аудиопонимание: способность обрабатывать аудиоконтент на русском языке – распознавать речь, интонации и звуковые сигналы. Этот навык нужен для голосовых ассистентов и приложений, работающих в шумной среде.

Анализ видео: умение ИИ «понимать» динамику видеоконтента – отслеживать действия, события и причинно-следственные связи во временном контексте. Это основа для интеллектуальных ассистентов, агентов и мультимодального поиска.

Каждая задача оформлена в строгом инструктивном формате. MERA Multi охватывает четыре модальности – текст (как базовая), изображения, аудио и видео – и оснащен прозрачной системой подсчёта баллов и рейтингов. Для исследователей и индустрии это значит, что теперь можно количественно сравнивать насколько хорошо современные модели «видят», «слышат» и понимают контент на русском языке.

Ирина Окладникова, Минфин в интервью CNews: Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

цифровизация

Проект MERA Multi также способствует стандартизации оценки ИИ в России. Разработчики создали единую «таксономию навыков» – системное описание компетенций, нужных для мультимодальных задач. В перспективе все бенчмарки MERA будут использовать одну систему навыков, что обеспечивает «согласованную и прозрачную оценку моделей во всех доменах». Такой единый подход упрощает сравнение моделей между собой и выявление направлений для улучшения.

Кроме того, MERA Multi разработан экспертами с учетом российской специфики – это делает результаты особенно релевантными для отечественных научных групп и индустриальных разработчиков.

По словам Валерии Воробьевой стандартизация критически важна: «Единый подход к оценке моделей позволяет формировать общую «шкалу» качества и координировать усилия внутри страны. MERA Multi создает такой стандарт – он дает российским разработчикам и исследователям понятную методологию сравнения моделей и синхронизирует наши усилия. Это ключевой шаг для развития качественных отечественных ИИ-решений в будущем».

MERA Multi открывает новые возможности для российского ИИ-сообщества: теперь лаборатории, стартапы и крупные компании смогут открыто и объективно тестировать свои мультимодальные модели и видеть, где они сильны, а где – отстают. Появление первого отечественного мультимодального бенчмарка укрепляет российскую ИИ-экосистему и способствует созданию конкурентоспособных мультимодальных моделей.

Лучшие тарифы на выделенные серверы Dedicated на ИТ-маркетплейсе CNewsMarket

Подписаться на новости

Короткая ссылка

Представлен MERA Multi — первый российский мультимодальный бенчмарк

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

Kubernetes

СЭД

BaaS

Email-рассылки

Техника

Обзор смартфона iQOO Z10R: достойное решение в среднеценовом сегменте

Обзор телевизора HARPER 55Q970TS с AI-караоке и матрицей QD Mini-LED

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Первая карта заводов компьютерной техники в России

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Представлен MERA Multi — первый российский мультимодальный бенчмарк

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

Kubernetes

СЭД

BaaS

Email-рассылки

Техника

Обзор смартфона iQOO Z10R: достойное решение в среднеценовом сегменте

Обзор телевизора HARPER 55Q970TS с AI-караоке и матрицей QD Mini-LED

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Российским ритейлерамстоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Первая карта заводов компьютерной техники в России

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО