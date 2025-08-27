Разделы

Цифровизация Искусственный интеллект
|

Лингвисты НИУ ВШЭ создали «эмоциональный словарь» для обучения искусственного интеллекта

Исследователи Лаборатории языковой конвергенции НИУ ВШЭ — Санкт-Петербург Анастасия Колмогорова и Елизавета Куликова разработали «словарь нового поколения», который позволяет обучать нейросети распознавать человеческие эмоции. Работа демонстрирует трансформацию лингвистики в эпоху искусственного интеллекта. Результаты исследования опубликованы в журнале «Вопросы лексикографии». Об этом CNews сообщили представители НИУ ВШЭ.

Ученые создали источник данных об эмоциональной речи для обучения больших языковых моделей детектированию эмоций на основе признаков из разных каналов коммуникации. Датасет включает 909 видеофрагментов общей продолжительностью 173 минуты, каждый из которых оценивался разметчиками по шести базовым эмоциям в четырех форматах: полное видео, только аудио, только текст и только видеоряд без звука.

«Большие языковые модели могут улавливать скрытые паттерны, которые мы, может быть, чувствуем на подсознательном уровне, но не можем формализовать. Наш датасет — это грамотно организованные, хорошо размеченные данные, приспособленные для работы с нейросетями. То, что раньше делал лингвист на основе словаря, теперь делают вычислительные модели, только их словарь должен быть организован по-другому. Вместо пары «слово — толкование» используется пара «текстовый фрагмент — эмоциональная метка», – сказала Анастасия Колмогорова, заведующая Лабораторией языковой конвергенции НИУ ВШЭ — Санкт-Петербург.

Исследование опровергает распространенное мнение о том, что именно интонация помогает лучше понимать эмоции. По новым данным, люди наиболее согласованно распознают эмоции при чтении письменного текста и просмотре полного видео со звуком. При прослушивании речи мнения расходились сильнее, а худший результат показало немое видео.

Детальный анализ выявил специфику восприятия разных эмоций: радость и удивление лучше распознаются через интонацию, злость точнее идентифицируется по тексту (72,9% против 67,4% для аудио), а страх оказался наиболее «вербальной» эмоцией — он распознается по тексту и аудио в 87% случаев, но практически не читается по мимике (всего 3,5%).

Датасет уже применяется в реальных проектах. Исследовательская группа использовала его для анализа отзывов посетителей Владимиро-Суздальского музейного заповедника и создания эмпатичного чат-бота для Эрмитажа, способного определять эмоции пользователей и адекватно на них реагировать.

Валентин Богданов, УЦСБ: На смену инструментальному подходу в ИБ приходит процессный

безопасность

«Раньше для такого анализа нужны были огромные размеченные выборки и мощные вычислительные ресурсы. Сейчас достаточно показать нейросети несколько десятков качественных образцов из нашего датасета» – сказала Анастасия Колмогорова.

Разработанный инструмент также позволяет оценить качество существующих систем автоматического распознавания эмоций. Исследователи протестировали восемь популярных моделей — текстовых, аудиальных, видео и мультимодальных. В результате текстовые модели показали лучшую точность (50-58%), аудиальные — среднюю (около 40%), а анализ мимики — самую низкую (25,6%).

Словарь для нейросетей доступен исследовательскому сообществу. Команда Лаборатории языковой конвергенции НИУ ВШЭ — Санкт-Петербург планирует расширять коллекцию и изучать работу со смешанными эмоциями.

Подписаться на новости Короткая ссылка


Другие материалы рубрики

Почему прикладной ИИ для бизнеса невозможен без мультиагентных кластеров

«Калашников» начал производство боевых БПЛА «Архангел»

Как автоматизировать выдачу ИТ-ресурсов через гибкие согласования в платформе «СУПеР»

В России создан БПЛА, умеющий прокладывать по воздуху оптоволоконные линии связи

Михаил Кадер, UserGate: Инфобезопасность должна быть эшелонированной и многоуровневой

«Касперский» помог Интерполу в борьбе с киберпреступностью. Задержаны более тысячи подозреваемых

Конференции

IT Elements 2025

Цифровизация финансового сектора

Оптимизация цифровой инфраструктуры и ПАК 2025
Показать еще

CNewsMarket

CRM

Подобрать CRM-систему для компании

От 1 000 руб./месяц

BPM

Подобрать систему управления бизнес-процессами BPM

От 1 250 руб./месяц

Email-рассылки

Выбор сервиса для почтовых рассылок

От 0.13 руб./месяц

СЭД

Подобрать систему электронного документооборота СЭД (ECM)

От 1 360 руб./месяц

Техника

Обзор Acer Predator Helios 16: эффектный игровой ноутбук для виртуальных развлечений

Лучшие ноутбуки для учебы и игр стоимостью до 75 000 рублей: выбор ZOOM

Лучшие 55-дюймовые телевизоры с MiniLED в 2025 году: выбор ZOOM

Показать еще

Наука

Археологи нашли татуированную мумию в Сибири — орнаментам на ней 2300 лет

Ученые воссоздали ключевой этап зарождения жизни — они выяснили, как живые клетки возникли из неживой материи

Крошечный метеорит поставил под сомнение хронологию происхождения целой Солнечной системы
Показать еще
IT Elements 2025 IT Elements 2025

erid:

Рекламодатель:

ИНН/ОГРН:

Сайт: