«Вконтакте» тестирует нейросеть для борьбы с языком вражды
«Вконтакте» работает над искусственным интеллектом для автоматического распознавания материалов с хейтспичем — враждебными высказываниями. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости.
Новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию. Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них — проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.
Чтобы усилить модерацию по теме языка ненависти и обучить искусственный интеллект, «Вконтакте» добавила новую категорию жалоб — «Враждебные высказывания». Пользователь может выбрать ее, если нажмет кнопку «Пожаловаться» у оскорбительной публикации. После этого материал попадет на рассмотрение к модераторам. Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды Модерации и Поддержки не только реагируют на жалобы, но и проводят проактивный внутренний мониторинг — в частности, с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.
За первую половину 2020 г. на платформе было удалено 520 тыс. единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.