Борьба с враждой. «ВКонтакте» тестирует инструменты для снижения уровня кибербуллинга

В День народного единства «ВКонтакте» запустила масштабный эксперимент для борьбы с оскорблениями и травлей в комментариях. В течение суток социальная сеть протестирует две функции, которые помогут пользователям реже сталкиваться с нетерпимостью: администраторы смогут включить специальный фильтр враждебных высказываний в настройках сообщества, а комментаторы увидят предложение отказаться от обидных реплик. Оба инструмента работают на основе алгоритмов — в том числе нейросети, распознающей оскорбления.

Фильтр враждебных высказываний

4 ноября ровно на сутки в настройках сообществ появится возможность включить фильтр враждебных высказываний. Нейросеть удаляет комментарии, в которых содержатся угрозы, — например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в чёрный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент.

Рекомендация отказаться от оскорблений

Также «ВКонтакте» масштабирует прошлогодний эксперимент: когда пользователь пишет комментарий, алгоритмы определяют, есть ли в тексте признаки оскорблений. Если да, автор получает совет не тратить время на агрессию и отказаться от обидной реплики. В прошлом году благодаря такому предупреждению за сутки удалось сократить количество оскорблений в комментариях на 36%.

В этот раз функция будет определять более широкий спектр оскорблений и угроз. Среди них — проявления нетерпимости по национальному признаку, а также враждебные высказывания на почве религиозной принадлежности, возраста, пола и других характеристик. 4 ноября предупреждение смогут увидеть все пользователи, а позже начнётся долгосрочный тест, рассчитанный на часть аудитории. По результатам эксперимента команда «ВКонтакте» примет решение о дальнейшем использовании функции.

Как и раньше, любой пользователь может сообщить об оскорбительных публикациях службе модерации — с помощью кнопки «Пожаловаться». Она есть у записей, комментариев, фотографий, видео, историй и клипов. Чтобы усилить модерацию, «ВКонтакте» добавила отдельную причину для жалоб на оскорбительные материалы — «Враждебные высказывания». Также можно добавить профиль недоброжелателя в чёрный список.

«ВКонтакте» не только рассматривает поступающие жалобы, но и самостоятельно отслеживает появление вредоносного контента.

Ранее Performance360 рассказывал, что «ВКонтакте» работает над нейросетью для автоматического распознавания материалов с hate speech или враждебными высказываниями. Технология позволит ускорить обработку жалоб пользователей.


Все интересное про диджитал у нас в телеграме, а может быть и у вас: https://t.me/performance_360

Другие хорошие статьи