ВКонтакте тестирует фильтр враждебных высказываний

5 ноября 2020 года   |  В контакте

ВКонтакте тестирует фильтр враждебных высказываний

Сегодня, 4 ноября, ровно на сутки в настройках сообществ ВКонтакте появится возможность включить фильтр враждебных высказываний.

Нейросеть будет удалять комментарии, в которых содержатся угрозы, — например, пожелания смерти или обещания причинить вред здоровью. При этом администратор сможет увидеть все комментарии, которые отсеял фильтр, и восстановить их или отправить автора в чёрный список. Как и другие фильтры в сообществах, фильтр враждебных высказываний можно включить или выключить в любой момент.

Результаты эксперимента будут использованы для дальнейшего обучения нейросети ВКонтакте и доработки фильтра.

Также ВКонтакте масштабирует ранее запущенный эксперимент: когда пользователь пишет комментарий, а алгоритмы определяют, есть ли в тексте признаки оскорблений. Если да, автор получает совет не тратить время на агрессию и отказаться от обидной реплики. В прошлом году благодаря такому предупреждению за сутки удалось сократить количество оскорблений в комментариях на 36%.

4 ноября предупреждение смогут увидеть все пользователи, а позже начнётся долгосрочный тест, рассчитанный на часть аудитории. По результатам эксперимента Команда ВКонтакте примет решение о дальнейшем использовании функци.

Напомним, ВКонтакте запустила нейросеть для борьбы с враждебными высказываниями в августе. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости.

Иллюстрация к статье: Яндекс.Картинки

Читайте также

Статьи