Loading...

Ученые оценили токсичность комментаторов Reddit
sofind / Freepik

С помощью методов машинного обучения международная команда ученых проанализировала более 2 миллиардов постов и комментариев от пользователей Reddit, чтобы оценить, как меняется токсичность интернет-пользователей в зависимости от сообщества, в котором они опубликованы. Результаты исследования показали, что токсичное общение распространено в Reddit, а пользователи адаптируют свое поведение к нормам конкретного сообщества. Статья представлена в журнале PeerJ Computer Science.

Ученые из Катара и Сингапура проанализировали более 87 млн постов и 2205 млрд комментариев от более чем 1,2 млн пользователей популярного сайта Reddit, сочетающего в себе черты форума и социальной сети. В социальных сетях можно публиковать различные типы контента, что позволяет пользователям общаться друг с другом различными способами. Однако распространение социальных сетей приводит к увеличению намеренных публикаций вредоносного (токсичного) контента, такого как домогательства, ненормативная лексика и кибербуллинг.

«Одна из проблем, связанных с изучением токсичности в интернете, заключается в множестве его форм. Токсичный контент часто содержит оскорбления и угрозы. Несколько онлайн-платформ внедрили механизмы предотвращения, но эти усилия недостаточно масштабируемы, чтобы сдержать быстрый рост токсичного контента. Эти проблемы требуют разработки эффективных автоматических или полуавтоматических решений для обнаружения токсичности на онлайн-платформах, — говорят авторы работы. — Наблюдение за изменением токсичности пользователей может быть методом раннего обнаружения токсичности в онлайн-сообществах».

С помощью краудсорсинга ученые сформировали набор данных из 10 083 комментариев Reddit, а затем использовали его для обучения нейронной сети. Модель предсказала уровни токсичности 87 376 912 постов от 577 835 пользователей и 2 205 581 786 комментариев от 890 913 пользователей на Reddit за 16 лет, с 2005 по 2020 год. Исследователи также оценивали изменения в токсичности публикаций пользователя в одном и нескольких сообществах с течением времени.

Оказалось, что 16,11% пользователей публикуют токсичные посты, а 13,28% — токсичные комментарии. 30,68% пользователей, публикующих сообщения, и 81,67% пользователей, публикующих комментарии, показали изменения в своей токсичности в разных сообществах, что указывает на то, что пользователи адаптируют свое поведение к нормам сообществ.

Исследование предполагает, что одним из способов ограничения распространения токсичности может стать ограничение сообществ, в которые могут вступать пользователи. Они также обнаружили положительную корреляцию между увеличением количества сообществ и увеличением токсичности общения. Однако нельзя гарантировать, что это единственная причина увеличения количества токсичного контента.


Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram.