В условиях перехода многих коммуникаций в онлайн-пространство, особенно в период пандемии COVID-19, обсуждения в соцмедиа и их тональность становятся предметом исследовательского интереса. Понимание тональности обсуждений аспектов пандемической реальности позволяет дополнять описание текущих социологических процессов, а также фиксировать отдельные инсайты.
Индекс Тональности определенной характеристики пандемической реальности рассчитывается как соотношение позитивных, негативных и нейтральных постов, содержащих упоминание этой характеристики. Всего на мониторинге находятся 23 характеристики, разбитые на четыре группы. Каждая группа соответствует отдельному аспекту пандемической реальности: Меры, Борьба, Последствия, Забота о Здоровье. Индекс Тональности обсуждения аспекта рассчитывается как среднее арифметическое значений индексов его характеристик.
Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также система мониторинга на основе лингвистического анализа данных выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.
Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Далее из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены на страницах аспектов (ссылки на эти страницы ниже). При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума.
Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней».
Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений.
Индексы Тональности обсуждения Мер >>
Индексы Тональности обсуждения Борьбы >>