Индекс Тональности обсуждения Мер в соцмедиа

qr-code

Для расчета Индекса Тональности обсуждения аспекта пандемической реальности, включающего набор характеристик, берется среднее значение индексов его характеристик. Аспект «Меры» включает пять характеристик: маски, социальная дистанция, самоизоляция, многолюдные места и общение.  

Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также на основе лингвистического анализа данных она выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.  

Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены ниже. При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума. 

Слова и словосочетания, по которым система из базового массива отбирает посты для отдельных характеристик: 

Маски
Развернуть

Социальная дистанция
Развернуть

Самоизоляция
Развернуть

Многолюдные места
Развернуть

Общение
Развернуть

Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней». 

Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений. 

Поделитесь публикацией

  • 0
  • 0
  • 0
© 2021 Фонд Общественное Мнение