Индекс Тональности обсуждения Заботы о здоровье в соцмедиа

qr-code

Для расчета Индекса Тональности обсуждения аспекта пандемической реальности, включающего набор характеристик, берется среднее значение индексов его характеристик. Аспект «Забота о Здоровье» (ЗоЗ) включает шесть характеристик: внимание к здоровью, питание, физическая активность, режим дня, иммунитет, информация о ЗоЗ. 

Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также на основе лингвистического анализа данных она выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.  

Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены ниже. При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума. 

Слова и словосочетания, по которым система из базового массива отбирает посты для отдельных характеристик:

Внимание к здоровью
Развернуть

Питание
Развернуть

Физическая активность
Развернуть

Режим дня
Развернуть

Иммунитет
Развернуть

Информация о ЗоЗ
Развернуть

Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней». 

Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений.

Поделитесь публикацией

  • 0
  • 0
© 2024 ФОМ