Индекс Тональности обсуждения Борьбы в соцмедиа

Для расчета Индекса Тональности обсуждения аспекта пандемической реальности, включающего набор характеристик, берется среднее значение индексов его характеристик. Аспект «Борьба» включает пять характеристик: медики, федеральная власть, региональная власть, российские лекарства, российские вакцины. 

Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также на основе лингвистического анализа данных она выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.  

Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены ниже. При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума. 

Слова и словосочетания, по которым система из базового массива отбирает посты для отдельных характеристик: 

Медики

медики, врачи, доктор

Федеральная власть

президент России, Путин, Совет Федерации, федеральная власть, Правительство России, Правительство РФ, Российское правительство, Администрация президента России, Администрация президента РФ, Государственная Дума, депутат

Региональная власть

мэр, губернатор, глава республики, региональная власть, Администрация области, Администрация региона, Правительство области, Правительство региона

Российские лекарства

отечественные лекарства, российские лекарства, русские лекарства

Российские вакцины

отечественные вакцина, российские вакцина, русские вакцина, отечественные прививка, российские прививка, русские прививка 

Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней». 

Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений. 

Поделитесь публикацией

© 2024 ФОМ