Для расчета Индекса Тональности обсуждения аспекта пандемической реальности, включающего набор характеристик, берется среднее значение индексов его характеристик. Аспект «Меры» включает пять характеристик: маски, социальная дистанция, самоизоляция, многолюдные места и общение.
Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также на основе лингвистического анализа данных она выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.
Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены ниже. При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума.
Слова и словосочетания, по которым система из базового массива отбирает посты для отдельных характеристик:
маска
дистанция, дистанцирование
самоизоляция
многолюдные места, скопление людей, скопление народа, многолюдно
встреча с родными, встреча с близкими, встреча со знакомыми, встречаться с родными, встречаться с близкими, встречаться со знакомыми, видеться с родными, видеться с близкими, видеться со знакомыми, видеться с родными, видеться с близкими, видеться со знакомыми, встреча с друзья, встречаться с друзья, видеться с друзья, видеться с друзья
Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней».
Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений.