Для расчета Индекса Тональности обсуждения аспекта пандемической реальности, включающего набор характеристик, берется среднее значение индексов его характеристик. Аспект «Последствия» включает шесть характеристик: образ жизни, деньги, работа, взаимоотношения, планы, психологическое состояние.
Мониторинг осуществляется при помощи системы «Медиалогия» с 12 октября 2020 года. Система в соответствии с заданным условием (запросом) предоставляет все сообщения соцмедиа, содержащие упоминание характеристик. Также на основе лингвистического анализа данных она выполняет автоматизированное присвоение постам одной из трех тональностей: позитивную, нейтральную, негативную.
Запрос – при мониторинге тональности обсуждений характеристик пандемической реальности система сначала из всего массива сообщений соцмедиа отбирает те публикации, которые содержат упоминание коронавируса (а именно посты со словами коронавирус, covid, короновирус, ковид, пандемия и самоизоляция во всех словоформах). Таким образом формируется базовый массив постов. Из него система отбирает посты, относящиеся к каждой характеристике. Отбор производится на основе специальных, релевантных отдельной характеристике слов и словосочетаний (во всех их словоформах). Данные слова и словосочетания представлены ниже. При этом нерелевантные посты (спам, объявления о продажах) отсеиваются. Таким образом мониторинг освобождается от информационного шума.
Слова и словосочетания, по которым система из базового массива отбирает посты для отдельных характеристик:
образ жизни
деньги, финансы, заработок, заработная плата, зарплата
работа
отношения с родными, отношения в семье, отношения с мужем, отношения с женой, отношения с друзьями, отношения с родителимя, отношения с любимой
изменить планы, менять план, скорректировать планы
нервы, психика, психологически
Расчеты – Индекс Тональности обсуждения характеристики рассчитывается по формуле: (% позитивных постов) + 0,5 (% нейтральных постов). Для расчета Индекса Тональности обсуждения аспекта, включающего набор характеристик, берется среднее значение индексов данных характеристик. Для каждого аспекта индекс считается один раз в неделю по данным «сегодня + шесть последних дней».
Область значений – от 0 до 100. Если значение равно или больше 50 – это позитивная тональность обсуждений, меньше 50 – это негативная тональность обсуждений.