1.4. От анализа к прогнозной модели

(Валидизация методом экспертного опроса – Оптимизация системы показателей – Тестирование модели в построении временных рядов – Проблемы и ограничения в применении прогнозной модели)

Частичная валидизация модели динамики интеграции была также требовала проверки не только релевантности и измеримости выбранных показателей, но и оценки значимости факторов со стороны внешнего, независимого от исследовательской группы источника.

В качестве метода такой валидизации был выбран полуформализованный экспертный опрос модераторов и администраторов 45 сообществ мобилизационного типа в сетях «ВКонтакте» и «Facebook» в онлайн формате. Отбор экспертов происходил методом стратифицированной выборки: отбиралось равной количество экспертов из групп разной численности (малой, средней и крупной), разного географического охвата (локальные, региональные, общероссийские, включая общероссийские с международным охватом), разные по тематике и направлению мобилизации (на коллективные действия онлайн, коллективные действия оффлайн, индивидуальные действия онлайн и оффлайн). Экспертам было предложено обозначить, выделить и оценить наиболее значимые признаки и факторы интеграции в администрируемых группах, а также оценить динамику развития своего сообщества.

Полученные данные показали значительную степень согласованности при оценке значимости признаков, выделенных на первом этапе исследования. Несогласованность оценок проявилась только по показателям роли модераторов/администраторов сообщества (модераторы оценили эту роль значительно выше экспертов) и по показателям значимости внешних для сообщества факторов – интерфейс платформы, резонансные события и т.д., оценив их ниже, чем эксперты – см. Табл. 1-2.

Таблица 1. Оценка значимости количественных критериев динамики интеграции в представлениях внутренних и внешних экспертов

 Эксперты-модераторы (баллы от 0 до 10, средний балл)Внешние эксперты-наблюдатели (веса в иерархической модели интеграции)
Рост активности участников в общении в группе7,480,0462
Рост сплоченности группы, групповой солидарности6,980,0429
Рост активности в офф-лайне (участие в мероприятиях, акциях и т.д.)6,840,0429
Уровень активности в распространении информации за пределы группы (репосты)6,810,0165
Количественный рост группы6,710,0297
Рост интереса к группе со стороны других групп и сообществ6,5не измерялось

Таблица 2. Оценка значимости факторов интеграции со стороны внутренних и внешних экспертов

 все эксперты (баллы от 1 до 10, средний балл) веса в иерархической модели интеграцииВнутренний рейтингВнешний рейтинг
Успешность совместных действий участников группы]7,520,13811
Грамотное модерирование новостной ленты и дискуссий]7,290,042927
Личный авторитет руководителя/администратора/модератора группы]7,04
Особенности тематики сообщества – оригинальность, новизна темы, актуальность и острота решаемых проблем и т.д.]7,020,06633
Взаимное доверие участников группы]6,70,02974

10
Количество участников, способных производить интересный для других контент]6,30,051356
События, которые происходят в жизни (города, региона, страны, мира)]5,620,052865
Активность, которую участники проявляют в социальных сетях – в других группах, на своих страницах]5,45не измерялось7
Личное знакомство участников друг с другом]5,32не измерялось8
Степень социальной и культурной однородности участников]5,190,039699
Особенности интерфейса конкретной социальной сети (ВКонтакте, Facebook)]5,020,0594104
Наличие большой доли участников, подписанных в социальной сети друг на друга/находящихся в отношениях дружбы в социальной сети]4,730,0741112
Финансовое обеспечение деятельности группы]4,380,0429127
Источник внешней угрозы, провокаций и/или неприязнненного отношения извне]4,140,0399138
Изменения законов, правил, регулирующих Интернет-коммуникации в целом]3,790,0528145

Валидизация эмпирической модели динамики интеграции онлайн-сообществ мобилизационного типа в целом показала, что система признаков и их иерархия, выделенные в ходе включенного наблюдения за поведением сообществ с последующим иерархическим анализом, соответствует представлениям основных акторов о критериях и факторах интеграции. Выявленные различия в оценках значимости критериев и факторов интеграции со стороны внутренних и внешних экспертов, с одной стороны, связаны с особенностями позиции наблюдателей (например, внутренние эксперты не могут оценить влияние фактора особенностей Интернет-платформы, а внешние – факторы усилий модератора по развитию сообщества), а, с другой – являются основанием для развития теоретико-методологической модели объекта.

В частности, очевидно, что взгляд на динамику сообщества «изнутри» определяется восприятием актора сообщества как традиционной социальной группы, характеризующейся отчетливой внутренней и внешней идентичностью, ресурсом взаимного доверия, отчетливой ролевой структурой, включая ярко выраженные лидерские роли. А взгляд «извне» может, с одной стороны, недооценивать эти свойства  сообщества как группы, но, с другой стороны – в большей степени фокусируется на сетевых свойствах сообществ, таких, как количество информационных узлов, объем и плотность сети и т.д.

На основании результатов статистической валидизации и валидизации методом экспертного опроса была откорректирована вся система используемых показателей. Для корректировки модели, во-первых, были исключены из перечня факторов те признаки, которые имели минимальный вес, но требовали громоздких процедур измерения. При этом некоторые признаки, которые не могут быть измерены в силу недоступности данных, но оцениваются как важные, были сохранены – например, фактор финансирования сообщества.

 Была также предпринята повторная процедура взвешивания факторов (см. раздел 2 Главы 1). Результаты предшествующего статистического анализа, мнения внешних экспертов позволили экспертам пересмотреть некоторые свои представления о роли факторов. В частности, это произошло в оценке факторов лидерства и значимости внешних факторов. Факторы были также перегруппированы и категорированы по группам «структурные» и «функциональные» – см. Рисунок 1.

Рисунок 1. Основные факторы интеграции онлайн-сообществ мобилизационного типа (окончательная модель)

С учетов весов конкретных эмпирических показателей процесса общая модель выглядит следующим образом.

Таблица 3. Эмпирическая модель факторов интеграции с указанием веса (окончательная)

Факторы интеграцииВеса по ветке
1
A1 :Структурные факторы  0,48
 A1 :Уровень сплочённости 0,1728
 A1 :Аутгрупповая враждебность0,057024
A2 :Внутривидовая дискриминация0,012096
A3 :Доля авторов, публикации которых набирают влияние верхнем квартиля0,024192
A4 :Модулярность сети0,036288
A5 :Среднее недельное количество публикаций, не имеющи0,013824
A6 :Средняя длина пути между участниками0,029376
A2 :Динамика объёма сообщества 0,0528
 A1 :Абсолютный прирост за неделю0,020064
A2 :Относительный прирост за неделю0,032736
A3 :Уровень доверия 0,0672
 A1 :Взаимодействие в оффлайн0,032256
A2 :Плотность сети (количество друзей)0,02352
A3 :Транзитивность (отношение дружбы с друзьями друга)0,010752
A4 :Объём сообщества 0,0384
 A1 :Количество участников0,0384
A5 :Особенности лидерства 0,0816
 A1 :Доля постов от админов, отмечающих отдельных участников0,022032
A2 :Распределение количества лайков по авторам (кварти0,009792
А3 :Количество авторов публикаций, набирающих число просмотров (для Вк) и лайков, входящих в верхнюю дециль распределения просмотров и лайков0,00816
A4 :Количество реакций (лайков, комментариев) от лица администраторов на публикации членов группы в неделю0,008976
A5 :Доля публикаций от имени группы – степень группово0,021216
A6 :Центральность участников (сколько коммуникационных узлов?)0,011424
A6 :Особенности участников (однородность) 0,0672
 A1 :Гомофилия (предпочтение образовывать дружеские свя0,0672
A2 :Функциональные факторы  0,33
 A1 :Объём внешних коммуникаций 0,0198
 A1 :Количество входящих репостов из новостной ленты0,00297
A2 :Количество исходящих репостов из новостной ленты0,010692
A3 :Отношение количества входящих репостов к количеств0,006138
A2 :Объём внутренних коммуникаций 0,0528
 A1 :Количество просмотров публикаций в ленте за неделю0,004752
A2 :Количество комментариев в основной ленте за неделю0,01584
A3 :Количество комментариев на одного участника за вес0,019536
A4 :Количество лайков на одного участника0,0132
A3 :Мобилизационный потенциал 0,1122
 A1 :Географический разброс/локализация действий0,004488
A2 :Количество результативных внешних коллективных дей0,031416
A3 :Наличие инструкции к тому, как действовать в опред0,015708
A4 :Доля мотивирующих (с использованием одного из ключевых слов)0,014586
A5 :Среднее количество участников оффлайновых мероприя0,020196
A6 :Частота оффлайновых действий (среднее количество)0,01683
A7 :Количество репостов в ответ на просьбу о репосте0,010098
A4 :Стадия жизненного цикла группы 0,0462
 A1 :Возраст группы0,0462
A5 :Особенности тематики и целей группы 0,066
 A1 :Доля собственного/привлечённого материала0,01188
A2 :Степень соответствия тематики публикации заявленны0,01188
A3 :Степень конкретности/достижимости целей группы0,02376
A4 :Степень узости/широты тематики0,00726
A5 :Средняя доля материалов со ссылками на зарубежный0,00396
A6 :Тематическая мода0,0066
A6 :Стилистические и языковые особенности коммуникаций 0,0297
 A1 :Доля эмоционально воздействующего контента (по ключевым словам и эмодзи)0,00891
A2 :Доля публикаций фото/видео в неделю0,003564
A3 :Доля постов, в которых использованы хэштеги0,004158
A4 :Собственный язык общения группы0,008613
A5 :Длина постов в среднем0,002079
A6 :Длина комментариев (среднее количество слов)0,002673
A3 :Внешние факторы  0,19
 A1 :Особенности программно-технической платформы 0,0627
 A1 :Общение в сети “Вконтакте” или Facebook0,0627
A2 :Политико-правовые аспекты 0,0323
 A1 :Новые законы, регулирующие Интернет-активность0,005814
A2 :Новые законы, регулирующие социальную активность в0,013889
A3 :Резонансные политические или иные события0,012597
A3 :Финансовые аспекты 0,0969
 A1 :Источники и объёмы финансирования группы0,0969

Последующий сбор данных также осуществлялся как в автоматизированном, так и в ручном режиме. Однако ряд качественных факторов в результате квантификации удалось перевести из ручного сбора в автоматический.

Поскольку период наблюдения с применением всех трех инструментов (автоматизированный контент-анализ стены группы, сетевой анализ, ручной контент-анализ стены группы) вырос до 1 года, собранные данные позволили осуществить анализ временных рядов уже на полном массиве данных.

Поскольку доступ к данным из сообществ в Facebook в ходе реализации проекта оказался практически невозможным, прогнозные модели были протестированы на группах в сети ВКонтакте. Ниже представлены основные результаты анализа.

Анализ временных рядов динамики показателя интеграции интернет-сообществ

Временной ряд или ряд динамики – это последовательность значений характеристики изучаемого явления во времени. Он существенно отличается от статистической выборки данных, потому что в его природе исследуется зависимость в изменении явлений во времени, а не только зависимости между элементами выборки[1]

Проблемы анализа изменений значений характеристик систем во времени изучаются в рамках математической статистики, анализа временных рядов и эконометрики.[2]

Главной задачей анализа временных рядов[3] является установление зависимости вида (1):


[1] Шмойлова Р. А. Общая теория статистики: Учебник. — М.: Финансы и статистика, 2002.

[2] Афанасьев В. Н., Юзбашев М. М. Анализ временных рядов и прогнозирование: Учеб. пособие. — М.: Финансы и статистика, 2001. — 228 с

[3] (Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. – 311 с.)

Результаты анализа рядов динамики показателя интеграции интернет-сообществ.

Рассмотрим модель временного ряда динамики группы «Альянс гетеросексуалов и ЛГБТ за равноправие»

[1] Шмойлова Р. А. Общая теория статистики: Учебник. — М.: Финансы и статистика, 2002.

[1] Афанасьев В. Н., Юзбашев М. М. Анализ временных рядов и прогнозирование: Учеб. пособие. — М.: Финансы и статистика, 2001. — 228 с

[1] (Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. – 311 с.) [1] Бахрушин В. Е. Методы оценивания характеристик нелинейных статистических связей // Системные

Коэффициент детерминации R2 показывает какая доля отклонений зависимой переменной объясняется уравнением регрессии[1].

F тест проверяет равенство дисперсий двух выборок случайных величин[2]. Если значение F статистики больше критического для заданного объема выборок, то равенство дисперсий отвергается, а это в свою очередь говорит о том, что две выборки случайных величин не коррелируют друг с другом. В случае анализа временных рядов необходимо, чтобы остатки et в регрессионной модели были представлены независимой гауссовской случайной величиной (белый шум)[3].


[1] Бахрушин В. Е. Методы оценивания характеристик нелинейных статистических связей // Системные технологии. — 2011. — № 2(73). — С. 9—14.

[2] Snedecor, George W. and Cochran, William G. (1989), Statistical Methods, Eighth Edition, Iowa State University Press.

[3] Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. с. 61

[1] Durbin, J.; Watson, G. S. (1950). “Testing for Serial Correlation in Least Squares Regression, I”. Biometrika. 37 (3–4): 409–428. doi:10.1093/biomet/37.3-4.409, Durbin, J.; Watson, G. S. (1951). “Testing for Serial Correlation in Least Squares Regression, II”. Biometrika. 38 (1–2): 159–179. doi:10.1093/biomet/38.1-2.159

[1] Legendre, On Least Squares. Translated from the French by Professor Henry A. Ruger and Professor Helen M. Walker, Teachers College, Columbia University, New York City. http://web.archive.org/web/20110107112250/http://www.stat.ucla.edu/history/legendre.pdf

 Датауровень интеграциитрендошибкаОтносительная ошибка
12020-12-0116272,3917330,42-1058,034,32%
22021-01-0126068,5615958,310110,2541,26%
32021-02-0141063,9617325,223738,7696,88%
42021-03-0114715,6219852,06-5136,4520,96%
52021-04-012350,57712873,09-10522,542,94%
62021-05-01474,91559067,037-8592,1235,06%
72021-06-01611,92587633,234-7021,3128,65%
82021-07-01734,41936629,16-5894,7424,06%
92021-08-011174,4235590,263-4415,8418,02%

Критерий Дарбина-Уотсона d=1,92 автокорреляции в остатках нет, модель может быть использована для прогноза, средняя относительная ошибка прогноза по данным за 9 месяцев = 34,68%

В данном примере видно (уравнение 1), что имеется зависимость в виде отложенного на 1 период воздействия предыдущего уровня интеграции на уровне 23% положительного вклада предыдущего уровня интеграции. Долговременная тенденция проявляется в виде параболы с лучами направленными в низ – т.е. имело место максимальное развитие интеграционных процессов в середине периода обучения.

Зеленый паровоз

 Уровень интеграцииТрендОстаткиОшибка
12021-01-01457,9584531,1782-73,219812,01%
22021-02-01760,1541480,9725279,181645,80%
32021-03-01515,3875483,386132,001315,25%
42021-04-01422,4835494,3826-71,899111,80%
52021-05-01361,5882464,1093-102,52116,82%
62021-06-01375,8744462,1396-86,265214,15%
72021-07-01368,4773480,4271-111,9518,37%
801,08,2021344,6118509,0421-164,4326,98%

Критерий Дарбина-Уотсона d=1,93 автокорреляции в остатках нет, модель может быть использована для прогноза, средняя относительная ошибка прогноза по данным за 8 месяцев = 18,9%

В данном примере видно (уравнение 2), что имеется зависимость в виде отложенного на 1 период воздействия предыдущего уровня интеграции на уровне 16% положительного вклада предыдущего уровня интеграции. Долговременная тенденция проявляется в виде гиперболы с положительным коэффициентом при старшем члене – т.е. имело место замедление интеграционных процессов в середине изучаемого временного интервала. Возможно последующее нарастание интеграционных процессов.

Лига(лыжи) мечты

ДатаИнтеграцияТрендОстаткиОшибка
12021-04-01139,162792,825846,3368935,49%
22021-05-01136,507886,455550,0523438,34%
32021-06-01120,228979,829440,3994730,95%
42021-07-0173,4206572,94750,4731450,36%
52021-08-0147,6240565,8098-18,185713,93%
601.09.202139,5503458,4163-18,86614,45%
701.10.202139,6692650,767-11,09778,50%

Критерий Дарбина-Уотсона d=2,23 автокорреляции в остатках нет, при использовании модели для прогноза, средняя относительная ошибка прогноза по данным за 7 месяцев составила 20,29%

Поборы в школах и детсадах

Уровень интеграцииТрендОстаткиОшибка
2020-12-011142285,6113282,829002,7925,66%
2021-01-012110951,5117522,2-6570,715,81%
2021-02-01343040,0296791,67-53751,647,55%
2021-03-01477804,2753115,0724689,221,84%
2021-04-01546499,273763,86-27264,724,12%
2021-05-01687397,8952983,7734414,1230,44%
2021-06-01766368,7177431,98-11063,39,79%
2021-07-01850350,4963046,78-12696,311,23%
2021-08-01966052,9851779,4614273,5312,63%
2021-09-011034526,0760369,27-25843,222,86%
01.10.2021112312,91339337,37-37024,532,75%

Университетская солидарность

 ДатаУровень интеграцииТрендРазницаОшибка прогноза
101,04,202145,1992569648,53785149-3,3385945297,22%
201,05,202149,054136348,487752980,5663833261,22%
301,06,202146,6585908448,01806536-1,3594745172,94%
401,07,202139,4408042847,05429671-7,61349242816,46%
501,08,202142,6816127545,51789267-2,836279926,13%
601,09,202138,8022305143,32623655-4,5240060319,78%
701,10,202136,88969640,39264921-3,502953217,57%

Критерий Дарбина-Уотсона d= 2,034465005 автокорреляции в остатках нет, при использовании модели для прогноза, средняя относительная ошибка прогноза по данным за 7 месяцев составила 7,33%

Все представленные прогнозы на полном объеме данным за 1 год показали, что модель динамики интеграции в целом является работающей, и она может быть использованы при оценке динамики и прогноза любого другого сообщества мобилизационного типа, организующегося в социальных сетях.

Также все представленные модели показывают нисходящий тренд в интеграции всех групп, по сравнению с трендами за предыдущие года. Для интерпретации этого результата нужна дополнительная информация. Гипотетически одна их причин может состоять в том,  что социальная сеть «ВКонтакте» теряет свою популярность. Отчасти этот нисходящий тренд может объяснять также вхождением изучаемых групп в соответствующий, нисходящий этап жизненного цикла.

Поделиться в социальных сетях

Добавить комментарий

Авторизация
*
*
Регистрация
*
*
*
Генерация пароля