11 - 13 апреля в СЛОНе голландские специалисты провели мастер-класс по сетевому анализу
10:48 17.04.2011
11-13 апреля в лаборатории прошли интенсивные семинары по сетевому анализу. Они были проведены приглашенными преподавателями – специалистами по сетевому анализу Кристиан Штеглих (Christian Steglich) и Марайтье Ван Дуийн (Marijtje van Duijn) из университета Гренинген в Голландии. Социологический факультет этого университета является одним из крупнейших мировых центров социологии. Кристиан и Марайтье уже 15 лет работают в области сетевого анализа, поэтому у них есть огромный опыт разнообразных сетевых исследований.
Для чего лаборатории нужны были эти
семинары? В каких областях применяется сетевой анализ? С ответа на эти вопросы
начал свое выступление Кристиан Штеглих. Дело в том, что это современное
направление обработки данных в корне отличается от того, что предлагает
классическая статистика. Исходным принципом последней является то, что данные
изначально собираются независимо друг от друга, а это редко встречается в
реальной жизни. Ключевое понятие сетевой статистики – сеть – подразумевает
взаимозависимость данных, которые в дальнейшем визуализируются и моделируются с
целью облегчения их интерпретации и анализа. Как отметил Кристиан, «если в
данных нет взаимозависимостей, вам не нужен сетевой анализ». Причем эти
взаимозависимости чаще всего можно обнаружить в таких сферах социальной жизни,
как:
- управление: политические сети помогают ответить, например, на вопрос, как государства взаимодействуют друг с другом;
- торговля: рыночные сети показывают движение поставок товаров и взаимоотношения покупателей и продавцов;
- организации: изучение формальных и неформальных связей внутри какой-либо фирмы, особенно среди управленцев, может оказаться важным для объяснения причин ее успеха или неудачи, а на уровне внешних связей сетевой анализ может пригодиться для обнаружения монополий, коррупции и т.д.;
- первичное социальное устройство: изучение такого рода отношений позволяет строить сети и изучать родство, дружбу и пр., а также, например, объяснить понятие социального капитала в терминах социального анализа.
.jpg)
Занятия были очень насыщенными. В рамках теоретической части нас познакомили с историей сетевого анализа и его ключевыми понятиями. Возникновение сетевого анализа в области социальной психологии связано с изучением группового поведения, а дальнейшее развитие произошло благодаря совершенствованию теории графов и практической антропологии. Коллеги из Гренингена закрепили наши знания об основных терминах сетевого анализа, о типах сетей, акторов, а также таких свойствах, как реципрокность, плотность сети и т.д.
Участники семинара познакомились со способами сбора данных для сетевого анализа и типичными проблемами, которые возникают при этом. Среди них можно отметить, например, трудности при определении границы сети. Где они находятся? Где заканчивается сеть? Вторая проблема – чувствительность к пропущенным значениям, которая дает о себе знать, например, когда студент отсутствовал при проведении опроса и его ответов нет. Если этот студент связан со многими людьми, то вся сеть получится нерелевантной. Еще одна трудность, которую необходимо учитывать, – неточность данных, предоставляемых информантом, которая кроется в том, что люди систематически забывают определенные связи, например, на вопрос о друзьях могут не назвать по-настоящему близких людей.
Интересно было узнать о том, какова
вероятность реципрокности в сетях разного типа. Оказалось, ее вероятность в
эгалитарных сетях (доверие, дружба, коммуникация) выше, чем в иерархических
сетях, отражающих отношения распределения власти или цепочки поставок товаров.
Что касается свойства транзитивности, то и здесь есть некоторая зависимость: вероятность
наличия связи между двумя акторами может зависеть от наличия связи этих акторов
с неким третьим вертексом. Это наблюдение позволяет измерять популярность и
социальную изоляцию людей. Еще одна любопытная вещь связана с так называемым
«эффектом Матвея», когда «богатые богатеют», а именно: вероятность наличия
связи между двумя акторами может зависеть от того, насколько много у одного из
них связей с другими акторами, т.е. от его валентности.
Занятия помогли ответить участникам семинаров на следующие вопросы:
- Как мы можем описать свойства сети\актора, анализируя связи?
- Как мы можем описать и смоделировать зависимость между структурой сети и характеристиками актора?
- Как мы можем сравнить акторов и их характеристики?
- Как
сети развиваются во времени и влияют друг на друга?
.jpg)
На практической части семинаров участники выполняли лабораторные работы, используя программу R. Большое внимание было уделено изучению моделирования, рассмотрению моделей вероятности p1 и р2. Первая модель вероятности р1, которая показывает вероятность возникновения некой сети, разрабатывалась еще в 1980-ые гг. Холландом и Лейнхардтом. Вторая модель р2 предполагает изначальную независимость диад, а также в модели можно использовать меньше параметров. Модель р2 позволяет ответить на такие вопросы, как: влияет ли гомофилия на образование связи, на реципрокность, на плотность сети. Какую модель считать лучше? «Ту, в которой похожие сети имеют примерно равные вероятности», – отвечает Кристиан Штеглих.
Ценным было и то, что участники семинара
получили возможность обсудить с коллегами из Гренингена свои проекты, которые
предполагают использование сетевого анализа. Об этой части семинаров подробнее
в следующей статье.
Подготовила Ксения Медведева




