Информация и энтропия в социальной сети

Пытаясь искать критерии и оценки для сравнения и выбора проектов социальных сетей, первым с системотехнической точки зрения приходит на ум понятия информации и энтропии.

Наиболее приемлемым в контексте социальных сетей является толкование информации как взаимодействия между объектами, в процессе которого один приобретает некоторую субстанцию, а другой эту субстанцию не теряет, а передаваемая субстанция – называетсяинформацией[Колин].

Термин «информация» был введен в середине ХХ века Клодом Шенноном применительно к передаче сообщений в телеграфии. В настоящее время наполнение этого термина получило более глубокий природно-философский смысл.

При измерении количества информации используют комбинаторную меру Хартли и вероятностную Шеннона.

В трактовке Хартли сообщение представляется состоящим из символов или элементов: буквенного алфавита, цифр, слов или фраз. Обозначим общее число символов в алфавите – m и если длина сообщения - n, то общее число возможных сообщений N = m n .

Такое выражение неудобно брать в качестве меры информации, так как при наличии 2 источников информации N 1 и N 2 общее число возможных сообщений перемножается N = N 1 * N 2 .

Тогда как количество информации – скорее складывается. Поэтому за количество информации берут логарифм числа возможных сообщений:

I = log N = n log m

Клодом Шенноном при анализе телеграфных сообщений использовалась вероятностная мера:

I = log N = - n Sum pi log pi

Неопределенность ситуации часто характеризуют величиной, называемой энтропией, которое произошло от греческого эн-тропе – обращение. В термодинамике энтропией обозначают и измеряют тепловое состояние вещества, в математике – степень неопределенности, а в информатике – способность источника отдавать информацию.

Также энтропией называют количество информации на один символ. В случае n символов количество энтропии совпадает с количеством информации.

Вместе с тем, для социального проекта одного толкования с позиций обмена информации явно маловато. Далее будут предложены другие топологические и социальные показатели.

Рассуждая о важности, ценности и эффективности сети, следует, по-видимому, уточнить классы или группы социальных проектов. Большие группы – это коммерческие, профессиональные и общественно-ориентированные, для сравнения и оценки которых применимы различные критерии.

На экспертном уровне о социальной сети можно субъективно судить, пожив-поучаствовав в дискуссиях некоторое время. Средневзвешенное от Экспертов даст "температуру по больничке".

Некоторое представление дает топология. Скажем, у МоегоМира@Mail.ru - она звездчатая, которая строится вокруг сетевых записей – блогов известных деятелей масс-медия и политики, животрепещущих молодежных тем, наиболее популярных фото и т.д. Не факт, что по критерию социального капитала данная сеть имеет преимущество перед Соседями-Конкурентами (Одноклассники и ВКонтакте).

Один из критериев, применимых для сетей практиков и общественно-ориентированных проектов - это совокупный социальный капитал – см. [Шадрин].

Для сети профназначения, порядок участников которой измеряется десятками тысяч, например, Сети Творческих учителей - www.IT-n.ru, представляющую из себя часть мировой сети Microsoft для общения и обмена информационными материалами в образовании, оценкой может служить число ее участников, сообществ и творческих групп. Важен объем полезной информации, тематика обсуждений и их активность. Число кандидатов и докторов наук, в том числе!

Новостную сеть – например www.NewsLand.ru можно оценить числом тем и количеством комментариев в них, получая перемножением – оценку мощности. Скажем, в среднем на текущий момент – 20*100 = 2000, что конечно, немного для социально-ориентированного ресурса.

Для малых социальных сетей с несколькими тысячами участников, как в сети социально-психологической поддержки Марка Сандомирского - http://pempu-re3.ning.com/, построенной средствами Ning-конструктора, важен, скорее некий трудно измеримый Суммарный Функционал Психики.

Для «умной» сети – www.upself.ru, сочетающий в себе элементы корпоративного форума, блоговой поддержки проведения конкурса МодерниЗАция, критерием оценки можно принять человеческий и интеллектуальный капитал, состав экспертов, количество участников обсуждений и конкурсов.

Для проектов преимущественно социальной ориентации, например Социальной Сети Пассионариев, наряду с числом ее участников будет иметь значение топологические характеристики связности, возможность голосований и рейтингования обсуждений, его качество. Подробнее - http://v-school.narod.ru/PAPERS/analiz.doc

Применительно к моделям информационного влияния трактовки понятия «ценность» социальной сети можно найти в работе [Губанов].

Одна из трактовок – это потенциальная доступность агентов, с которыми любой агент может связаться в случае необходимости.

Для оценки доступности следует упомянуть законы Сарнова, Меткалфа, Рида и Ципфа. Закон Сарнова сформулирован для однонаправленной трансляционной сети, ценность которой пропорциональна количеству зрителей или слушателей. В локальной двунаправленной «почтовой» сети, следуя рассуждениям Роберта Меткалфа, ценность растет асимптотически как квадрат числа участников сети – n2. Если точнее, то как n (n-1).

В группообразующей сети, по Риду – возможность связаться определяется как число подмножеств (групп) множества из n агентов за исключением одиночных элементов и пустого множества – то есть пропорционально 2 n – n – 1. Согласно закону Ципфа рост ценности как потенциальной доступности агентов в сети оценивается как n ln (n). Отличие подхода Ципфа – трактовка величины ценности агента в диапазоне от 1 до 1 (n-1).