Семантическая мера информации

Порция информации может быть описана путем соотнесения ее с другой информацией, указания ее смысла и структуры. Например, каждому китайскому иероглифу можно соотнести какое-либо слово или понятие на другом языке.

Семантика (от греческого semantikos - обозначающий) - значения, смысл единиц языка, например, слов и словосочетаний. Тезаурус - это совокупность таких значений, которыми располагает наблюдатель.

Семантическое (смысловое) количество информации измеряется тезаурусной мерой. Она выражает способность наблюдателя (пользователя) принимать поступившее сообщение.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя Sp изменяется количество семантической информации Ic , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рис. 1.3. Рассмотрим два предельных случая, когда количество семантической информации Ic равно 0:

- при Sp = 0 пользователь не воспринимает поступающую информацию, так как не понимает ее;

- при Sp ® ¥ пользователь все знает и поступающая информация ему не нужна.

Максимальное количество семантической информации Ic потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом Sp (Sp = Sp opt), когда поступающая информация понятна пользователю и несет ему ранее не известные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации в сообщении, количество новых знаний, получаемых пользователем, является величиной относительной. Одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным (семантический шум) для пользователя некомпетентного.

рис.1.3. Зависимость количества семантической информации Ic,

воспринимаемой потребителем, от его тезауруса Sp

При оценке семантического (содержательного) аспекта информации необходимо стремиться к согласованию величин S и Sp.

Относительной мерой количества семантической информации может служить коэффициент содержательности C, который определяется как отношение количества семантической информации к ее объему:

.