Статистическая индукция

 

Статистической называется обобщающая индукция, при которой устанавливается относительная частота обладания свойством Р для произвольного предмета из класса S. Символически будем обозначать эту частоту величиной d(SP).

По методу статистической индукции осуществляются, например, социологические обследования, где заведомо нереально было бы ожидать, что все люди выскажутся одинаково. В этом случае нас интересует процент людей, которые придерживаются того или иного мнения.

Статистическая индукция также может быть полной и неполной, популярной и научной. Рассмотрим схему неполной научной статистической индукции.

 

1. x1 есть P

2. x2 есть P

. факты наличия свойства Р у предметов М

.

.

m. xm есть P

m+1. xm+1 не есть P

. факты отсутствия свойства Р у предметов М

.

.

n. xn не есть P

d(MP) = m/n. полная статистическая индукция

n+1. M @ S утверждение о репрезентативности выборки

d(SP) = m/n. индуктивное обобщение

 

В первых n посылках указаны результаты сплошного обследования предметов из выборки М = {x1, …, xn}. Посылки показывают, что из n проверенных предметов только m обладают интересующим нас свойством. Тогда устанавливается относительная частота обладания свойством Р для произвольного предмета из выборки М: d(MP) = m/n. А далее этот результат индуктивно обобщается на всю генеральную совокупность S: d(SP) = m/n.

Например, В автопарке имеется 450 автобусов. В течение года правила дорожного движения нарушили 45 водителей. Тогда относительная частота нарушений равна 45/450 (полная статистическая индукция). Можно предположить, что через пять лет число автобусов в автопарке увеличится до 600 и предсказать, что относительная частота нарушений не изменится. Если этот прогноз сбудется, то годовое число нарушений окажется равно 600 ´ 45/450 » 51. При научной статистической индукции выдвигается дополнительное требование к формированию выборки. Состав выборки должен быть пропорционален составу генеральной совокупности. Так, если мужчины в генеральной совокупности составляют 50%, а в выборке они представлены в количестве 99%, то такая выборка нерепрезентативна, если мы хотим выяснить мнение всего общества по какому-то вопросу, а не только мнение мужчин.

Важно подчеркнуть,что при использовании статистических обобщений нельзя путать относительную вероятность наличия некоторого свойства у предметов класса S и действительный порядок распределения этого свойства на множестве S. Например, если среди исследуемых предметов 33% обладают интересующим нас свойством, иногда говорят, что каждый третий предмет им обладает – но это вовсе не означает, что нужно методично отсчитать третий, шестой, девятый предметы и т.д. На подобной игре слов могут строиться разнообразные софизмы.

Упражнение. Определите, является ли правильным следующее рассуждение. Если нет, то почему?

Статистика утверждает, что каждый пятый человек – психически неуравновешенный. Проверьте четырех своих друзей. Если они нормальные, значит, психически неуравновешенным являетесь именно Вы!

 

Практика применения научных форм индукции показывает, что при соблюдении всех методологических требований к формированию репрезентативной выборки надежность этих рассуждений может приближаться к 100%.