Начала математической статистики

Математическая статистика – наука, изучающая массовые явления для выявления закономерностей и получения некоторых обобщенных показателей, кратко характеризующих полученные данные. Основой математической статистики является теория вероятностей.

Под статистическими данными понимается любая числовая информация, характеризующая некоторую совокупность объектов, обладающих теми или иными общими признаками. Статистические данные могут быть представлены в различных формах. Набор данных может содержать одно или несколько значений для каждого из отдельных объектов. Эти объекты называют элементарными единицами. Для каждого объекта регистрируют один и тот же признак или одни и те же признаки. Например, регистрируется возраст, рост и масса школьников; год издания, количество страниц для книг и т. д.

Все множество исследуемых объектов называется генеральной совокупностью (ГС). Общее свойство объектов генеральной совокупности называется признаком генеральной совокупности. Значения признака, который регистрируется для каждого из объектов, называют вариантами.

Выборка (В), или выборочная совокупность – подмножество генеральной совокупности, где каждый ее элемент выбирается случайным образом.

Объем совокупности (генеральной или выборочной) – количество элементов в ней; обозначения: N – объем генеральной совокупности, n – объем выборки. Из определений ГС и В следует, что N > n (как правило, N > 1000,
10 ≤ n ≤ 100).

По аналогии со случайными величинами эмпирические варианты могут быть дискретными и непрерывными. Примерами дискретной варианты является число детей в семье; число клиентов, обратившихся в фирму за определенный промежуток времени, и т. д.; непрерывной – результат измерения роста человека (например, от 160 до 180); урожайность культуры, выращенной в хозяйстве, и т. п.

Пусть x₁, x₂, …, x_n – совокупность случайных значений случайной величины Х, т. е. выборка, тогда данную совокупность х_i называют эмпирическим рядом.

Эмпирический ряд x₁, x₂, …, x_n, представленный в порядке возрастания с перечислением повторяющихся значений (упорядоченная выборка), называется ранжированным вариационным рядом: y₁, y₂, …, y_n (где y₁ ≤ y₂ ≤ … ≤ y_n).

Эмпирический ряд x₁, x₂, …, x_n, представленный в порядке возрастания без повторяющихся значений (ранжированный ряд без повторов), называется дискретным вариационным рядом: α₁, α₂, …, α_m (где α₁ < α₂ <…< α_m). Каждое значение α₁, α₂, …, α_m называется вариантой выборки.

Если в вариационном ряде значения признака заданы в виде интервалов, то такой ряд называют интервальным (например, таблица 7.1).

Значения эмпирического ряда x₁, x₂, …, x_n располагаются в пределах отрезка [x_min; x_max], где x_min – минимальное значение из эмпирического ряда, x_max– максимальное значение из эмпирического ряда.