Средние величины

В результате исследований, связанных с массовыми явлениями, получают много числовых данных. Возникает проблема – найти такие характеристики, которые довольно полно характеризовали бы полученный числовой материал. Характеристики, которые базируются на данных массовых наблюдений, называют обобщающими показателями. Эти показатели характеризуют значения признака, его вариацию. Их вычисляют с помощью вариант и соответствующих частот (относительных частот). Важнейшие среди обобщающих показателей – средние величины, т. е. такие значения признака, вокруг которых группируются отдельные наблюдаемые значения элементов. Отсюда и название – меры центральной тенденции.

Средние величины используются для характеристики эмпирического ряда. Они подразделяют на степенные и структурные. К степенным средним величинам относят: арифметическую, геометрическую, гармоническую, квадратичную средние величины. К структурным – моду и медиану.

Пусть имеется п объектов, для которых измерена некоторая характеристика, и получены значения x1, x2, …, xn.

Средняя степенная отражает величину, варьирующуюся (изменяющуюся) в расчете на единицу всей выборки. Принято различать простые и взвешенные средние величины.

Простая средняя величина применяется в тех случаях, когда каждое значение случайной величины встречается один или одинаковое число раз. Если отдельные значения исследуемой выборки встречаются не один, а много, причем неодинаковое число раз, то рассчитывают среднюю взвешенную величину.

Простая средняя арифметическая – сумма всех значений выборки, деленная на общее количество этих значений:

. (7.6)

Взвешенная средняя арифметическая – средняя из вариант (аi) дискретного вариационного ряда, которые повторяются различное количество раз или имеют разный вес, находится следующим образом:

, (7.7)

где pi – абсолютная частота появления значения аi; m — количество различных значений, которые принимает признак.

Среднее взвешенное можно интерпретировать как среднюю величину для значений а1, а2, …, ат, используемую в ситуациях, когда одни значения более важны по сравнению с другими. Чем больше частота элемента, тем больший вклад вносит этот элемент в значение среднего взвешенного.

Среднее взвешенное можно использовать для оценки неизвестных параметров совокупности, для решения задач, связанных с проверкой гипотез.

Пример 3. Два стрелка сделали по 100 выстрелов. Первый выбил 8 очков 40 раз, 9 очков – 10 раз и 10 очков – 50 раз. Второй выбил 8, 9 и 10 очков соответственно – 10, 60 и 30 раз. Какой из стрелков стреляет лучше?

Решение. Вычислим средние взвешенные арифметические и числа очков, которые выбил при 100 выстрелах каждый из двух стрелков.

; .

Среднее число очков, которое выбивает из 100 выстрелов второй стрелок, несколько выше, чем тот же показатель у первого стрелка. Естественно признать второго стрелка лучшим.

Среднее гармоническое необходимо в том случае, когда наблюдения, для которых мы хотим получить среднее арифметическое, заданы обратными значениями. В общем случае среднее гармоническое значений x1, x2, …, xn определяется по формулам

или . (7. 8)

Средняя гармоническая взвешенная вычисляется, когда нет информации о частоте варианта выборки, а известно их произведение :

. (7. 9)

Средняя гармоническая простая применяется в тех случаях, когда произведенияодинаковы или равны 1.

Пример 4. Первую половину пути турист двигался со скоростью 4 км/ч, а вторую половину – со скоростью 6 км/ч. Какова средняя скорость движения туриста на протяжении всего пути?

;

При определении коэффициента среднего темпа роста, когда необходимо сохранить неизменным произведение каждой величины признака, применят простую геометрическую и взвешенную геометрическую

Среднее геометрическое значение x1, x2, …, xn определяется по формулам:

и . (7.10)

Среднее геометрическое используют прежде всего тогда, когда среднее значение вычисляют для значений, заданных через некоторые равные промежутки времени (рост или снижение успеваемости, вклада в банке за несколько лет и др.); когда переменная с течением времени изменяется примерно с одинаковым соотношением между измерениями, когда отдельные значения в статистической совокупности удалены от других значений.

Среднее степенное k-го порядка определяется по формулам

или . (7.11)

Среднее степенное второго порядка называют средним квадратичным. Среднее арифметическое является степенным средним порядка 1, среднее гармоническое – порядка (–1).

– простая квадратичная; (7.12)

– взвешенная квадратичная. (7.13)

Средняя квадратичная применяется, когда осреднению подлежат величины, выраженные в виде квадратичных функций.

Между величинами степенных средних, рассчитанных по одной и той же совокупности единиц статистического наблюдения и одному и тому же признаку, существует следующее соотношение: .

Структурные средние величины используются для характеристики центральной тенденции изменяющейся случайной величины, уровень случайной величины.

Медиана (Me) – значение случайной величины в ранжированном вариационном ряду, делящая его на две равные части.

Медиана обладает важными свойствами, которые в некоторых случаях дают ей преимущество перед другими средними величинами. Например, если при упорядоченном размещении некоторого признака «крайние» значения сомнительные и к тому же резко отличаются от основной массы данных, то в качестве меры центральной тенденции целесообразно использовать медиану, так как на ее величину эти «крайние» значения никакого влияния не оказывают, и в то же время они могут существенным образом повлиять на значение среднего арифметического.

При нахождении медианы дискретного вариационного ряда следует различать два случая, когда объем совокупности: 1) нечетный; 2) четный.

Если объем совокупности нечетный и равен 2п + 1, и варианты размещены в порядке возрастания их значений:

,

то Ме = хп + 1 (7.14).

Если же количество элементов четное и равно 2п, то нет варианты, которая бы делила совокупность на две равные по объему части:

.

Поэтому в качестве медианы условно берется полусумма вариант, находящихся в середине вариационного ряда:

. (7. 15)

Мода (Mo) – называют наиболее часто встречающееся значение случайной величины в эмпирическом ряду. Если все значения в вариационном ряде встречаются одинаково часто, то считают, что этот ряд не имеет моды.

Если два соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих значений.

Если два не соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что вариационный ряд имеет две моды, а соответствующее распределение называют бимодальным.

Пример 5. Для нахождения медианы необходимо составить ранжированный вариационный ряд:

34, 40, 40, 45,45,45,49,51, 53, 53, 53, 53, 58, 64, 64, 64 70, 72,72,72,72, 81, 85, 85, 90.

Общее количество элементов – 25, число нечетное, поэтому медиана равна числу 58 , которое стоит посередине (на 13-м месте).

Для нахождения моды удобно использовать представление выборки в виде дискретного вариационного ряда (Таблица 7.3). Из таблицы видно, что два не соседних значения вариационного ряда (72 и 53) имеют одинаковую наибольшую частоту 4, значит рассматриваемый ряд – бимодальный.