рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ - раздел Психология, Математические методы психологического исследования. Анализ и интерпретация данных. Учебное пособие К Первичным Описательным Статистикам {Descriptive Statistics) Обычно О...

К первичным описательным статистикам {Descriptive Statistics) обычно от­носят числовые характеристики распределения измеренного на выборке при­знака. Каждая такая характеристика отражает в одном числовом значении свой­ство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основ­ное назначение каждой из первичных описательных статистик — замена мно­жества значений признака, измеренного на выборке, одним числом (напри­мер, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпрети­ровать результаты измерений, в частности, путем сравнения первичных ста­тистик разных групп.

МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Мера центральной тенденции{Central Tendency) — это число, характеризую­щее выборку по уровню выраженности измеренного признака.

Существуют три способа определения «центральной тенденции», каждо­му из которых соответствует своя мера: мода, медиана и выборочное среднее.

Мода{Mode) — это такое значение из множества измерений, которое встре­чается наиболее часто. Моде, или модальному интервалу признака, соответ­ствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным.

ПРИМЕР_______________________________________________________________

Среди 8 значений признака (3, 7, 3, 5, 7, 8, 7, 6) мода Мо = 7 как наиболее часто встречающееся значение. В табл. 3.2 предыдущего параграфа Мо = 3, а в табл. 3.3 модальным является интервал 50—54.


ГЛАВА 4. ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

Когда два соседних значения встречаются одинаково часто и чаще, чем любое другое значение, мода есть среднее этих двух значений.

Распределение может иметь и не одну моду. Когда все значения встреча­ются одинаково часто, принято считать, что такое распределение не имеет моды.

Бимодальное распределение имеет на графике распределения две вершины, даже если частоты для двух вершин не строго равны. В последнем случае вы­деляют большую и меньшую моду. Во всей группе может быть и несколько локальных вершин распределения частот. Тогда выделяют наибольшую моду и локальные моды.

Еще раз отметим, что мода — это значение признака, а не его частота.

Медиана{Median) — это такое значение признака, которое делит упорядо­ченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая — больше. Таким обра­зом, первым шагом при определении медианы является упорядочивание (ран­жирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:

□ если данные содержат нечетное число значений (8, 9, 10, 13, 15), то ме­
диана есть центральное значение, т. е. Md= 10;

□ если данные содержат четное число значений (5, 8, 9, 11), то медиана
есть точка, лежащая посередине между двумя центральными значения­
ми, т. е. М/=(8+9)/2 = 8,5.

Среднее(Mean) (Мхвыборочное среднее, среднее арифметическое) — определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений.

Если некоторый признак X измерен в группе испытуемых численностью N, мы получим значения: хи х2, ..., xh ..., xN (где / — текущий номер испытуе­мого, от 1 до N). Тогда среднее значение Мх определяется по формуле:

Мх= — Ух,. (4.1)

Свойства среднего.Если к каждому значению переменной прибавить одно и то же число с, то среднее увеличится на это число (уменьшится на это чис­ло, если оно отрицательное):

1 N
^(*,+O=-^-I>;+c) = Mx+c. (4.2)

А если каждое значение переменной умножить на одно и то же число с, то среднее увеличится в с раз (уменьшится в с раз, если делить на с):

M(XrC)=^i(xrc)=Mx-c. (4.3)

Далее мы неоднократно будем обращаться к такой величине, как отклоне­ние от среднего: (*,•— Мх). Из первого, очевидного свойства среднего следует


ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ

еще одно важное свойство, не столь очевидное: сумма всех отклонений от сред­него равна нулю:

£(*,.-Л/х) = 0. (4.4)

Соответственно, среднее отклонение от среднего также равно 0.

ВЫБОР МЕРЫ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

Каждая мера центральной тенденции обладает характеристиками, кото­рые делают ее ценной в определенных условиях.

Для номинативных данных, разумеется, единственной подходящей мерой центральной тенденции является мода, или модальная категория — та града­ция номинативной переменной, которая встречается наиболее часто.

Для порядковых и метрических переменных, распределение которых уни­модальное и симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от симметричности, тем больше расхождение между значениями этих мер центральной тенденции. По этому расхождению можно судить о том, насколько симметрично или асимметрично распределение.

Наиболее очевидной и часто используемой мерой центральной тенденции является среднее значение. Но его использование ограничивается тем, что на величину среднего влияет каждое отдельное значение. Если какое-нибудь зна­чение в группе увеличится на с, то среднее увеличится на c/N. Таким образом, среднее значение весьма чувствительно к «выбросам» — экстремально малым или большим значениям переменной.

На величину моды и медианы величина каждого отдельного значения не влияет. Например, если в группе из 20 измерений переменной наибольшее значение утроится по величине, то не изменится ни мода, ни медиана. Вели­чина среднего при этом заметно изменится. Иначе говоря, мода и медиана не чувствительны к «выбросам».



Их средний доход -1000$ в месац...

ПРИМЕР

Если 9 человек имеют месячный доход от 5000 до 6000 рублей, со средним 5600 руб­лей, а доход десятого составляет 15000 руб­лей, то средний доход для этих 10 человек составит 6540 рублей. Эта цифра не позво­ляет судить о всей группе, и в качестве меры центральной тенденции следовало бы из­брать медиану или моду.



ГЛАВА 4. ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

Меры центральной тенденции чаще всего используются для сравнения групп по уровню выраженности признака. Если исследователь при этом со­мневается, какую меру использовать, то можно дать простые советы.

Выборочные средние можно сравнивать, если выполняются следующие условия:

□ группы достаточно большие, чтобы судить о форме распределения;

□ распределения симметричны;

□ отсутствуют «выбросы».

Если хотя бы одно из перечисленных условий не выполняется, то следует ограничиться модой и медианой. Альтернативой является «сквозное» ранжи­рование представителей сравниваемых групп и сравнение средних, вычис­ленных для рангов этих групп.

КВАНТИЛИ РАСПРЕДЕЛЕНИЯ

Помимо мер центральной тенденции в психологии широко используются меры положения, которые называются квантилями распределения. Кван­тиль— это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным соотно­шением их численности. С одним из квантилей мы уже знакомы — это меди­ана. Это значение признака, которое делит всю совокупность измерений на две группы с равной численностью. Кроме медианы часто используются про-центили и квартили.

Процентили(Percentiles) — это 99 точек — значений признака и ..., Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности. Определение конкретного значения про-центиля аналогично определению медианы. Например, при определении 10-го процентиля, Р10, сначала все значения признака упорядочиваются по возрас­танию. Затем отсчитывается 10% испытуемых, имеющих наименьшую выра­женность признака. Р будет соответствовать тому значению признака, кото­рый отделяет эти 10% испытуемых от остальных 90%.

Квартили(Quartiles) — это 3 точки — значения признака (P2i, Pi0, P75), ко­торые делят упорядоченное (по возрастанию) множество наблюдений на 4 рав­ные по численности части. Первый квартиль соответствует 25-му проценти-лю, второй — 50-му процентилю или медиане, третий квартиль соответствует 75-му процентилю.

Процентили и квартили используются для определения частоты встречае­мости тех или иных значений (или интервалов) измеренного признака или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.


ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ

МЕРЫ ИЗМЕНЧИВОСТИ

Меры центральной тенденции отражают уровень выраженности измерен­ного признака. Однако не менее важной характеристикой является выражен­ность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости (Dispersion) применяются в психологии для численного выраже­ния величины межиндивидуальной вариации признака.

Наиболее простой и очевидной мерой изменчивости является размах, ука­зывающий на диапазон изменчивости значений. Размах (Range) — это просто разность максимального и минимального значений:

Ясно, что это очень неустойчивая мера изменчивости, на которую влияют любые возможные «выбросы». Более устойчивыми являются разновидности размаха: размах от 10 до 90-го процентиля (Р90 Р10) или междуквартильный размах (Р75 — P2s)- Последние две меры изменчивости находят свое примене­ние для описания вариации в порядковых данных. А для метрических данных используется дисперсия — величина, название которой в науке является си­нонимом изменчивости.

Дисперсия(Variance) — мера изменчивости для метрических данных, про­порциональная сумме квадратов отклонений измеренных значений от их арифметического среднего:

Чем больше изменчивость в данных, тем больше отклонения значений от среднего, тем больше величина дисперсии. Величина дисперсии получается

при усреднении всех квадратов отклонении:

N


N


(4.5)


Следует отличать теоретическую (генеральную) дисперсию — меру измен­чивости бесконечного числа измерений (в генеральной совокупности, попу­ляции в целом) и эмпирическую, или выборочную, дисперсию — для реально измеренного множества значений признака. Выборочное значение в стати­стике используется для оценки дисперсии в генеральной совокупности. Выше указана формула для генеральной (теоретической) дисперсии (Dx), которая, понятно, не вычисляется. Для вычислений используется формула выбороч­ной (эмпирической) дисперсии (Dx), отличающаяся знаменателем:


N-X


(4.6)



ГЛАВА 4. ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

ПРИМЕР

Вычислим дисперсию признакаХдля выборки N= 6:




 


 




 


На практике чаще используется именно стандартное отклонение, а не дис­персия. Это связано с тем, что сигма выражает изменчивость в исходных еди­ницах измерения признака, а дисперсия — в квадратах исходных единиц.

Свойства дисперсии:

1. Если значения измеренного признака не отличаются друг от друга (рав­
ны между собой) — дисперсия равна нулю. Это соответствует отсутствию из­
менчивости в данных.

2. Прибавление одного и того же числа к каждому значению переменной
не меняет дисперсию:

Dx + C = Dx, так как X [(*,■+с) - х+с)]2 = Х(х,-- Мх)2.

Рис. 4.1. Графики распределения частот: с разной дисперсией (D^Dj), одинаковой дисперсией (D2= D}) и разными средними арифметическими 21)


ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ

Прибавление константы к каждому значению переменной сдвигает график распределения этой переменной на эту константу (меняется среднее), но из­менчивость (дисперсия) при этом остается неизменной.

3. Умножение каждого значения переменной на константу с изменяет дис­персию в с2 раз:

При объединении двух выборок с одинаковой дисперсией, но с разными средними значениями дисперсия увеличивается.

ПРИМЕР______________________________________________________________

Если одна группа содержит значения: 1,1,1,1, 1, а другая группа —значения 3,3, 3, 3, 3, то дисперсии этих групп одинаковы и равны 0. Если же объединить эти две группы, то дисперсия будет равна не 0, а 1.

Вообще говоря, справедливо утверждение: при объединении двух групп к внутригрупповой дисперсии каждой группы добавляется дисперсия, обуслов­ленная различием между группами (их средними). И чем больше различие между средними значениями, тем больше увеличивается дисперсия объеди­ненных групп.

Стандартизацияили z-преобразование данных — это перевод измерений в стандартную Z-шкалу (Z-scores) со средним Mz = О и Dz (или аг) = 1. Сначала для переменной, измеренной на выборке, вычисляют среднее Мх стандарт­ное отклонение х. Затем все значения переменной х, пересчитываются по формуле:

(4.8)

В результате преобразованные значения (^-значения) непосредственно выражаются в единицах стандартного отклонения от среднего. Если для од­ной выборки несколько признаков переведены в ^-значения, появляется воз­можность сравнения уровня выраженности разных признаков у того или иного испытуемого. Для того чтобы избавиться от неизбежных отрицательных и дробных значений, можно перейти к любой другой известной шкале: IQ (сред­нее 100, сигма 15); Т-оценок (среднее 50, сигма 10); 10-балльной — стенов (среднее 5,5, сигма 2) и др. Перевод в новую шкалу осуществляется путем умножения каждого г-значения на заданную сигму и прибавления среднего:

(4.9)

Асимметрия (Skewness) степень отклонения графика распределения час­тот от симметричного вида относительно среднего значения. Если исходные данные переведены в ^-значения, показатель асимметрии вычисляется по формуле:


As = -


N


(4.10)




 


 




 


X X

Рис.4.2. Распределения частот с разными значениями асимметрии и эксцесса

Для симметричного распределения асимметрия равна 0. Если чаще встре­чаются значения меньше среднего, то говорят о левосторонней, или положи­тельной асимметрии (As > 0). Если же чаще встречаются значения больше сред­него, то асимметрия — правосторонняя, или отрицательная (As<0). Чем больше отклонение от нуля, тем больше асимметрия.

Эксцесс(Kurtosis) — мера плосковершинности или остроконечности гра­фика распределения измеренного признака. Если исходные данные переве­дены в ^-значения, показатель эксцесса определяется формулой:


(4.11)

 

 

Островершинное распределение характеризуется положительным эксцес­сом (Ех > 0), а плосковершинное — отрицательным (-3 < Ех < 0). «Средневер-шинное» (нормальное) распределение имеет нулевой эксцесс (Ех = 0).

Задачи и упражнения

1. По результатам измерения общительности у юношей (1) и девушек (2)
были построены сглаженные графики распределения частот (рис. 4.3).

2. Определите по графику: а) как различаются средние Мх и М2; б) как раз­
личаются дисперсии D{ и /)2?

3. Вычислите дисперсии для двух групп:

Какой будет дисперсия 8 значений, полученных путем объединения групп? Объясните полученный результат.


ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ

– Конец работы –

Эта тема принадлежит разделу:

Математические методы психологического исследования. Анализ и интерпретация данных. Учебное пособие

Рецензенты В М А иахвердов доктор психологических наук профессор кафедры... общей психологии СПбГУ... В М Буре кандидат физико математических наук доцент факультета приклаnдной математики процессов управления...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ПЕРВИЧНЫЕ ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ
Глава 1. Генеральная совокупность и выборка......................................... 19 Глава 2. Измерения и шкалы.................................................................. ...23

МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА: ПРОВЕРКА ГИПОТЕЗ
Глава 7. Введение в проблему статистического вывода.......................... 93 Глава 8. Выбор метода статистического вывода.................................... 111 Глава 9. Анал

Часть III МНОГОМЕРНЫЕ МЕТОДЫ И МОДЕЛИ
Глава 14. Назначение и классификация многомерных методов............. 235 Глава 15. Множественный регрессионный анализ.................................. 240 Глава 16. Факторный ан

ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ И ВЫБОРКА
Исследование обычно начинается с некоторого предположения, требую­щего проверки с привлечением фактов. Это предположение — гипотеза — формулируется в отношении связи явлений или свойств в некоторой

ИЗМЕРЕНИЯ И ШКАЛЫ
ЧТО ТАКОЕ ИЗМЕРЕНИЕ Любое эмпирическое научное исследование начинается с того, что иссле­дователь фиксирует выраженность интересующего его свойства (или свойств) у объекта или объектов исс

ТАБЛИЦЫ И ГРАФИКИ
ТАБЛИЦА ИСХОДНЫХ ДАННЫХ Обычно в ходе исследования интересующий исследователя признак изме­ряется не у одного-двух, а у множества объектов (испытуемых). Кроме того, каждый объект характери

Зависимость распределения оставленных и полученных открыток от их содержания
Конечно, таблицы сопряженности могут включать номинативные призна­ки, имеющие и более двух градаций. На

НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ И ЕГО ПРИМЕНЕНИЕ
Нормальный закон распределения играет важнейшую роль в применении численных методов в психологии. Он лежит в основе измерений, разработки тестовых шкал, методов проверки гипотез. История п

Всех случаев располагается в диапазоне значений М+ 2,58с.
Существует специальная таблица, позволяющая определять площадь под кривой справа от любого положительного z (приложение 1). Пользуясь ею, можно определить вероятность встречаемости значений

K/f с/ .— A/f /т
о z = - о где Xj — искомая граница интервала «сырых» оценок, stt — граница интервала в стандартн

КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ
В главе 4 мы рассмотрели основные одномерные описательные статисти­ки — меры центральной тенденции и изменчивости, которые применяются для описания одной переменной. В этой главе мы рассмотрим

Lt; о) < а] .
По сути, дисперсия оценок зависимой переменной У— это та часть ее пол­ной дисперсии, которая обусловлена влиянием независимой переменной X. Неизвестную дисперсию оценок У

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги