Существует специальная таблица, позволяющая определять площадь под кривой справа от любого положительного z (приложение 1). Пользуясь ею, можно определить вероятность встречаемости значений признака из любого диапазона. Это широко используется при интерпретации данных тестирования.
ПРИМЕРЫ_______________________________________________________
1. Значение IQ по шкале Векслера (Л/= 100; а = 15) некоторого тестируемого равно 125. Вопрос о степени выраженности интеллекта у данного индивидуума переформулируем следующим образом: насколько часто или редко встречаются значения IQ ниже или выше 125? Решение. Перейдем от шкалы IQ к единицам
ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ
стандартного отклонения (г-значениям): г=(125-100)/15= 1,66. По таблице из приложения 1 находим площадь под кривой справа от этого значения, она равна 0,0485. Это значит, что IQ 125 и выше встречается довольно редко — менее, чем в 5% случаев.
2. Какова вероятность того, что случайно выбранный человек будет иметь 1Q по шкале Векслера в диапазоне от 100 до 120? Решение. В единицах стандартного отклонения Zi =0,0; Zi = 1,66. Площадь справа от Z —0,5, справа от Zj — примерно 0,0918, следовательно, площадь между Z и г2 равна 0,5-0,0918 = 0,4082. Таким образом, вероятность того, что случайно выбранный человек будет иметь IQ в диапазоне от 100 до 120, равна примерно 0,41.
Несмотря на исходный постулат, в соответствии с которым свойства в генеральной совокупности имеют нормальное распределение, реальные данные, полученные на выборке, нечасто распределены нормально. Более того, разработано множество методов, позволяющих анализировать данные без всякого предположения о характере их распределения как в выборке, так и в генеральной совокупности. Эти обстоятельства иногда приводят к ложному убеждению, что нормальное распределение — пустая математическая абстракция, не имеющая отношения к психологии. Тем не менее, как мы увидим в дальнейшем, можно указать по крайней мере на три важных аспекта применения нормального распределения:
1. Разработка тестовых шкал.
2. Проверка нормальности выборочного распределения для принятия ре
шения о том, в какой шкале измерен признак — в метрической или по
рядковой.
3. Статистическая проверка гипотез, в частности — при определении риска
принятия неверного решения.
РАЗРАБОТКА ТЕСТОВЫХ ШКАЛ
Тестовые шкалы разрабатываются для того, чтобы оценить индивидуальный результат тестирования путем сопоставления его с тестовыми нормами, полученными на выборке стандартизации. Выборка стандартизацииспециально формируется для разработки тестовой шкалы — она должна быть репрезентативна генеральной совокупности, для которой планируется применять данный тест. Впоследствии при тестировании предполагается, что и тестируемый, и выборка стандартизации принадлежат одной и той же генеральной совокупности.
Исходным принципом при разработке тестовой шкалы является предположение о том, что измеряемое свойство распределено в генеральной совокупности в соответствии с нормальным законом. Соответственно, измерение в тестовой шкале данного свойства на выборке стандартизации также должно обеспечивать нормальное распределение. Если это так, то тестовая шкала яв-
ГЛАВА 5. НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ И ЕГО ПРИМЕНЕНИЕ
ляется метрической — точнее, равных интервалов. Если это не так, то свойство удалось отразить в лучшем случае — в шкале порядка. Естественно, что большинство стандартных тестовых шкал являются метрическими, что позволяет более детально интерпретировать результаты тестирования — с учетом свойств нормального распределения — и корректно применять любые методы статистического анализа. Таким образом, основная проблема стандартизации теста заключается в разработке такой шкалы, в которой распределение тестовых показателей на выборке стандартизации соответствовало бы нормальному распределению.
Исходные тестовые оценки — это количество ответов на те или иные вопросы теста, время или количество решенных задач и т. д. Они еще называются первичными, или «сырыми» оценками. Итогом стандартизации являются тестовые нормы — таблица пересчета «сырых» оценок в стандартные тестовые шкалы.
Существует множество стандартных тестовых шкал, основное назначение которых — представление индивидуальных результатов тестирования в удобном для интерпретации виде. Некоторые из этих шкал представлены на рис. 5.5. Общим для них является соответствие нормальному распределению, а различаются они только двумя показателями: средним значением и масштабом (стандартным отклонением — о), определяющим дробность шкалы.
ЧАСТЬ I. ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО ОПИСАНИЯ ДАННЫХ
Общая последовательность стандартизации(разработки тестовых норм — таблицы пересчета «сырых» оценок в стандартные тестовые) состоит в следующем:
1) определяется генеральная совокупность, для которой разрабатывается
методика и формируется репрезентативная выборка стандартизации;
2) по результатам применения первичного варианта теста строится рас
пределение «сырых» оценок;
3) проверяют соответствие полученного распределения нормальному за
кону;
4) если распределение «сырых» оценок соответствует нормальному, про
изводится линейная стандартизация;
5) если распределение «сырых» оценок не соответствует нормальному, то
возможны два варианта:
• перед линейной стандартизацией производят эмпирическую норма
лизацию;
• проводят нелинейную нормализацию.
Проверка распределения «сырых» оценок на соответствие нормальному закону производится при помощи специальных критериев, которые мы рассмотрим далее в этой главе.
Линейная стандартизациязаключается в том, что определяются границы интервалов «сырых» оценок, соответствующие стандартным тестовым показателям. Эти границы вычисляются путем прибавления к среднему «сырых» оценок (или вычитания из него) долей стандартных отклонений, соответствующих тестовой шкале. Пример, приведенный ниже, демонстрирует процедуру линейной стандартизации.
ПРИМЕР_______________________________________________________________
Предположим, получено распределение «сырых» оценок, соответствующее нормальному, со средним Мх = 22 и стандартным отклонением ох= 6. В качестве стандартной тестовой шкалы выбрана 10-балльная шкала стенов, предложенная Р. Кет-телом {Mst = 5,5; osl = 2). Результатом линейной стандартизации должна являться таблица пересчета из шкалы «сырых» оценок в шкалу стенов. Для этого каждому стандартному значению ставится в соответствие интервал «сырых» оценок. Границы интервалов определяются следующим образом. Среднее «сырых» оценок должно делить шкалу стенов ровно пополам (1—5 — ниже среднего, 6—10 — выше среднего). Следовательно, среднее «сырых» оценок Мх = 22 — это граница стенов 5 и 6. Следующая граница справа — отделяющая стены 6 и 7 — отстоит от среднего на as,/2. Этой границе должна соответствовать граница «сырых» оценок Мх + ох/2 = 22 + 3 = 25. Так же определяются границы всех оставшихся интервалов, а границы крайних интервалов остаются открытыми. Результатом являются тестовые нормы — таблица пересчета «сырых» баллов в стандартные тестовые оценки (табл. 5.1)1.
1 Обратите внимание, что левая граница каждого диапазона «сырых» оценок исключает границу интервалов, а правая — включает ее. Можно было бы сделать и наоборот, но главное, чтобы границы соседних диапазонов не совпадали, во избежание недоразумений при попадании индивидуального значения на границу интервалов.
ГЛАВА 5. НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ И ЕГО ПРИМЕНЕНИЕ
Табл ица 5.1 Тестовые нормы — таблица пересчета «сырых» баллов в стены
Стены | ||||||||||
«Сырые» баллы | <11 | 11-13 | 14-16 | 17-19 | 20-22 | 23-25 | 26-28 | 29-31 | 32-34 | >34 |
Пользуясь этой таблицей тестовых норм индивидуальный результат («сырой» балл) переводят в шкалу стенов, что позволяет интерпретировать выраженность измеряемого свойства.
В общем случае границы интервалов определяются по формуле г-преоб-разования: