Тест. Критерии качества теста

Шкала – это основа инструмента измерения, в качестве которого в психологии выступает тест. Тест (англ. test – проба, испытание, проверка) – фиксированное во времени, стандартизированное испытание, предназначенное для установления количественных (и качественных) индивидуально-психологических различий[32]. Родоначальником тестирования считается Д. Кеттелл, однако впервые этот метод был крупномасштабно применен Ф. Гальтоном, которого называют Галилеем психологического тестирования.

Качество психологического измерительного инструмента (теста) и достоверность результатов измерения обеспечивается такими необходимыми характеристиками как надежность и валидность теста.

Надежность теста – один из критериев его качества, относящийся к точности психологических измерений. Чем более надежен тест, тем относительно свободнее он от погрешностей измерения. Проверка надежности теста – это процедура, посредством которой определяется согласованность измерений. Принято выделять несколько видов надежности. Во-первых, о согласованности измерений судят путем сопоставлений между собой некоторого множества независимых пунктов, относящихся к одной и той же шкале (тесту). Во-вторых, о надежности измерений судят по устойчивости результатов при повторных измерениях (через 2 недели, месяц, год). В-третьих, надежность обеспечивается привлечением к измерениям независимых наблюдателей (экспертов). Измерения считаются надежными, если два или более независимых наблюдателей дают согласованные оценки в отношении одного и того же события (явления).

Валидность теста – (англ. valid – действительный, пригодный, имеющий силу) критерий качества, «…указывающий нам, что тест измеряет и насколько хорошо он это делает»[33]. Проверка валидности теста это процедура, посредством которой определяется «истинность» измерений инструмента. «Истинным» считается измерение, если оно дает информацию о том, на измерение чего оно претендует. Главные критерии истинности измерений инструмента заключаются в следующем. Во-первых, предмет измерений должен соответствовать эмпирическому понятию, с позиций которого проводятся измерения (конструктная валидность). Во-вторых, выделенная процедура измерения должна быть согласована с другими процедурами измерения того же эмпирического понятия (внешняя валидность). В-третьих, степень согласованности выделенной процедуры измерения с другими процедурами измерения того же эмпирического понятия должна быть достаточно высокой (степень валидности).

РЕЗЮМЕ

Возможность тех или иных подсчетов по результатам исследования будет зависеть от используемой шкалы измерения: номинативной, порядковой, интервальной или отношений. Каждая шкала допускает одни математические процедуры и не допускает другие. Шкалы можно упорядочить от более слабых к более сильным, где характеристики «слабость» и «сила» шкалы означают доступные математические вычисления. Номинативная – самая слабая шкала, отношений – самая сильная.

Один и тот же психологический конструкт может быть измерен в разных шкалах. Это будет зависеть от того, как операционализировался данный конструкт в данном исследовании. Например, при изучении экзаменационной тревожности возможны варианты. Если требуется указать степень своей тревожности по 5-бальной шкале, то это порядковая шкала измерений. Если операциональное определение тревожности включает показатель по стандартизованному тесту тревожности, результаты должны интерпретироваться как интервальные. Если тревожность операционализирована как увеличение потоотделения на отдельных участках тела и была использована специальная аппаратура, позволяющая оценить работу потовых желез в определенных единицах, то работает шкала отношений.

Распознавание шкалы измерения – необходимый навык исследователя, без которого будет затруднен выбор подходящих математических вычислений для обработки полученных данных.