рефераты конспекты курсовые дипломные лекции шпоры

Раздел Образование
/
ВАЛИДНОСТЬ ТЕСТОВ

Реферат Курсовая Конспект

Выберите учебное заведение

ВАЛИДНОСТЬ ТЕСТОВ

ВАЛИДНОСТЬ ТЕСТОВ - раздел Образование, ОБЩАЯ ПСИХОДИАГНОСТИКА Проблемы Валидизации Психологических Тестов Являются Централ...

Проблемы валидизации психологических тестов являются центральными для дифференциальной психометрики, но, к сожалению, до сих пор решенными не до конца. Решение этой проблемы зависит не от статистического аппарата, а от уровня развития теоретического аппарата дифференциальной психологии.

Валидность и надежность. Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, т, е. относительно предмета измерения. Отличие понятия валидности от надежности измерения удобно раскрывать с помощью различения «объекта» и «предмета» измерения. Надежность - это устойчивость процедуры относительно объектов. Надежность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предлагает определенную процедуру измерения, показывает ее надежность -способность устойчиво различать объекты, но вопрос о валидности остается открытым.

Если в сенсорной психофизике вопрос о валидности измерений оказывается в значительной степени затушеванным тем обстоятельством, что простейшие физические стимулы достаточно однозначно детерминируют измеряемые свойства ощущений, то в дифференциальной психометрике значимость проблемы валидности резко возрастает. Здесь ситуация подобна той, когда в психофизическом опыте испытуемому не указывают, по какому именно параметру следует сравнивать стимулы. Пусть испытуемый А понял инструкцию так, что стимульные объекты надо сравнивать по весу, а испытуемый Б - по размеру. Если процедура измерения будет повторена по отношению к тем же объектам, то она даст вполне устойчивые данные относительно объектов, но не даст валидной информации ни о шкале ощущений «веса», ни о шкале ощущений «размера».

При измерении способностей предъявляемый тест отнюдь не обязательно актуализирует именно тот психический процесс, который предполагается измерить. Например, столкнувшись с уже встречавшейся однажды задачей (например, с анаграммой «дзиканпр»), испытуемый может начать запоминать просто то решение, к которому он уже однажды пришел (слово «праздник»), чем заново решать эту задачу. Здесь будет измеряться скорее уровень словесной памяти, чем уровень вербального интеллекта. Точно так же реальная валидность некоторых тестов раскрывается только в результате значительного опыта работы с ними. Например, доказано, что ряд тестов, внешне вы глядящих интеллектуальными, на деле измеряют скорее личностно-стилевые особенности индивида, чем операциональные возможности интеллекта, например, методика «креативного поля» Д. Б. Богоявленской.

Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надежность является необходимым, но не достаточным условием валидности. Отсюда вытекает основное соотношение психометрики:

валидность ≤ надежность.

Это означает, что валидность теста не может превышать его надежность.

Данное соотношение, однако, неверно трактовать как указание на прямую пропорциональную связь валидности и надежности. Повышение надежности отнюдь не обязательно приводит к повышению валидности[15]. В терминах А. Анастази валидность определяется репрезентативностью теста относительно измеряемой области поведения. Если эта область поведения складывается из разнообразных феноменов, то содержательная валидность теста автоматически требует представленности в нем моделей всех этих разнообразных феноменов. Возьмем глобальное понятие «речевая способность» (этому психолингвистическому термину в традиционной тестологии соответствует термин «вербальный интеллект»). Сюда относятся такие относительно независимые друг от друга навыки, как навыки письма и чтения. Если заботиться о содержательной валидности соответствующего теста, то нужно ввести в него группы заданий на проверку этих довольно разных по своему операциональному составу компонентов вербального интеллекта. Вводя разнородные пункты и субшкалы (субтесты), мы обязательно сокращаем внутреннюю согласованность, одномоментную надежность теста, но зато добиваемся существенного повышения валидности. Таким образом, для расширения области применения теста психодиагност должен избегать излишнего повышения внутренней согласованности. Одновременно с этим снижением внутренних корреляций между различными пунктами теста (об этом уже говорилось в разделе 3.1) обязательно исчезает отрицательный эксцесс на кривой распределения тестовых баллов, и она все более приближается по форме к нормальной кривой.

Эмпирическая валидность. Если в случае с содержательной ва-лидностью оценка теста производится за счет экспертов (устанавливающих соответствие заданий теста содержанию предмета измерения), то эмпирическая валидность измеряется всегда с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений - баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Прагматические традиции западной тестологии привязывали эмпирическую валидность теста к внешним для психологии социально-прагматическим критериям. Эти критерии являются показателями, обладающими непосредственной ценностью для определенных областей практики. Практика всегда имеет целью либо повысить, либо понизить эти показатели. Например, в области педагогической психологии это «успеваемость» (которую надо повысить), в психологии труда это «производительность труда» и «текучесть кадров», в медицине - «состояние здоровья пациента», в психологии управления -«совместимость», «срабатываемость» коллектива, в юридической психологии - «преступность» (которую надо понизить) и т. п.

Ориентируясь непосредственно на эти категории, психолог, пытающийся скоррелировать результаты теста с этими показателями, фактически решает сразу две задачи: задачу измерения валидности и задачу измерения практической эффективности своей психодиагностической программы. Если получен значимый коэффициент корреляции, то можно считать, что решены с позитивным результатом сразу обе эти задачи. Но если корреляции не обнаружено, то остается неопределенность: либо невалидна сама процедура (тестовый балл не отражает, например, стрессоустойчивость оператора), либо неверна гипотеза о наличии причинно-следственной связи между психическим свойством и социально значимым показателем (стрессоустойчивость не влияет на процент аварийных ситуаций).

Таким образом, социально-прагматические критерии являются комплексными: они позволяют измерить валидность-эффективность, но не каждое из этих двух свойств теста отдельно. На практике психолога часто ожидает и еще более сложная ситуация, когда заказчик требует от психолога на основании полученного диагноза сразу же определенных мер по вмешательству в ситуацию (отбор, консультирование, обучение и т. п.). В этом случае повышение показателей (достоверное по сравнению с контрольной группой) доказывает одновременно и валидность-эффективность диагностики, и эффективность самого вмешательства. А отрицательный результат дает еще большую неопределенность, так как оказывается невозможным отделить неэффективность вмешательства от низкой валидности диагностики.

Ориентация на социально-прагматические критерии, приводящие к склейке понятий «валидности измерения» и «причинного прогноза по результатам измерения», бесспорно, сдерживала и продолжает сдерживать развитие концептуального аппарата дифференциальной психологии. При этом суть самого предмета измерения: измеряемого психического свойства - оказывается вне фокуса внимания не только заказчика, но и самого психолога, превращающегося в этом случае в тестолога, которого не интересует, что именно он измеряет, главное лишь, чтобы от этого «нечто» перекидывался мостик к полезному эффекту, обеспечивающему психологу социальное признание.

Процедура эмпирической валидизации. Организация выборки при эмпирической валидизации зависит от временного статуса критерия. Если этот критерий - событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании достаточно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию[16]. В результате применяется метод экстремальных (контрастных) групп. Коррелирование с суммарным баллом по тесту оценивается с помощью бисериального коэффициента по формуле (3.2.17). При этом в статусе дихотомической переменной (на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» группой по критерию; - стандартная ошибка критерия, связанная с численностью «высокой» (р) и «низкой» (q) групп.

Если критерий - будущее событие (проспективная валидизация), то выборка должна быть составлена с запасом - с учетом вероятного объема экстремальных групп в будущем. Например, нужно выяснить, позволяет ли диагностика темперамента прогнозировать повышенный риск психосоматических заболеваний (гипертония, язва, астма и т. п.). Пусть на основании эпидемиологических исследований известно, что в течение трех лет из. 1000 здоровых людей этими болезнями заболевают 57 человек. Это означает, что превентивной (предупреждающей) диагностикой должно быть охвачено около 2000 человек, чтобы получить численность «высокой» группы (заболевших) порядка 100 человек. Проспективная валидизация выявляет прогностическую эффективность диагностической процедуры. Высокая прогностическая валидность доказывает как валидность самого измерения, так и наличие предполагаемой причинной связи.

Ретроспективная валидизация позволяет в лучшем случае решить только первую из двух задач. Например, если для исследования личностной предрасположенности к совершению краж проведено обследование лиц, находящихся под следствием (т. е. уже совершивших преступление), то выявление акцентированных черт «тревожности», «агрессивности» и т. п. еще не может интерпретироваться как свидетельство причинных факторов преступности - эти черты могут быть лишь следствием сложившихся обстоятельств: лишение свободы, угрызения совести и т. п. (Ратинов А. Р., 1979). Во многих медико-психологических исследованиях был выделен особый диагностический синдром «госпитализации», который обнаруживается у любой категории госпитализированных больных (обычно он выражается в повышении шкал «депрессии» и «ипохондрии» по MMPI – Шхвацабая, 1980). Очевидно, что подобные личностные сдвиги никак нельзя интерпретировать в смысле симптомов предрасположенности к определенным психогенным заболеваниям, ибо они относятся к следствиям, а не к причинам этих заболеваний.

Конструктная валидность. В отличие от прагматической валидизации собственно психологическую валидизацию порой оказывается провести гораздо труднее в силу отсутствия какого-либо более объективного внутрипсихологического критерия, чем сам тест.

Наиболее благополучная ситуация имеется тогда, когда для измерения данного свойства в психологии уже имеется процедура с известной валидностью. В этом случае корреляция между баллами двух тестов - линейная (см. формулу 3.2.3) или ранговая (см. формулу 3.2.5)- указывает на то, обладает ли новый тест конвергентной валидностью по отношению к старому. Если новый тест обнаруживает высокую конвергентность результатов со старым и одновременно оказывается более компактным и экономичным 'в проведении и подсчете, то психодиагносты получают возможность использовать новый тест вместо старого.

Однако во многих случаях для измеряемого свойства психодиагност не может найти в литературе ни одного уже апробированного теста с известной валидностью. В этом случае он может сформулировать ряд предсказательных гипотез о том, как будет коррелировать его новый тест с другими тестами, измеряющими родственные характеристики испытуемых. Эти гипотезы выдвигаются на основе теоретических представлений об измеряемом свойстве. Их подтверждение указывает на валидность выдвигаемого конструкта, т. е. на конструктную валидность теста. В западной литературе это операциональное определение конструктяой валыидности называется предполагаемой валидностью (assumed validity).

Представления о конструктной валидности тестов постоянно развиваются с пополнением репертуара методик. Эмпирические исследования взаимосвязей результатов, получаемых с помощью разных методик, обогащают теоретические представления об измеряемых свойствах.

С другой стороны, понятие конструктной валидности указывает на высокую зависимость эмпирических связей теста от теоретических представлений его автора об измеряемом свойстве. Для иллюстрации приведен пример взаимоотношений между двумя популярными тест-опросниками: MAS Ж. Тейлор и EPI Г. Айзенка. Многочисленные корреляционные исследования, проведенные на репрезентативных выборках, показали, что шкала MAS (тревожность) Ж. Тейлор положительно коррелирует со шкалой «нейротизм» и отрицательно со шкалой «экстраверсия» Айзенка. Эти соотношения можно проиллюстрировать графически (рис. 10): вектор MAS оказывается расположенным в квадранте «Нейротизм - Интроверсия», образованном системой из ортогональных (статистически независимых) факторов EPL С точки зрения концепции Г. Айзенка, эти данные можно рассматривать как свидетельства низкой валидности шкалы Ж. Тейлор: MAS коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой точки зрения, опросник EPI оказывается просто нечувствительным к особой разновидности «нейротизма» - к нейротизму (тревожности) экстравертов; в перечне пунктов MAS отсутствуют высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с точки зрения тоготеоретического смысла, который приписывают показателям MAS К. Спенс и Ж. Тейлор, эта ситуация вполне закономерна, желательна и никак не является артефактом - следствием дефекта их диагностического средства. Согласно К. Спенсу, пытавшемуся перенести на человеческое поведение теорию научения Халла, MAS измеряет общий уровень драйва - неспециализированного побуждения, которое достигает максимума как раз при сочетании нейротизма (специфическая активация по Г. Айзенку) и интро-версии (неспецифическая активация)

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

ОБЩАЯ ПСИХОДИАГНОСТИКА

ОБЩАЯ ПСИХОДИАГНОСТИКА... РЕЧЬ... Санкт Петербург Общая психодиагностика СПб Изд во Речь стр...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ВАЛИДНОСТЬ ТЕСТОВ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

НАУЧНАЯ ПСИХОДИАГНОСТИКА И ПСИХОДИАГНОСТИЧЕСКАЯ ПРАКТИКА
Психодиагностика - и теоретическая дисциплина, и сфера практической деятельности психолога. Как теоретическая дисциплина общая психодиагностика рассматривает закономерности вынесения вал

ПСИХОДИАГНОСТИЧЕСКИЕ ЗАДАЧИ
Общая психодиагностика в известной степени отвлекается от специфических диагностических задач, возникающих в различных частных областях психодиагностики. Однако психодиагност должен представлять

ДИФФЕРЕНЦИАЛЬНАЯ ПСИХОМЕТРИКА
Термин «дифференциальная психометрика» в данной книге обозначает науку о дифференциально-психологических измерениях. Дифференциальную психометрику целесообразно отличать от «общей психометрики» (

НОРМАТИВНЫЕ ПРЕДПИСАНИЯ РАЗРАБОТЧИКАМ И ПОЛЬЗОВАТЕЛЯМ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК
Развертывание практической работы психологов в различных сферах производства, медицины, образования, требующих применения психодиагностических методик, остро ставит вопрос о нормативном регулиров

Требования к методикам
Целесообразно придерживаться разных требований к психодиагностическим методикам разного типа. 1. Измерительные методы (тесты) должны удовлетворять следующим требованиям: а) долж

Требования к пользователям
К пользователям, являющимся профессиональными психологами, и к пользователям-непсихологам предъявляются разные требования. Пользователь-психолог: а) должен знать и применять на практике об

Использование методик специалистами-смежниками
Отдельные, хорошо теоретически и психометрически обоснованные методики, не требующие специальных знаний при интерпретации, могут использовать специалисты смежных с психологией областей: учителя,

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ
Предыстория тестов уходит в глубину веков, она связана с испытаниями различных способностей, знаний, умений и навыков. Сообщается, что уже в середине III тысячелетия до н. э. в Древнем Вавилоне

ИЗ ИСТОРИИ ПРОЕКТИВНОГО МЕТОДА
Проективные методики представляют собой специфическую, довольно неоднородную группу психодиагностических приемов клинической ориентации. Последнее означает не столько направленность проективных м

ИЗ ИСТОРИИ КОНТЕНТ-АНАЛИЗА КАК ПСИХОДИАГНОСТИЧЕСКОЙ ПРОЦЕДУРЫ
В современной отечественной психодиагностике контент-анализ, вообще качественно-количественное изучение документов, применяется крайне редко по сравнению со всевозможными тестами, проективными ме

РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
Основные статистические принципы построения тестов достаточно полно освещены в появившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике (Аванесо

Нормально распределенного диагностического параметра X
Операции по анализу распределения тестовых баллов, построению тестовых норм и проверке их репрезентативности. Завершая этот раздел, кратко перечислим действия, которые последовател

НАДЕЖНОСТЬ ТЕСТА
В дифференциальной психометрике проблемы валидности и надежности тесно взаимосвязаны, тем не менее мы последуем традиции раздельного изложения методов проверки этих важнейших психометрических свой

ТЕХНОЛОГИЯ СОЗДАНИЯ И АДАПТАЦИИ МЕТОДИК
Рассматривая в предыдущем разделе вопрос о порядке проверки валидности, мы вплотную подошли к вопросу о целостной стратегии создания, эмпирической апробации и внедрения методики в практику.

ПРОГНОЗИРОВАНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ
Кардинальное значение для психодиагностики имеет проблема прогнозирования. Существует точка зрения, разделяющая психодиагностику и так называемую психопрогностику (Забродин Ю. М., 1984). Это указы

ТРЕБОВАНИЯ К ПСИХОМЕТРИЧЕСКОЙ ПОДГОТОВКЕ ПСИХОЛОГА
Для эффективного развития практической психодиагностики сегодня требуется резкое повышение психометрической культуры всех психологов, использующих измерительные психодиагностические методики. Мето

Черты личности
Один и тот же тестовый балл (точка на векторе X) может быть получен при разном соотношении уровней регуляции (подсистем) О, S, Р - организмического, социального и личностного. Один и тот же балл X’

ОБЪЕКТ И МЕТОДЫ
Актуальность работ по психологической диагностике способностей определяется в первую очередь большой практической значимостью этой проблемы. Существующее в обществе разделение труда, продолжающая

ТЕСТ АМТХАУЭРА
Групповой тест Амтхауэра предназначается для оценки структуры интеллекта лиц в возрасте от 13 до 61 года (Amthauer R., 1953). Автор ставил перед собой задачу разработать такой метод, который мог

ОБЛАСТИ ПРИМЕНЕНИЯ ТЕСТОВ СПОСОБНОСТЕЙ
Традиционное применение тестов способностей состоит в использовании их для прогноза будущей успешности претендентов при выборе определенной профессии. Зарубежные психологи исходили из того, что н

ОБЪЕКТ И МЕТОДЫ
Мотивация занимает ведущее место в структуре личности и является одним из основных понятий, которое используется для объяснения движущих сил поведения, деятельности. Процесс теоретического осмыс

ИЗМЕРЕНИЕ МОТИВАЦИИ ДОСТИЖЕНИЯ
В результате многолетних исследований, проведенных большой группой исследователей, не только разработана одна из наиболее достоверных теорий мотивации, но и создан - на основе этой теории валидный

ОПРОСНИК ДЛЯ ИЗМЕРЕНИЯ ПОТРЕБНОСТИ В ДОСТИЖЕНИИ
Существующие методики измерения потребности в достижении (ПД) методом тематической апперцепции неудобны для массовых обследований, требуют высокой психологической квалификации исследователя, спец

ТЕСТ ЮМОРИСТИЧЕСКИХ ФРАЗ
Тест юмористических фраз (ТЮФ) — оригинальная, компактная методика диагностики мотивационной сферы личности, соединяющая в себе достоинства стандартизованного измерительного теста и индивидуализир

ОБЪЕКТ И МЕТОДЫ
Сфера межличностных отношений чрезвычайно широка. Она охватывает практически весь диапазон существования человека, начиная от его отношения к большим социальным группам (нации, ра

Образец матрицы поведения ребенка
Таблица 10 Предыдущее поведение матери Регистрация последующего поведения ребенка

СОВМЕСТНЫЙ ТЕСТ РОРШАХА ДЛЯ ДИАГНОСТИКИ НАРУШЕНИЙ СЕМЕЙНОГО ОБЩЕНИЯ
Практическое применение конкретных диагностических приемов в области семейного консультирования оправдано лишь в той мере, в какой полученные данные не дублируют «семейный диагноз»,

Диагностическая процедура
Для исследования необходимы: лист белой бумаги (21 х 29 см), шесть цветных карандашей (черный, красный, синий, зеленый, желтый, коричневый), резинка. Ребенку дается инструкция: «Нарисуй, пожалуйст

Интерпретация полученных результатов
Предлагаемые ниже интерпретации результатов, полученных при использовании методики «Рисунок семьи» основываются на работах А. И. Захарова (1982), В. Хьюлса (Hulse W., 1951), Дж. Ди Лир (Di Leo J» 1

ЦВЕТОВОЙ ТЕСТ ОТНОШЕНИЙ
Цветовой тест отношений - это невербальный компактный диагностический метод, отражающий как сознательный, так и частично неосознаваемый уровень отношений человека. Его использование опирается на

Репертуарные матрицы
Прежде чем перейти к описанию способов заполнения решеток и анализа данных, мы считаем необходимым подчеркнуть, что ТРР ориентирована на работу с компьютером. Существуют и ручные методы, но они, д

САМОСОЗНАНИЕ КАК ОБЪЕКТ ПСИХОДИАГНОСТИКИ
Самосознание -это прежде всего процесс, с помощью которого человек познает себя. Но самосознание характеризуется также своим продуктом - представлением о себе, «Я-образом» или «Я-концепцией»[33].

МЕТОДИКИ ПСИХОДИАГНОСТИКИ САМОСОЗНАНИЯ
В области психодиагностики самосознания используются основные традиционные и вновь разрабатываемые классы методик: стандартизованные самоотчеты в форме описаний и самоописаний (тест-опросники, сп

ОПРОСНИК САМООТНОШЕНИЯ
Опросник самоотношения представляет собой многомерный психодиагностический инструмент, основанный на принципе стандартизованного самоотчета (Столин В. В., 1985). Опросник содержит 62 пун

МЕТОДИКА УПРАВЛЯЕМОЙ ПРОЕКЦИИ
Методика управляемой проекции относится к рефрактивным техникам - разновидности проективных техник. Основной принцип методики состоит в том, что испытуемому предъявляют его собственный словесный

МЕТОДЫ ИЗМЕРЕНИЯ ЛОКУСА КОНТРОЛЯ
Одной из важных интегральных характеристик самосознания, связывающих чувство ответственности, готовность к активности и переживание «Я», является качество личности, получившее название локуса контр

МЕТОДИКА КОСВЕННОГО ИЗМЕРЕНИЯ СИСТЕМЫ САМООЦЕНОК (КИСС)
Среди предшественников методики КИСС следует указать тест самооценки Дж. Лиггетта (Liggett J., 1959), известный также под названием «Тест лиу». Процедура теста требует попарного сравнения предъявл

Оценка валидности и надежности методики КИСС
Оценка конструктнойы валидности методики КИСС основана на предположении о возможности воспроизведения реальной деятельности самооценивания с помощью этой методики. Доказано, что сравнение схемати

ЗАКЛЮЧЕНИЕ
Мы надеемся, что психологи, профессионально связанные с психодиагностикой, смогут извлечь из публикуемой книги пользу для своей научной или практической деятельности. Мы также надеемся, ч