рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

ВАЛИДНОСТЬ ТЕСТОВ

ВАЛИДНОСТЬ ТЕСТОВ - раздел Образование, ОБЩАЯ ПСИХОДИАГНОСТИКА   Проблемы Валидизации Психологических Тестов Являются Цент­рал...

 

Проблемы валидизации психологических тестов являются цент­ральными для дифференциальной психометрики, но, к сожалению, до сих пор решенными не до конца. Решение этой проблемы зависит не от статистического аппарата, а от уровня развития теоретического аппарата дифференциальной психологии.

Валидность и надежность. Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивос­ти) получаемых результатов относительно измеряемых свойств объек­тов, т, е. относительно предмета измерения. Отличие понятия валидности от надежности измерения удобно раскрывать с помощью раз­личения «объекта» и «предмета» измерения. Надежность - это устой­чивость процедуры относительно объектов. Надежность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предлагает определенную процедуру измерения, показывает ее надежность -способность устойчиво различать объекты, но вопрос о валидности остается открытым.

Если в сенсорной психофизике вопрос о валидности измерений оказывается в значительной степени затушеванным тем обстоятель­ством, что простейшие физические стимулы достаточно однозначно детерминируют измеряемые свойства ощущений, то в дифференци­альной психометрике значимость проблемы валидности резко возра­стает. Здесь ситуация подобна той, когда в психофизическом опыте испытуемому не указывают, по какому именно параметру следует срав­нивать стимулы. Пусть испытуемый А понял инструкцию так, что стимульные объекты надо сравнивать по весу, а испытуемый Б - по раз­меру. Если процедура измерения будет повторена по отношению к тем же объектам, то она даст вполне устойчивые данные относитель­но объектов, но не даст валидной информации ни о шкале ощущений «веса», ни о шкале ощущений «размера».

При измерении способностей предъявляемый тест отнюдь не обя­зательно актуализирует именно тот психический процесс, который предполагается измерить. Например, столкнувшись с уже встречав­шейся однажды задачей (например, с анаграммой «дзиканпр»), испы­туемый может начать запоминать просто то решение, к которому он уже однажды пришел (слово «праздник»), чем заново решать эту за­дачу. Здесь будет измеряться скорее уровень словесной памяти, чем уровень вербального интеллекта. Точно так же реальная валидность некоторых тестов раскрывается только в результате значительного опыта работы с ними. Например, доказано, что ряд тестов, внешне вы глядящих интеллектуальными, на деле измеряют скорее личностно-стилевые особенности индивида, чем операциональные возмож­ности интеллекта, например, методика «креативного поля» Д. Б. Бо­гоявленской.

Устойчивость теста относительно объектов (испытуемых) явля­ется необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надежность является необходимым, но не достаточным условием валидности. Отсюда вытекает основное соотношение психометрики:

 

валидность ≤ надежность.

 

Это означает, что валидность теста не может превышать его надеж­ность.

Данное соотношение, однако, неверно трактовать как указание на прямую пропорциональную связь валидности и надежности. По­вышение надежности отнюдь не обязательно приводит к повышению валидности[15]. В терминах А. Анастази валидность определяется ре­презентативностью теста относительно измеряемой области поведе­ния. Если эта область поведения складывается из разнообразных фе­номенов, то содержательная валидность теста автоматически требует представленности в нем моделей всех этих разнообразных феноме­нов. Возьмем глобальное понятие «речевая способность» (этому психолингвистическому термину в традиционной тестологии соответству­ет термин «вербальный интеллект»). Сюда относятся такие относи­тельно независимые друг от друга навыки, как навыки письма и чте­ния. Если заботиться о содержательной валидности соответствую­щего теста, то нужно ввести в него группы заданий на проверку этих довольно разных по своему операциональному составу компонентов вербального интеллекта. Вводя разнородные пункты и субшкалы (суб­тесты), мы обязательно сокращаем внутреннюю согласованность, од­номоментную надежность теста, но зато добиваемся существенного повышения валидности. Таким образом, для расширения области при­менения теста психодиагност должен избегать излишнего повыше­ния внутренней согласованности. Одновременно с этим снижением внутренних корреляций между различными пунктами теста (об этом уже говорилось в разделе 3.1) обязательно исчезает отрицательный эксцесс на кривой распределения тестовых баллов, и она все более приближается по форме к нормальной кривой.

Эмпирическая валидность. Если в случае с содержательной ва-лидностью оценка теста производится за счет экспертов (устанавли­вающих соответствие заданий теста содержанию предмета измере­ния), то эмпирическая валидность измеряется всегда с помощью ста­тистического коррелирования: подсчитывается корреляция двух ря­дов значений - баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Прагматические традиции западной тестологии привязывали эм­пирическую валидность теста к внешним для психологии социально-прагматическим критериям. Эти критерии являются показателями, обладающими непосредственной ценностью для определенных об­ластей практики. Практика всегда имеет целью либо повысить, либо понизить эти показатели. Например, в области педагогической пси­хологии это «успеваемость» (которую надо повысить), в психологии труда это «производительность труда» и «текучесть кадров», в меди­цине - «состояние здоровья пациента», в психологии управления -«совместимость», «срабатываемость» коллектива, в юридической пси­хологии - «преступность» (которую надо понизить) и т. п.

Ориентируясь непосредственно на эти категории, психолог, пы­тающийся скоррелировать результаты теста с этими показателями, фактически решает сразу две задачи: задачу измерения валидности и задачу измерения практической эффективности своей психодиагнос­тической программы. Если получен значимый коэффициент корреля­ции, то можно считать, что решены с позитивным результатом сразу обе эти задачи. Но если корреляции не обнаружено, то остается нео­пределенность: либо невалидна сама процедура (тестовый балл не отражает, например, стрессоустойчивость оператора), либо неверна гипотеза о наличии причинно-следственной связи между психичес­ким свойством и социально значимым показателем (стрессоустойчивость не влияет на процент аварийных ситуаций).

Таким образом, социально-прагматические критерии являются комплексными: они позволяют измерить валидность-эффективность, но не каждое из этих двух свойств теста отдельно. На практике пси­холога часто ожидает и еще более сложная ситуация, когда заказчик требует от психолога на основании полученного диагноза сразу же определенных мер по вмешательству в ситуацию (отбор, консульти­рование, обучение и т. п.). В этом случае повышение показателей (достоверное по сравнению с контрольной группой) доказывает од­новременно и валидность-эффективность диагностики, и эффектив­ность самого вмешательства. А отрицательный результат дает еще большую неопределенность, так как оказывается невозможным от­делить неэффективность вмешательства от низкой валидности ди­агностики.

Ориентация на социально-прагматические критерии, приводящие к склейке понятий «валидности измерения» и «причинного прогноза по результатам измерения», бесспорно, сдерживала и продолжает сдер­живать развитие концептуального аппарата дифференциальной пси­хологии. При этом суть самого предмета измерения: измеряемого пси­хического свойства - оказывается вне фокуса внимания не только заказчика, но и самого психолога, превращающегося в этом случае в тестолога, которого не интересует, что именно он измеряет, главное лишь, чтобы от этого «нечто» перекидывался мостик к полезному эффекту, обеспечивающему психологу социальное признание.

Процедура эмпирической валидизации. Организация выборки при эмпирической валидизации зависит от временного статуса критерия. Если этот критерий - событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании доста­точно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию[16]. В результате применяется ме­тод экстремальных (контрастных) групп. Коррелирование с суммар­ным баллом по тесту оценивается с помощью бисериального коэф­фициента по формуле (3.2.17). При этом в статусе дихотомической переменной (на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» груп­пой по критерию; - стандартная ошибка критерия, связанная с численностью «высокой» (р) и «низкой» (q) групп.

Если критерий - будущее событие (проспективная валидизация), то выборка должна быть составлена с запасом - с учетом вероятного объема экстремальных групп в будущем. Например, нужно выяснить, позволяет ли диагностика темперамента прогнозировать повышен­ный риск психосоматических заболеваний (гипертония, язва, астма и т. п.). Пусть на основании эпидемиологических исследований извес­тно, что в течение трех лет из. 1000 здоровых людей этими болезнями заболевают 57 человек. Это означает, что превентивной (предупреж­дающей) диагностикой должно быть охвачено около 2000 человек, чтобы получить численность «высокой» группы (заболевших) поряд­ка 100 человек. Проспективная валидизация выявляет прогностичес­кую эффективность диагностической процедуры. Высокая прогнос­тическая валидность доказывает как валидность самого измерения, так и наличие предполагаемой причинной связи.

Ретроспективная валидизация позволяет в лучшем случае решить только первую из двух задач. Например, если для исследования лич­ностной предрасположенности к совершению краж проведено обсле­дование лиц, находящихся под следствием (т. е. уже совершивших преступление), то выявление акцентированных черт «тревожности», «агрессивности» и т. п. еще не может интерпретироваться как свиде­тельство причинных факторов преступности - эти черты могут быть лишь следствием сложившихся обстоятельств: лишение свободы, уг­рызения совести и т. п. (Ратинов А. Р., 1979). Во многих медико-пси­хологических исследованиях был выделен особый диагностический синдром «госпитализации», который обнаруживается у любой кате­гории госпитализированных больных (обычно он выражается в по­вышении шкал «депрессии» и «ипохондрии» по MMPI – Шхвацабая, 1980). Очевидно, что подобные личностные сдвиги никак нельзя ин­терпретировать в смысле симптомов предрасположенности к опреде­ленным психогенным заболеваниям, ибо они относятся к следстви­ям, а не к причинам этих заболеваний.

Конструктная валидность. В отличие от прагматической валидизации собственно психологическую валидизацию порой оказыва­ется провести гораздо труднее в силу отсутствия какого-либо более объективного внутрипсихологического критерия, чем сам тест.

Наиболее благополучная ситуация имеется тогда, когда для из­мерения данного свойства в психологии уже имеется процедура с известной валидностью. В этом случае корреляция между балла­ми двух тестов - линейная (см. формулу 3.2.3) или ранговая (см. формулу 3.2.5)- указывает на то, обладает ли новый тест конвер­гентной валидностью по отношению к старому. Если новый тест обнаруживает высокую конвергентность результатов со старым и одновременно оказывается более компактным и экономичным 'в проведении и подсчете, то психодиагносты получают возможность использовать новый тест вместо старого.

Однако во многих случаях для измеряемого свойства психодиа­гност не может найти в литературе ни одного уже апробированного теста с известной валидностью. В этом случае он может сформулиро­вать ряд предсказательных гипотез о том, как будет коррелировать его новый тест с другими тестами, измеряющими родственные характеристики испытуемых. Эти гипотезы выдвигаются на основе теоретических представлений об измеряемом свойстве. Их подтвержде­ние указывает на валидность выдвигаемого конструкта, т. е. на конструктную валидность теста. В западной литературе это операциональное определение конструктяой валыидности называется предполага­емой валидностью (assumed validity).

Представления о конструктной валидности тестов постоянно развиваются с пополнением репертуара методик. Эмпирические иссле­дования взаимосвязей результатов, получаемых с помощью разных методик, обогащают теоретические представления об измеряемых свойствах.

С другой стороны, понятие конструктной валидности указывает на высокую зависимость эмпирических связей теста от теоретичес­ких представлений его автора об измеряемом свойстве. Для иллюст­рации приведен пример взаимоотношений между двумя популярны­ми тест-опросниками: MAS Ж. Тейлор и EPI Г. Айзенка. Многочис­ленные корреляционные исследования, проведенные на репрезента­тивных выборках, показали, что шкала MAS (тревожность) Ж. Тейлор положительно коррелирует со шкалой «нейротизм» и отрицательно со шкалой «экстраверсия» Айзенка. Эти соотношения можно проил­люстрировать графически (рис. 10): вектор MAS оказывается распо­ложенным в квадранте «Нейротизм - Интроверсия», образованном си­стемой из ортогональных (статистически независимых) факторов EPL С точки зрения концепции Г. Айзенка, эти данные можно рассмат­ривать как свидетельства низкой валидности шкалы Ж. Тейлор: MAS коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой точки зрения, оп­росник EPI оказывается просто нечувствительным к особой разно­видности «нейротизма» - к нейротизму (тревожности) экстравертов; в перечне пунктов MAS отсутствуют высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с точки зрения тоготеоретического смысла, который приписывают показателям MAS К. Спенс и Ж. Тейлор, эта ситуа­ция вполне закономерна, жела­тельна и никак не является арте­фактом - следствием дефекта их диагностического средства. Со­гласно К. Спенсу, пытавшемуся перенести на человеческое пове­дение теорию научения Халла, MAS измеряет общий уровень драйва - неспециализированного побуждения, которое достигает максимума как раз при сочетании нейротизма (специфическая ак­тивация по Г. Айзенку) и интро-версии (неспецифическая активация)

 

– Конец работы –

Эта тема принадлежит разделу:

ОБЩАЯ ПСИХОДИАГНОСТИКА

ОБЩАЯ ПСИХОДИАГНОСТИКА... РЕЧЬ... Санкт Петербург Общая психодиагностика СПб Изд во Речь стр...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ВАЛИДНОСТЬ ТЕСТОВ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

НАУЧНАЯ ПСИХОДИАГНОСТИКА И ПСИХОДИАГНОСТИЧЕСКАЯ ПРАКТИКА
Психодиагностика - и теоретическая дисциплина, и сфера прак­тической деятельности психолога. Как теоретическая дисциплина общая психодиагностика рассмат­ривает закономерности вынесения вал

ПСИХОДИАГНОСТИЧЕСКИЕ ЗАДАЧИ
Общая психодиагностика в известной степени отвлекается от спе­цифических диагностических задач, возникающих в различных част­ных областях психодиагностики. Однако психодиагност должен пред­ставлять

ДИФФЕРЕНЦИАЛЬНАЯ ПСИХОМЕТРИКА
Термин «дифференциальная психометрика» в данной книге обо­значает науку о дифференциально-психологических измерениях. Диф­ференциальную психометрику целесообразно отличать от «общей психометрики» (

НОРМАТИВНЫЕ ПРЕДПИСАНИЯ РАЗРАБОТЧИКАМ И ПОЛЬЗОВАТЕЛЯМ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК
Развертывание практической работы психологов в различных сферах производства, медицины, образования, требующих примене­ния психодиагностических методик, остро ставит вопрос о норма­тивном регулиров

Требования к методикам
Целесообразно придерживаться разных требований к психодиаг­ностическим методикам разного типа. 1. Измерительные методы (тесты) должны удовлетворять сле­дующим требованиям: а) долж

Требования к пользователям
К пользователям, являющимся профессиональными психологами, и к пользователям-непсихологам предъявляются разные требования. Пользователь-психолог: а) должен знать и применять на практике об

Использование методик специалистами-смежниками
Отдельные, хорошо теоретически и психометрически обоснован­ные методики, не требующие специальных знаний при интерпретации, могут использовать специалисты смежных с психологией областей: учи­теля,

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ
Предыстория тестов уходит в глубину веков, она связана с испы­таниями различных способностей, знаний, умений и навыков. Сооб­щается, что уже в середине III тысячелетия до н. э. в Древнем Вави­лоне

ИЗ ИСТОРИИ ПРОЕКТИВНОГО МЕТОДА
Проективные методики представляют собой специфическую, до­вольно неоднородную группу психодиагностических приемов клини­ческой ориентации. Последнее означает не столько направленность проективных м

ИЗ ИСТОРИИ КОНТЕНТ-АНАЛИЗА КАК ПСИХОДИАГНОСТИЧЕСКОЙ ПРОЦЕДУРЫ
В современной отечественной психодиагностике контент-анализ, вообще качественно-количественное изучение документов, применя­ется крайне редко по сравнению со всевозможными тестами, проек­тивными ме

РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
  Основные статистические принципы построения тестов достаточ­но полно освещены в появившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике (Аванесо

Нормально распределенного диагностического параметра X
  Операции по анализу распределения тестовых баллов, построе­нию тестовых норм и проверке их репрезентативности. Завершая этот раздел, кратко перечислим действия, которые последовател

НАДЕЖНОСТЬ ТЕСТА
В дифференциальной психометрике проблемы валидности и надежности тесно взаимосвязаны, тем не менее мы последуем традиции раздельного изложения методов проверки этих важнейших пси­хометрических свой

ТЕХНОЛОГИЯ СОЗДАНИЯ И АДАПТАЦИИ МЕТОДИК
Рассматривая в предыдущем разделе вопрос о порядке проверки валидности, мы вплотную подошли к вопросу о целостной стратегии создания, эмпирической апробации и внедрения методики в практику.

ПРОГНОЗИРОВАНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ
Кардинальное значение для психодиагностики имеет проблема прогнозирования. Существует точка зрения, разделяющая психоди­агностику и так называемую психопрогностику (Забродин Ю. М., 1984). Это указы

ТРЕБОВАНИЯ К ПСИХОМЕТРИЧЕСКОЙ ПОДГОТОВКЕ ПСИХОЛОГА
Для эффективного развития практической психодиагностики сегодня требуется резкое повышение психометрической культуры всех психологов, использующих измерительные психодиагности­ческие методики. Мето

Черты личности
Один и тот же тестовый балл (точка на векторе X) может быть получен при разном соотношении уровней регуляции (подсистем) О, S, Р - организмического, социального и личностного. Один и тот же балл X’

ОБЪЕКТ И МЕТОДЫ
Актуальность работ по психологической диагностике способно­стей определяется в первую очередь большой практической значимо­стью этой проблемы. Существующее в обществе разделение труда, продолжающая

ТЕСТ АМТХАУЭРА
Групповой тест Амтхауэра предназначается для оценки струк­туры интеллекта лиц в возрасте от 13 до 61 года (Amthauer R., 1953). Автор ставил перед собой задачу разработать такой метод, кото­рый мог

ОБЛАСТИ ПРИМЕНЕНИЯ ТЕСТОВ СПОСОБНОСТЕЙ
Традиционное применение тестов способностей состоит в исполь­зовании их для прогноза будущей успешности претендентов при вы­боре определенной профессии. Зарубежные психологи исходили из того, что н

ОБЪЕКТ И МЕТОДЫ
Мотивация занимает ведущее место в структуре личности и явля­ется одним из основных понятий, которое используется для объясне­ния движущих сил поведения, деятельности. Процесс теоретическо­го осмыс

ИЗМЕРЕНИЕ МОТИВАЦИИ ДОСТИЖЕНИЯ
В результате многолетних исследований, проведенных большой группой исследователей, не только разработана одна из наиболее до­стоверных теорий мотивации, но и создан - на основе этой теории валидный

ОПРОСНИК ДЛЯ ИЗМЕРЕНИЯ ПОТРЕБНОСТИ В ДОСТИЖЕНИИ
Существующие методики измерения потребности в достижении (ПД) методом тематической апперцепции неудобны для массовых об­следований, требуют высокой психологической квалификации иссле­дователя, спец

ТЕСТ ЮМОРИСТИЧЕСКИХ ФРАЗ
Тест юмористических фраз (ТЮФ) — оригинальная, компактная методика диагностики мотивационной сферы личности, соединяю­щая в себе достоинства стандартизованного измерительного теста и индивидуализир

ОБЪЕКТ И МЕТОДЫ
  Сфера межличностных отношений чрезвычайно широка. Она охватывает практически весь диапазон существования человека, на­чиная от его отношения к большим социальным группам (нации, ра­

Образец матрицы поведения ребенка
Таблица 10   Предыдущее поведе­ние матери Регистрация последующего поведения ребенка    

СОВМЕСТНЫЙ ТЕСТ РОРШАХА ДЛЯ ДИАГНОСТИКИ НАРУШЕНИЙ СЕМЕЙНОГО ОБЩЕНИЯ
  Практическое применение конкретных диагностических приемов в области семейного консультирования оправдано лишь в той мере, в какой полученные данные не дублируют «семейный диагноз»,

Диагностическая процедура
Для исследования необходимы: лист белой бумаги (21 х 29 см), шесть цветных карандашей (черный, красный, синий, зеленый, жел­тый, коричневый), резинка. Ребенку дается инструкция: «Нарисуй, пожалуйст

Интерпретация полученных результатов
Предлагаемые ниже интерпретации результатов, полученных при использовании методики «Рисунок семьи» основываются на работах А. И. Захарова (1982), В. Хьюлса (Hulse W., 1951), Дж. Ди Лир (Di Leo J» 1

ЦВЕТОВОЙ ТЕСТ ОТНОШЕНИЙ
Цветовой тест отношений - это невербальный компактный диаг­ностический метод, отражающий как сознательный, так и частично неосознаваемый уровень отношений человека. Его использование опи­рается на

Репертуарные матрицы
Прежде чем перейти к описанию способов заполнения решеток и анализа данных, мы считаем необходимым подчеркнуть, что ТРР ориен­тирована на работу с компьютером. Существуют и ручные методы, но они, д

САМОСОЗНАНИЕ КАК ОБЪЕКТ ПСИХОДИАГНОСТИКИ
Самосознание -это прежде всего процесс, с помощью которого человек познает себя. Но самосознание характеризуется также сво­им продуктом - представлением о себе, «Я-образом» или «Я-концепцией»[33].

МЕТОДИКИ ПСИХОДИАГНОСТИКИ САМОСОЗНАНИЯ
В области психодиагностики самосознания используются основ­ные традиционные и вновь разрабатываемые классы методик: стан­дартизованные самоотчеты в форме описаний и самоописаний (тест-опросники, сп

ОПРОСНИК САМООТНОШЕНИЯ
Опросник самоотношения представляет собой многомерный пси­ходиагностический инструмент, основанный на принципе стандарти­зованного самоотчета (Столин В. В., 1985). Опросник содержит 62 пун

МЕТОДИКА УПРАВЛЯЕМОЙ ПРОЕКЦИИ
Методика управляемой проекции относится к рефрактивным тех­никам - разновидности проективных техник. Основной принцип ме­тодики состоит в том, что испытуемому предъявляют его собствен­ный словесный

МЕТОДЫ ИЗМЕРЕНИЯ ЛОКУСА КОНТРОЛЯ
Одной из важных интегральных характеристик самосознания, связывающих чувство ответственности, готовность к активности и переживание «Я», является качество личности, получившее название локуса контр

МЕТОДИКА КОСВЕННОГО ИЗМЕРЕНИЯ СИСТЕМЫ САМООЦЕНОК (КИСС)
Среди предшественников методики КИСС следует указать тест самооценки Дж. Лиггетта (Liggett J., 1959), известный также под на­званием «Тест лиу». Процедура теста требует попарного сравнения предъявл

Оценка валидности и надежности методики КИСС
Оценка конструктнойы валидности методики КИСС основана на предположении о возможности воспроизведения реальной деятель­ности самооценивания с помощью этой методики. Доказано, что срав­нение схемати

ЗАКЛЮЧЕНИЕ
Мы надеемся, что психологи, профессионально связанные с пси­ходиагностикой, смогут извлечь из публикуемой книги пользу для своей научной или практической деятельности. Мы также надеемся, ч

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги