рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ

ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ - раздел Образование, ОБЩАЯ ПСИХОДИАГНОСТИКА Предыстория Тестов Уходит В Глубину Веков, Она Связана С Испы­таниями Различн...

Предыстория тестов уходит в глубину веков, она связана с испы­таниями различных способностей, знаний, умений и навыков. Сооб­щается, что уже в середине III тысячелетия до н. э. в Древнем Вави­лоне проводились испытания выпускников в школах, где готовились писцы. Профессионально подготовленный писец, благодаря обшир­ным по тем временам знаниям, был центральной фигурой месопотамской цивилизации. Он был обязан знать все четыре арифметичес­ких действия, уметь измерять поля, распределять рационы, делить иму­щество, владеть искусством пения и игры на музыкальных инстру­ментах. Кроме того, проверялось умение разбираться в тканях, металлах, растениях (Дандамаев М. А., 1983).

В Древнем Египте только того обучали искусству жреца, кто был способен выдержать систему определенных испытаний. Вначале кан­дидат в жрецы проходил собеседование, в процессе которого выяс­нялись его биографические данные, уровень образованности; кро­ме того, оценивались внешность, умение вести беседу. Затем следо­вали проверки: умения трудиться, слушать и молчать, испытания огнем, водой, страхом преодоления мрачных подземелий в полном одиночестве и др. (Аванесов В. С., 1982). Все эти довольно жесткие испытания дополнялись угрозой смерти для тех, кто не был уверен в своих способностях к учению и в том, что сумеет выдержать все тяготы длительного периода образования. Поэтому каждому канди­дату предлагалось еще раз подумать и, тщательно взвесив, решить, с какой стороны закрыть за собой дверь в храм - с внутренней или с внешней.

Сообщается, что эту суровую систему испытаний успешно пре­одолел знаменитый ученый древности Пифагор. Вернувшись в Гре­цию, он основал школу, допуск в которую открывал только для тех, кто был способен преодолеть серию различных испытаний, похожих на те, которые он выдержал сам. Как свидетельствуют источники Цит. по: Голицын Н. Н., 1855, q. 118), Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого де­рева можно выточить Меркурия», и потому, вероятно, придавал боль­шое значение диагностике именно этих способностей. Для этого каж­дому давалась сравнительно трудная математическая задача. В слу­чае ее решения вопрос о приеме решался сразу. Однако чаще всего задача не решалась, после чего неудачника вводили в зал, где учени­ки, по правилам испытаний, должны были беспощадно поднимать его на смех, давая ему обидные прозвища. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпа­ды, хорошо и достойно держать себя, его принимали в школу (под­робнее см.: Аванесов В. С., 1982).

Особое значение Пифагор придавал смеху молодых людей, ут­верждая, что манера смеяться является самым хорошим показателем характера человека. Он внимательно относился к рекомендациям ро­дителей и учителей, вел тщательное наблюдение за каждым нович­ком после того, как последнего приглашали свободно высказываться и не стесняться, смелее оспаривать мнения собеседников (там же).

Сообщается (Dubois P., 1970), что за 2200 лет до н. э. в Древнем Китае уже существовала система проверки способностей лиц, желав­ших занять должности правительственных чиновников[8]. Каждые три года чиновники повторно экзаменовались лично у императора по «шести искусствам»: музыке, стрельбе из лука, верховой езде, уме­нию писать, считать, знанию ритуалов и церемоний. Для государства система экзаменов была важным средством отбора достаточно спо­собных, в меру эрудированных и, главное, лояльных по отношению к власти людей для последующего их использования на администра­тивной службе.

Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарм, желая испытать мудрость персов, прислал им шахматы. Предполагалось, что персы вряд ли сумеют разгадать суть этой игры, и потому они должны были по условию отослать в Индию подать. Сообщается, однако, что визирь Хо-срова Важургмихр понял правила шахматной игры и, в свою очередь, изобрел игру, на­зываемую сейчас нарды. Он послал с новой игрой гонца в Индию, где ее, как выяснилось, разгадать не смогли (Орбели И. А., 1936).

Другим свидетельством использования испытаний тестового ха­рактера являются материалы, излагающие основы религиозного уче­ния чань-буддизма. Учителя чань-буддизма использовали загадки, вопросы-парадоксы с одновременным созданием ситуации психоло­гического стресса. Отвечать на них необходимо было сразу, на разду­мывание не отводилось ни секунды. Как отмечает Н. В. Абаев, в чаньских поединках-диалогах сама парадоксальность постановки вопро­сов (например, была ли борода у бородатого варвара или имеет ли собака природу Будды) создавала драматическое напряжение, кото­рое усиливалось всем образом действий наставника. Хватая своего оппонента и крича на него: «Говори! Говори! Отвечай немедленно!», он создавал ситуацию психического напряжения. Чаньские парадок­сальные загадки использовались, по мнению этого же автора, в каче­стве тестов на определенный, «чаньский» ход мышления. В зависимости от того, как тестируемый отвечал на эти загадки, опытный на­ставник определял, на каком уровне «просветленности» он находил­ся и какие меры нужно принять для углубления его «чаньского опы­та», а также выявлял людей, скрывающих за внешней грубостью и странностью манер свою некомпетентность (Абаев Н. В., 1980).

В созданном чжурчжэнями государстве Цзинь результаты экза­менов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие поступали на государственную службу в качестве практикующих врачей, препо­давателей или исследователей, худшие получали разрешение зани­маться частной практикой. Не выдержавшим экзамен рекомендова­лось либо продолжить подготовку, либо сменить профессию (Воро­бьев М. В., 1983).

Различные конкурсы и экзамены устраивались и в средневековом Вьетнаме. Всего за два года, в период с 1370 по 1372 г., удалось про­вести переаттестацию всех военных и гражданских чиновников, что позволило организовать проверку государственного аппарата по всей стране. В результате этого Вьетнам вновь стал сильным и жизнеспо­собным феодальным государством; особое внимание было уделено созданию боеспособного офицерского корпуса (Берзин Э. О., 1982).

В XV в. конкурсные испытания были упорядочены: они проводи­лись по этапам и турам. Присвоение высших степеней на экзаменах сопровождалось большими почестями. Лауреаты получали подарки от короля, их имена вносились в «золотой список», который вывеши­вался у Восточных ворот столицы, об их победах на конкурсе сооб­щалось в родную общину. Имена наиболее отличившихся высекали на специальных каменных стелах, установленных в Храме Литерату­ры (Берзин Э. О., 1982).

Интересные данные приводятся В. Н. Басиловым в отношении шаманства. У некоторых народов (например, у эскимосов) чуть ли не каждый взрослый мужчина считал себя способным к шаманству, но эти претензии отвергались в процессе испытаний. Проверка и, как результат ее, признание были непременными условиями шаманской деятельности. У разных народов проверка шамана принимала свои формы. В частности, когда у казахов кто-либо объявлял себя шама­ном, то он по требованию народа должен был, ходить по снегу в трес­кучий мороз босиком и с обнаженной головой, лизать языком раскаленные докрасна железные предметы. У народности ханты неудачно­го претендента объявляли сумасшедшим. У ульчей шаман подвергал­ся испытаниям во время поминок. Такой же обычай был у нанайцев (Басилов В. Н., 1984).

Приведенный краткий исторический экскурс позволяет сделать вывод о необходимости рассматривать испытания индивидуальных способностей как важную и неотъемлемую часть общественной жиз­ни многих (если не всех) народов мира со времен древнейших циви­лизаций и до наших дней. Однако можно ли, на основании приведен­ных данных, говорить о глубокой истории и широкой распространен­ности тестов? Если согласиться с наиболее известными сейчас опре­делениями теста, даваемыми как перевод с английского слова «test» - испытание, проверка, проба, то на поставленный вопрос надо ответить утвердительно. Дело, однако, в том, можно ли в наше время так определять тест...

С течением времени обыденное представление о тесте и научное понимание теста все больше удалялись друг от друга. Хотя всякий тест включает в себя элемент испытания, он не сводится только к нему, ибо сейчас это метод исследования, включающий в себя ряд чисто научных требований. На каждом этапе развития науки требования к тестам и они сами менялись. Игнорирование этого диалектического момента нередко приводит к упрощенчеству в оценках тестов.

Настоящая история тестов началась век назад, в канун периода ломки устаревшего общественного строя, революционного измене­ния общественного сознания, совпавшего по времени с научным кри­зисом, сразившим естествознание. Диалектика и материализм потряс­ли идеалистический фундамент психологии и стали основой новой методологии.

К началу XX в. практические потребности изучения преобладаю­щих способностей были сформулированы в виде научной проблемы исследования индивидуальных различий. Эта проблема и дала им­пульс к появлению первых тестов. Известный английский ученый Ф. Гальтон в течение 1884-1885 гг. провел серию испытаний, в кото­рых посетители .лаборатории в возрасте от 5 до 80 лет могли за не­большую плату проверить свои физические качества (силу, быстроту реакции и др.), а также ряд физиологических возможностей организ­ма и психических свойств - всего по семнадцати показателям. В число последних вошли показатели роста, веса, жизненной емкости лег­ких, становой силы, силы кисти и удара кулаком, запоминаемости букв, остроты зрения, различения цвета и другие. По полной програм­ме было обследовано 9337 человек. Ф. Гальтон писал, что практика вдумчивого и методичного тестирования - не фантазия; она требует рассмотрения и эксперимента (Galton F., 1884).

Это был первый существенный отход от тысячелетней практики испытаний и проверок, основанной на интуиции. Применительно к тестам значение деятельности Гальтона можно сравнить с тем, что сделал Галилей для физической науки своими остроумными экспери­ментами. Набиравший силу радикальный эмпиризм рассматривался рядом ученых конца XIX в. как вполне приемлемая альтернатива иде­ализму, а эксперимент - как настоящий фундамент науки. «Только тогда психология сможет стать действительной и точной наукой, -писал, Дж. Кеттелл, — когда она будет иметь своей основой экспери­мент и измерения» (Cattell D., 1890).

Кеттелл, по-видимому, первым увидел в тестах средство измере­ния, казалось бы, неизмеряемых свойств человеческой психики. В работе, опубликованной в 1890 г., он дал список 50 лабораторных те­стов, которые мы бы сейчас назвали не тестами, а контрольными за­даниями. Эти тесты проводились с соблюдением только двух из изве­стных сегодня требований к тестам: имелась инструкция по их при­менению и подчеркивался лабораторный (т. е. научный) характер ис­пытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, в нее не допускаются зрители во время тестирования; все испытуемые инструктируются одинаково, все они должны хоро­шо усвоить, что и как нужно им делать (Cattell D., 1890).

Надо ли говорить, сколь непривычной казалась идея измерения для психологии XIX века. Измерение с помощью тестов казалось тог­да, а многим кажется и по сей день, делом если не странным, то пре­тенциозным. Обыденное сознание исходило при этом из аналогии с физическими измерениями и рассматривало эти попытки математи­зации как чуждый для гуманитарной психологии уклон. Примерно с такими же трудностями сталкивалась и психофизика.

Тем не менее к концу 20-х годов нашего столетия все больше ста­ла ощущаться потребность в создании специфического направления, связанного с особенностями использования числа и меры. В психологии эту роль выполняла психометрия, в биологии - биометрия, в экономике - эконометрия, в науке в целом - наукометрия. К ним сле­довало бы добавить и социометрию, но последнюю Дж. Морено и Г. Гурвич свели к элементарным методам оценки взаимодействия ин­дивидов в малых группах.

С момента первых публикаций Ф. Гальтона и Дж. Кеттелла идея тестового метода сразу же привлекла к себе внимание ученых разных стран мира. Появились первые сторонники тестов и первые же их противники. В числе сторонников были: в Германии - Г. Мюнстерберг, С. Крепелин, В. Онри, во Франции -А. Бине, в США - Дж. Гил­берт и другие. Это были исследователи нового типа, стремившиеся связать психологию тех лет с запросами практики. Однако стремле­ние к прикладным исследованиям в психологии прошлого расцени­валось как отход от науки. Кетгелл, например, сообщал, что он начал свои первые тестовые лабораторные исследования индивидуальных различий в 1885 году, но публиковаться не мог из-за противодействия В. Вундта (Cattell D., 1896).

Итак, научный статус тестов не был определен, возможность из­мерений в психологии подвергалась сомнению. Психология пережи­вала трудный период: она уже не могла развиваться на старой основе, но и не научилась еще смотреть на мир по-новому. «Причина кризи­са, - писал Л. С. Выготский, - лежит в развитии прикладной психо­логии, приведшей к перестройке всей методологии науки на основе принципа практики. Этот принцип давит на психологию и толкает ее к разрыву на две науки» (цит. по: Ярошевский М. Г., Гургенидзе Г. С., 1977). Общественная практика требовательно выдвигала одну про­блему за другой, и ни одну из них старая психология решить не мог­ла - у нее не было подходящих методов.

Появление в этой ситуации прикладной психологии не было слу­чайностью. Ей было дано название «психотехника». Прикладное на­правление появилось и в педагогике. Хотя педология претендовала на звание науки о комплексном развитии ребенка, в тот период она была в основном прикладной педагогикой. Отвергнутые в традици­онной науке - в психологии и в педагогике, тесты быстро нашли себе применение в прикладных направлениях. В общем, произошло так, как говорили в древности: если какой-либо науке не находится места в храме, она начинает развиваться у его стен.

Активизация роли науки в практическом переустройстве жизни столкнулась с традицией занятий «чистой наукой, созерцанием исти­ны». Для представителей чистой науки прикладность не имела замет­ной ценности. В 30-х годах ученые Кембриджа больше всего горди­лись тем, что их научная деятельность ни при каких мыслимых об­стоятельствах не может иметь практического смысла (Сноу Ч., 1973). Цель, методы и результаты психотехники лежали в сфере практики, в то время как цели, методы и результаты традиционной психологии лежали в области теоретических рассуждений. Различались произво­дительная и познавательная функции этих направлений. То, что име­ло ценность для психотехники, психология того времени ни принять, ни произвести сама не могла, так же как и психотехника мало что могла дать психологии.

Размежевание стало заметным в конце 20-х - начале 30-х годов. Вместо объединения усилий обе стороны приступили к взаимным обвинениям и затяжным дискуссиям. Психология обвинялась в схо­ластике, узком академизме, в неспособности воспринять новое и в отрыве от практики жизни. Психотехника, в свою очередь, осужда­лась за узкий практицизм, противоречащий духу науки, за отрыв от психологии; она обвинялась в голом эмпиризме, прикладности, в чрез­мерном увлечении тестами... Последнее обвинение стало узловым пун­ктом критики.

Разрыв между фундаментальным и прикладным направлениями был до недавнего времени характерен для многих наук, но не везде он протекал столь болезненно, как в психологии. Даже в историчес­кой науке получили распространение взгляды морализирующих ис­ториков, противопоставляющих «чистое и возвышенное познание» различным формам приложения науки, влекущим за собой лишь не­счастья и опасности (Шахназаров Г. X., 1981).

Начало 30-х годов характеризуется широким использованием тес­тов во многих странах. Во Франции они стали применяться для дефек­тологических целей и для профориентации, в США тесты использова­лись при приеме на работу, в колледжи, для оценки знаний школьников и студентов, в социально-психологических исследованиях. В России тесты применялись в основном в двух основных сферах: в народном образовании и в сфере профотбора - профориентации. Затронутые те­стами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений как за, так и против тестов. Большой энтузиазм тех, кто их при­менял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его использования, породили во многих, странах, в том числе и в России, письма в правительственные органы и в газеты с требованием запрета тестов.

В отечественной истории тестов начали 30-х годов характеризу­ется интенсивным и неконтролируемым использованием тестов в системе народного образования и в промышленности. Практика, как это часто бывает, опережала теорию. Массовые тестовые обследо­вания не подкреплялись серьезной проверкой качества инструмен­тария, решения о переводе некоторых учащихся в классы для ум­ственно отсталых детей принимались на основе коротких тестов без учета других факторов, влияющих на результаты проверки. В про­мышленности на основе таких же тестов делались попытки класси­фицировать работников по различным профессиям, без вниматель­ного учета личных склонностей и интересов. Ввиду надвигавшейся тестомании и ряда причин субъективного характера было принято известное постановление «О педологических извращениях в систе­ме наркомпросов» (1936), наложившее запрет на применение бес­смысленных (как там отмечалось) тестов и анкет. Это постановле­ние, по мнению А. Н. Леонтьева, А. Р. Лурия и А. А Смирнова, по­лучило в последующие годы неправомерно расширительное толко­вание и привело к отказу от разработки научно обоснованных методов психологической диагностики личности (Леонтьев А. Н., Лурия А. Р., Смирнов А. А., 1968).

В те годы были, однако, и другие выступления - в пользу тестов. Так, известный психолог М. Я. Басов говорил: «Я думаю все же, что эта долгая, подчас острая критика тестовой методики... в конце кон­цов приведет не к ниспровержению, не к упразднению этой методи­ки, а, напротив, к ее упрочнению и к ее утверждению в определенных границах, в которых она, очевидно, имеет полное право на примене­ние и существование» (Тесты: теория и практика. М., 1928, № 2, С. 54).

Тем не менее, начиная с указанного периода критика тестов при­обрела широкий размах и вышла за рамки чисто научных дискуссий. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В США, например, против использования тестов выступали представители основных групп населения США - взрос­лые и дети, белые и негры, рабочие и управленческий персонал, а также представители национальных меньшинств.

В результате проведения серии исследований по социальным по­следствиям тестирования выяснилось, что 37 % опрошенных возра­жали против использования тестов при поступлении на работу, 50 % -при продвижении по службе, 25 % - против использования тестов в школе (Brim S., 1965). Случаи нарушения этики при использовании тестов оказались столь злободневными, что ими вынужден был за­няться Конгресс, устроивший специальные слушания по этому делу. В результате было принято решение, осуждающее неэтичное исполь­зование тестов, практику вторжения в частную жизнь как идущую вразрез с моральными нормами (Armor D., 1974). В августе 1966 г. в Сенате США обсуждалось предложение о полном запрещении тес­тов, но это предложение не было поддержано большинством.

В зарубежной литературе выделяется несколько источников кри­тики тестов. Психолог С. Брим усматривает первый источник в лич­ностном портрете критиков, в числе которых чаще других оказыва­ются те, кто не склонен к самопознанию и интроспекции, авторита­рен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на пе­редовые позиции должны выдвигаться наиболее талантливые люди. В таком обществе каждый должен иметь возможность внести свой вклад в соответствии со своими способностями. Последние долж­ны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам (Brim S., 1965). Третий источ­ник является, по мнению Р. Кеттелла (Cattell R., 1950), следствием эмоционального и сентиментального отношения людей эстетичес­кого и нарциссического типа, возражающих против всякой попытки представить «уникальную, художественную личность» в виде фор­мул. Четвертый источник критики является научным и касается не­достатков тестового метода.

В 30-е годы случилось так, что психотехника не оправдала возла­гавшихся на нее надежд в смысле заметного повышения производи­тельности труда. Она и не могла это сделать, потому что на том, срав­нительно низком уровне промышленного развития прогресс в значи­тельной мере зависел от уровня индустриализации и автоматизации производства. При достижении необходимого уровня развития средств производства человеческий фактор вновь начинает играть ключевую роль. Вот почему именно в последние годы стал заметно увеличи­ваться поток прикладных психологических исследований, нацелен­ных, в частности, на повышение эффективности человека-оператора в управлении сложными техническими системами. Соответственно возросла роль психофизики, психометрии, прикладной и инженерной психологии, психологии труда и безопасности, экспериментальной психологии, научно обоснованной профориентации и профотбора. Вместе с этим опять возросло и значение тестов.

Хотя в 30-е годы практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в на­шей стране не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний, и, наоборот, различные испытания нередко назывались тестами. Суть вопроса, разумеется, не в названи­ях, а в принципиальных отличиях.

Первое отличие состоит в том, что тест является научно обосно­ванным методом эмпирического исследования в психологии и в ряде других наук. Важная мысль К. Маркса о том, что одна экономическая эпоха отличается от другой не тем, что она производит, а тем, каким способом она это делает относится в полной мере и к психологичес­кой науке. В период зрелости в ней, как и везде, все большее внима­ние направляется на способы познания и на критерии обоснования истинности знания.

Второе принципиальное отличие связано со сравнительно новой ролью теста как инструмента теоретического исследования в таких, например, направлениях психологии, как изучение личности, способ­ностей. Здесь использование тестов позволило преодолеть методоло­гический тупик, в котором оказались авторы многочисленных тео­рий, концепций, интуитивных догадок и иных умозрительных пост­роений, не видевших способа обоснования истинности своих сужде­ний. Непосредственное же обращение к практике как критерию истины нередко дает противоречивые результаты, ибо действительно научная аргументация требует определенного структурирования, опос­редования, абстрагирования и, кроме того, методической вооружен­ности исследователя.

Только в последние годы в психологии стала широко осознавать­ся задача согласования теоретических разработок с эмпирическими результатами, для чего стали необходимыми методы, позволяющие это делать без заметной потери качества такого согласования. Тесты являются сейчас, по-видимому, наиболее развитой в научном отно­шении частью методического арсенала, позволяющего адекватно скреплять теорию с эмпирией, в соответствии с некоторыми извест­ными стандартами качества информации. Именно такое понимание тестов все в большей мере начинает утверждаться в новейшей отече­ственной и зарубежной литературе (Анастази А., 1982; Бурлачук Л. Ф., 1979; Кабанов М. М., Личко А. Е., Смирнов В. М., 1983; Кулагин Б. В., 1984; Марищук В. Л. и др., 1984; Мельников В. М., Ямпольский Л. Т., 1985; Практикум по .психодиагностике. Дифференциальная психомет­рика, 1984; Психологические методы исследования личности в кли­нике, 1978; Шванцара И. и др., 1978),

Обоснование качества результатов психологических исследова­ний требует обращения к внепсихологическим понятиям и критери­ям: философским, логическим, математико-статистическим. В част­ности, философский элемент в теорию психологических измерений вносит известный тезис о неизбежности погрешности измерений. Критики психологических тестов нередко апеллируют к этому тезису как к основанию принципиальной порочности тестов в смысле точ­ности измерений. Неточные измерения, считают они, науке вообще не нужны. При этом как-то забывается, что формой преодоления это­го философского скепсиса является тезис о возможности приближен­ного измерения с достаточно приемлемой точностью. Применение на практике последнего тезиса позволило получить, например в фи­зике, те фундаментальные результаты, которыми эта наука по праву гордится.

Не вдаваясь в детальный анализ концепции надежности, представ­ляющей предмет отдельного рассмотрения в данной книге, отметим здесь лишь ее связь с понятием «тест». Действительный отход от уп­рощенного понимания тестов требует наполнения интересующего нас понятия элементами научного языка, восхождения на более высокую ступень абстракции. Концепция надежности составляет одну из ос­нов переосмысления сущности теста, а также одну из характеристик его качества. С появлением корреляционного анализа (в начале XX в.) были предложены три основных методических подхода к определе­нию надежности теста. Это - повторное тестирование, использова­ние параллельных форм одного и того же теста и, наконец, однократ­ное тестирование с последующим разбиением матрицы исходных результатов (X) на две или большее число частей. За показатель на­дежности принимается значение коэффициента корреляции.

Значительно позже появились попытки теоретического осмысле­ния этой концепции. Исходным пунктом всех построений является уже упоминавшийся тезис о неизбежности погрешности измерений и, как следствие, признание множественности возможных причин ис­кажения истинного результата измерения.

Как результат факторно-аналитического переосмысления концеп­ции надежности и гомогенности теста родилась новая технология расчета коэффициента надежности теста. Ее появление надо рассмат­ривать как реакцию на неприемлемость и искусственность ряда та­ких условий и ограничений, как, например, параллельность форм од­ного и того же теста, равенство дисперсий всех высказываний, оди­наковая их коррелируемость друг с другом. Д. Армор использовал известный факт корреляции тестовых высказываний между собой и стал рассматривать ее как аргумент, статистической функцией кото­рого является надежность теста.

Если все высказывания измеряют один и тот же признак (свой­ство), то для фиксированного их числа чем больше корреляция меж­ду ними, тем более надежен тест. С другой стороны, высокая корре­ляция обеспечивает хорошую факторизуемость корреляционной мат­рицы (К) и, следовательно, является залогом выделения такого одно­го фактора, который может объяснить связь большей части дисперсии в R. Следовательно, надежность тестов должна быть связана с резуль­татом факторного анализа. Предложенная Армором формула оказа­лась сравнительно простой (Armor D., 1974, с. 20):

θ =

где θ - коэффициент надежности теста; k— количество высказыва­ний; λ1 - наибольшее значение корня, получаемое при решении ха­рактеристических уравнений вида /R - λ • J/ = 0.

Помимо надежности в понятие «тест» входит и концепция валидности. Поскольку в психологии нередки случаи увлечения точностью измерения неточно выделенных свойств, соотношение между надеж­ностью и валидностью можно образно представить в виде кучной стрельбы, но не в центр мишени, т. е. стрельба ведется из оружия впол­не надежного, но прицел стрелок выбрал не совсем точно.

Современный тест - это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели. Нет тестов вообще надежных и валидных. Эти качества характеризу­ют не только инструмент измерения, но обязательно характер, цель и время его применения. В историческом разрезе концепция валидности, так же как и надежности, начиналась с наивного предположения о том, что метод «работает», т. е. каждый создаваемый тест рассматри­вался как валидный, примерно так, как если бы каждая создаваемая социологами анкета годилась для решения поставленных задач. Пер­вые же проявления действительно научной критики развенчали эту, по сути дела, «веру» в валидность. Они же стимулировали поиск. При­влечение известных ученых к созданию тестов было для научной об­щественности в начале нынешнего века гарантией убедительности обоснования валидности как бы по авторитету. Но это был дотеоретический, доэмпирический, по существу, донаучный этап оценки ка­чества тестов.

Поскольку в те годы тесты разрабатывались исключительно для решения практических проблем, эмпиризм и соответствующая ему методология стали главными для обоснования качества инструмен­тария. Это особенно проявилось в создании тестов для решения кад­ровых проблем: профотбора, профориентации, профконсультации, а также распределения принятого контингента по специальностям и отделениям внутри производства или учебного заведения.

С точки зрения истории, можно выделить два основных, эмпири­ческих подхода к валидизации тестов. Первый назовем прогности­ческим. Его логика такова. Если те, кто хорошо работает (по крите­рию У), показывают высокие результаты по какому-либо теcту (X), значит, здесь есть связь, быть может, и причинная. Иначе говоря, Y, вероятно, зависит от X. Отдавая предпочтение при приеме на работу тем, у кого выше результаты по X, предполагается, что они покажут и более высокую производительность труда. Ожидания такого рода ча­сто сбываются, но в различной степени. Другой подход к эмпиричес­кой валидизации тестов основан на использовании экспертных оце­нок. Здесь логика еще проще: если эксперты (множество авторите­тов) согласованно считают одних более способными, других - менее, значит, «это так». В случае когда результаты теста указывают на сход­ную тенденцию, т. е. данные по тесту коррелируют с данными экс­пертизы, то принимается, что тест является валидным и его можно далее примерять и в других подобных ситуациях. Так проводилась валидизация первого теста для измерения интеллектуальных способ­ностей (Бине А. и Симон Т.), а в наше время - некоторых тестов для измерения социальных потребностей молодежи (Прогнозирование со­циальных потребностей молодежи. М., 1978).

Развитие тестов в тесных рамках эмпиризма не могло продолжать­ся сколь-нибудь долгое время. Без теоретического мышления, как ука­зывал Ф. Энгельс, невозможно связать между собой хотя бы два фак­та природы или уразуметь существующую между ними связь (Маркс К., Энгельс Ф. Соч., т. 20, с. 382). Обращение к внеэмпирическим критериям истинности было неизбежным. Отсюда последо­вали такие подходы к валидизации, в которых теория сочеталась с эмпирией. В качестве примера можно взять важную для традицион­ной психологии область научных конструктов, ключевых психологи­ческих понятий. Именно понятия и конструкты стали основным пред­метом многих исследований с помощью тестов. Последние призваны уточнить эмпирический состав индикаторов (высказываний), соответ­ствующих таким конструктам-понятиям, как личность, темперамент, интеллект, экстраверт и многим другим. В современной психологии они стали предметом эмпирического исследования, и делается это с целью фундаментального обоснования практической значимости те­оретических суждений.

Теперь пора ответить на последний вопрос - что же такое совре­менный психологический тест? Это теоретически и эмпирически обо­снованная система высказываний (заданий), позволяющая получить измерения соответствующих психологических свойств. Теоретичес­кое обоснование предполагает всесторонний анализ теста и результатов его применения в свете известных достижений современной пси­хологической науки. Эмпирическое же обоснование связано с обра­щением к опыту, измерениям и эксперименту.

Здесь может возникнуть ошибочная ассоциация с неопозитивист­ским принципом верификации. Этому способствует наличие в обоих случаях требования эмпирического согласования теоретических кон­цепций (конструктов). Но, как справедливо отмечал Э. М. Чудинов, наука до и независимо от неопозитивизма руководствовалась требо­ванием принципиальной проверяемости своих теорий. Это всегда отличало науку от религии и натурфилософских построений, обеспе­чивало ей строгость и точность. Неопозитивизм абсолютизировал эту грань научного познания, обратив ее против философии и против са­мой науки. Он трансформировал указанное требование в принцип верификации, который накладывает на науку непомерные ограниче­ния и несовместим с ней (Чудинов Э. М., 1977).

Отмеченными выше критериями надежности и валидности про­блема обоснования научности тестов не закрывается. Из используе­мых сейчас двух критериев первый назовем общенаучным, а второй -специально научным. Их широкое применение - всего лишь дань сло­жившейся в теории тестов традиции. В ряде наук идеи валидности преломляются в виде стремления обосновать истинность, необходимость, системность, рациональность и др. Ключевым критерием яв­ляется истинность, которая связана со всеми остальными. Валидность теста соотносится с истинностью через принцип предметности зна­ния, указывающего на степень его соотнесенности с познаваемым. Но все это - область специального исследования, которое еще пред­стоит провести в процессе дальнейшего развития теории и практики применения психологических тестов.

– Конец работы –

Эта тема принадлежит разделу:

ОБЩАЯ ПСИХОДИАГНОСТИКА

ОБЩАЯ ПСИХОДИАГНОСТИКА... РЕЧЬ... Санкт Петербург Общая психодиагностика СПб Изд во Речь стр...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ИЗ ИСТОРИИ ПСИХОЛОГИЧЕСКИХ ТЕСТОВ

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

НАУЧНАЯ ПСИХОДИАГНОСТИКА И ПСИХОДИАГНОСТИЧЕСКАЯ ПРАКТИКА
Психодиагностика - и теоретическая дисциплина, и сфера прак­тической деятельности психолога. Как теоретическая дисциплина общая психодиагностика рассмат­ривает закономерности вынесения вал

ПСИХОДИАГНОСТИЧЕСКИЕ ЗАДАЧИ
Общая психодиагностика в известной степени отвлекается от спе­цифических диагностических задач, возникающих в различных част­ных областях психодиагностики. Однако психодиагност должен пред­ставлять

ДИФФЕРЕНЦИАЛЬНАЯ ПСИХОМЕТРИКА
Термин «дифференциальная психометрика» в данной книге обо­значает науку о дифференциально-психологических измерениях. Диф­ференциальную психометрику целесообразно отличать от «общей психометрики» (

НОРМАТИВНЫЕ ПРЕДПИСАНИЯ РАЗРАБОТЧИКАМ И ПОЛЬЗОВАТЕЛЯМ ПСИХОДИАГНОСТИЧЕСКИХ МЕТОДИК
Развертывание практической работы психологов в различных сферах производства, медицины, образования, требующих примене­ния психодиагностических методик, остро ставит вопрос о норма­тивном регулиров

Требования к методикам
Целесообразно придерживаться разных требований к психодиаг­ностическим методикам разного типа. 1. Измерительные методы (тесты) должны удовлетворять сле­дующим требованиям: а) долж

Требования к пользователям
К пользователям, являющимся профессиональными психологами, и к пользователям-непсихологам предъявляются разные требования. Пользователь-психолог: а) должен знать и применять на практике об

Использование методик специалистами-смежниками
Отдельные, хорошо теоретически и психометрически обоснован­ные методики, не требующие специальных знаний при интерпретации, могут использовать специалисты смежных с психологией областей: учи­теля,

ИЗ ИСТОРИИ ПРОЕКТИВНОГО МЕТОДА
Проективные методики представляют собой специфическую, до­вольно неоднородную группу психодиагностических приемов клини­ческой ориентации. Последнее означает не столько направленность проективных м

ИЗ ИСТОРИИ КОНТЕНТ-АНАЛИЗА КАК ПСИХОДИАГНОСТИЧЕСКОЙ ПРОЦЕДУРЫ
В современной отечественной психодиагностике контент-анализ, вообще качественно-количественное изучение документов, применя­ется крайне редко по сравнению со всевозможными тестами, проек­тивными ме

РЕПРЕЗЕНТАТИВНОСТЬ ТЕСТОВЫХ НОРМ
  Основные статистические принципы построения тестов достаточ­но полно освещены в появившейся в начале 80-х годов на русском языке литературе по дифференциальной психометрике (Аванесо

Нормально распределенного диагностического параметра X
  Операции по анализу распределения тестовых баллов, построе­нию тестовых норм и проверке их репрезентативности. Завершая этот раздел, кратко перечислим действия, которые последовател

НАДЕЖНОСТЬ ТЕСТА
В дифференциальной психометрике проблемы валидности и надежности тесно взаимосвязаны, тем не менее мы последуем традиции раздельного изложения методов проверки этих важнейших пси­хометрических свой

ВАЛИДНОСТЬ ТЕСТОВ
  Проблемы валидизации психологических тестов являются цент­ральными для дифференциальной психометрики, но, к сожалению, до сих пор решенными не до конца. Решение этой проблемы зависи

ТЕХНОЛОГИЯ СОЗДАНИЯ И АДАПТАЦИИ МЕТОДИК
Рассматривая в предыдущем разделе вопрос о порядке проверки валидности, мы вплотную подошли к вопросу о целостной стратегии создания, эмпирической апробации и внедрения методики в практику.

ПРОГНОЗИРОВАНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ
Кардинальное значение для психодиагностики имеет проблема прогнозирования. Существует точка зрения, разделяющая психоди­агностику и так называемую психопрогностику (Забродин Ю. М., 1984). Это указы

ТРЕБОВАНИЯ К ПСИХОМЕТРИЧЕСКОЙ ПОДГОТОВКЕ ПСИХОЛОГА
Для эффективного развития практической психодиагностики сегодня требуется резкое повышение психометрической культуры всех психологов, использующих измерительные психодиагности­ческие методики. Мето

Черты личности
Один и тот же тестовый балл (точка на векторе X) может быть получен при разном соотношении уровней регуляции (подсистем) О, S, Р - организмического, социального и личностного. Один и тот же балл X’

ОБЪЕКТ И МЕТОДЫ
Актуальность работ по психологической диагностике способно­стей определяется в первую очередь большой практической значимо­стью этой проблемы. Существующее в обществе разделение труда, продолжающая

ТЕСТ АМТХАУЭРА
Групповой тест Амтхауэра предназначается для оценки струк­туры интеллекта лиц в возрасте от 13 до 61 года (Amthauer R., 1953). Автор ставил перед собой задачу разработать такой метод, кото­рый мог

ОБЛАСТИ ПРИМЕНЕНИЯ ТЕСТОВ СПОСОБНОСТЕЙ
Традиционное применение тестов способностей состоит в исполь­зовании их для прогноза будущей успешности претендентов при вы­боре определенной профессии. Зарубежные психологи исходили из того, что н

ОБЪЕКТ И МЕТОДЫ
Мотивация занимает ведущее место в структуре личности и явля­ется одним из основных понятий, которое используется для объясне­ния движущих сил поведения, деятельности. Процесс теоретическо­го осмыс

ИЗМЕРЕНИЕ МОТИВАЦИИ ДОСТИЖЕНИЯ
В результате многолетних исследований, проведенных большой группой исследователей, не только разработана одна из наиболее до­стоверных теорий мотивации, но и создан - на основе этой теории валидный

ОПРОСНИК ДЛЯ ИЗМЕРЕНИЯ ПОТРЕБНОСТИ В ДОСТИЖЕНИИ
Существующие методики измерения потребности в достижении (ПД) методом тематической апперцепции неудобны для массовых об­следований, требуют высокой психологической квалификации иссле­дователя, спец

ТЕСТ ЮМОРИСТИЧЕСКИХ ФРАЗ
Тест юмористических фраз (ТЮФ) — оригинальная, компактная методика диагностики мотивационной сферы личности, соединяю­щая в себе достоинства стандартизованного измерительного теста и индивидуализир

ОБЪЕКТ И МЕТОДЫ
  Сфера межличностных отношений чрезвычайно широка. Она охватывает практически весь диапазон существования человека, на­чиная от его отношения к большим социальным группам (нации, ра­

Образец матрицы поведения ребенка
Таблица 10   Предыдущее поведе­ние матери Регистрация последующего поведения ребенка    

СОВМЕСТНЫЙ ТЕСТ РОРШАХА ДЛЯ ДИАГНОСТИКИ НАРУШЕНИЙ СЕМЕЙНОГО ОБЩЕНИЯ
  Практическое применение конкретных диагностических приемов в области семейного консультирования оправдано лишь в той мере, в какой полученные данные не дублируют «семейный диагноз»,

Диагностическая процедура
Для исследования необходимы: лист белой бумаги (21 х 29 см), шесть цветных карандашей (черный, красный, синий, зеленый, жел­тый, коричневый), резинка. Ребенку дается инструкция: «Нарисуй, пожалуйст

Интерпретация полученных результатов
Предлагаемые ниже интерпретации результатов, полученных при использовании методики «Рисунок семьи» основываются на работах А. И. Захарова (1982), В. Хьюлса (Hulse W., 1951), Дж. Ди Лир (Di Leo J» 1

ЦВЕТОВОЙ ТЕСТ ОТНОШЕНИЙ
Цветовой тест отношений - это невербальный компактный диаг­ностический метод, отражающий как сознательный, так и частично неосознаваемый уровень отношений человека. Его использование опи­рается на

Репертуарные матрицы
Прежде чем перейти к описанию способов заполнения решеток и анализа данных, мы считаем необходимым подчеркнуть, что ТРР ориен­тирована на работу с компьютером. Существуют и ручные методы, но они, д

САМОСОЗНАНИЕ КАК ОБЪЕКТ ПСИХОДИАГНОСТИКИ
Самосознание -это прежде всего процесс, с помощью которого человек познает себя. Но самосознание характеризуется также сво­им продуктом - представлением о себе, «Я-образом» или «Я-концепцией»[33].

МЕТОДИКИ ПСИХОДИАГНОСТИКИ САМОСОЗНАНИЯ
В области психодиагностики самосознания используются основ­ные традиционные и вновь разрабатываемые классы методик: стан­дартизованные самоотчеты в форме описаний и самоописаний (тест-опросники, сп

ОПРОСНИК САМООТНОШЕНИЯ
Опросник самоотношения представляет собой многомерный пси­ходиагностический инструмент, основанный на принципе стандарти­зованного самоотчета (Столин В. В., 1985). Опросник содержит 62 пун

МЕТОДИКА УПРАВЛЯЕМОЙ ПРОЕКЦИИ
Методика управляемой проекции относится к рефрактивным тех­никам - разновидности проективных техник. Основной принцип ме­тодики состоит в том, что испытуемому предъявляют его собствен­ный словесный

МЕТОДЫ ИЗМЕРЕНИЯ ЛОКУСА КОНТРОЛЯ
Одной из важных интегральных характеристик самосознания, связывающих чувство ответственности, готовность к активности и переживание «Я», является качество личности, получившее название локуса контр

МЕТОДИКА КОСВЕННОГО ИЗМЕРЕНИЯ СИСТЕМЫ САМООЦЕНОК (КИСС)
Среди предшественников методики КИСС следует указать тест самооценки Дж. Лиггетта (Liggett J., 1959), известный также под на­званием «Тест лиу». Процедура теста требует попарного сравнения предъявл

Оценка валидности и надежности методики КИСС
Оценка конструктнойы валидности методики КИСС основана на предположении о возможности воспроизведения реальной деятель­ности самооценивания с помощью этой методики. Доказано, что срав­нение схемати

ЗАКЛЮЧЕНИЕ
Мы надеемся, что психологи, профессионально связанные с пси­ходиагностикой, смогут извлечь из публикуемой книги пользу для своей научной или практической деятельности. Мы также надеемся, ч

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги