Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Социально-психологическая диагностика.-1

.pdf
Скачиваний:
3
Добавлен:
20.11.2023
Размер:
6.19 Mб
Скачать

трудоемкой работы с применением аппарата математической статистики были определены границы возрастных норм умственного развития. Они находятся в диапазоне от 84 до 116. Интерпретируется это так: результаты испытуемых, которые не выходят за эти границы, находятся в пределах нормы. Те, чьи результаты менее 84, находятся ниже нормы, а те, чьи результаты более 116, – выше нормы. Соответственно, тот мальчик 6 лет имеет результат выше нормы, но очень незначительно.

Нормы для каждой группы должны быть представлены в средних величинах и показателях стандартного отклонения. Расчет средней величины элементарен и хорошо известен, а стандартное отклонение определяется с помощью формулы

SD =

nΣX 2 (ΣX )2

 

,

n(n 1)

где SD – стандартное отклонение, X2 – результат всего опросника всех испытуемых, n – количество испытуемых, Σ – сумма.

Наиболее распространенные психологические тесты имеют разные тестовые нормы для мужчин и женщин, разных возрастных и этнических групп и для лиц с разным образовательным уровнем. Полезность теста может зависеть от адекватности его норм.

Созданием стандартизованного теста и его публикацией обычно завершается работа психолога, однако следует помнить и о том, что с течением времени необходим пересмотр (ревизия) теста. Например, в тестах интеллекта нормы устаревают через каждые 5 лет,

иможно предположить, что процесс их старения будет ускоряться.

2.Объективность. Говоря, что тестирование объективно, прежде всего имеют в виду обсчет его результатов. Объективный обсчет результатов использования теста означает, что, кто бы ни занимался этим, результат будет один и тот же. Субъективные суждения или предвзятость оценщика не должны влиять на процесс обсчета результатов тестирования.

31

Обсчет результатов использования объективных тестов (например, таких, вопросы которых предусматривают ответы на основе выбора из нескольких предложенных альтернатив или ответы «ложь»/«правда») – механический процесс, не требующий ни специальных знаний, ни специальной подготовки. Если известен «ключ» в виде правильных ответов, тогда и менеджер по работе с персоналом, и кандидат по психологии, и компьютерная программа могут безошибочно обсчитать результаты использования объективного теста.

Обсчет результатов использования субъективных тестов (например, тесты, содержащие вопросы, ответы на которые тестируемый формулирует сам) – более сложная процедура, и на ее результаты вполне могут повлиять индивидуальные особенности оценщика, включая его симпатию/антипатию к тестируемому. Чтобы оценка была непредвзятой, предпочтение следует отдать объективным тестам.

3. Надежность – это воспроизводимость или стабильность результатов тестирования.

Если распределение тестовых оценок какой-либо группы, прошедшей тестирование какого-либо психического свойства, имеет простую среднюю арифметическую 100, а через неделю у той же группы эта мера средней тенденции окажется 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования. Но, если эта разница существенна, значит, либо в самом тесте, либо в методике обсчета есть какой-то недостаток.

Известно три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста (параллельных форм) и метод определения надежности расщеплением (надежность частей теста).

Метод определения ретестовой надежности (для проверки стабильности диагностируемого признака, свойства) основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок.

32

Чем меньше коэффициент корреляции (называемый в данном случае коэффициентом надежности) отличается от +1 (идеального значения для положительной корреляции), тем более надежным считается тест. В идеале коэффициент надежности теста должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений.

Экономически невыгодно дважды отвлекать людей только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше. Поэтому повторное тестирование должно быть отделено от первого бо- лее-менее значительным временным интервалом, обычно не менее месяца. Некоторые психологи настаивают на интервале между тестированиями не менее 6 месяцев (например, П. Клайн).

Надежность взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая (требуются убедительные доказательства их эквивалентности) и дорогостоящая процедура.

Надежность частей теста (для проверки надежности измерительного инструмента, говорящего об его однородности) заключается в том, что после однократного применения теста входящие в него вопросы делят пополам, на две части (обычно на четные и нечетные задания), которые отдельно обрабатываются, а затем результаты двух полученных рядов коррелируются между собой. Если методика однородна, то большой разницы в успешности решения по таким половинкам не будет и, следовательно, коэффициент корреляции будет достаточно высоким (он должен быть не ниже +0,75). Обычно к этому способу определения надежности рекомендуется прибегать

33

только в тех случаях, когда необходимо быстро получить результаты. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием.

Подчеркнем, что наилучшей процедурой определения надежности является проведение повторных исследований через более или менее значительные временные интервалы. Все исследования надежности должны выполнятся на достаточно больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надежность – важная характеристика теста, но сама по себе ценности не представляет. Она необходима для достижения валидности.

Современный тест – это не только надежный, но и валидный тест, однако не на все случаи жизни, а разработанный для конкретной цели.

4. Валидность – наиболее важное из всех требований, которым должен удовлетворять психологический тест. Необходимо доказать, что данный тест действительно измеряет тот параметр, для измерения которого онпредназначен. Различают несколько типов валидности.

Очевидная валидность описывает представление о тесте, сложившееся у испытуемого. Тест должен восприниматься обследуемым как серьезный инструмент познания его личности, чем-то схожий с вызывающим трепет медицинским диагностическим инструментарием. Очевидная валидность приобретает особое значение в современных условиях, когда представление о тестах в общественном сознании формируется многочисленными публикациями в популярных газетах и журналах того, что можно назвать квазитестами, с помощью которых читателю предлагается определить все, что угодно: от интеллекта до совместимости с будущим супругом.

Конкурентная валидность оценивается по корреляции разработанного теста с другими, валидность которых относительно измеряемого параметра установлена. Данные о конкурентной валидности полезны тогда, когда есть неудовлетворительно работающие тесты для измерения некоторых переменных, а новые создаются для того, чтобы улучшить качество измерения.

34

Прогностическая валидность устанавливается с помощью корреляции между показателями теста и некоторым критерием, характеризующим измеряемое свойство, но в более позднее время у одного испытуемого. Например, прогностическая валидность какоголибо теста интеллекта может быть показана корреляцией его показателей, полученных у испытуемого в возрасте 10 лет, с академической успеваемостью в период окончания средней школы.

Л. Кронбах считает прогностическую валидность наиболее убедительным доказательством того, что тест измеряет именно то, для чего он был предназначен. Основная проблема, с которой сталкивается исследователь, пытающийся установить прогностическую валидность своего теста, состоит в выборе внешнего критерия. Так, академическая успеваемость традиционно используется в качестве внешнего критерия при валидизации тестов интеллекта, но в то же время хорошо известно, что успехи в обучении далеко не единственное свидетельство высокого интеллекта.

Содержательная валидность характеризует степень соответствия тестовых вопросов тем навыкам и знаниям, для оценки которых этот тест предназначен. На практике для определения содержательной валидности подбираются эксперты, которые указывают, какая область поведения наиболее важна, например для музыкальных способностей. А затем исходя из этого генерируются задания теста, которые вновь оценивают эксперты. Например, если я сейчас объявлю о проведении опроса по материалу, который мы уже рассмотрели, то вопросы, относящиеся к содержанию данной дисциплины, но не рассмотренные нами, невалидны по содержанию.

Инкрементная валидность имеет ограниченное значение и относится к случаю, когда один тест из субтестов в структуре теста может иметь низкую корреляцию с критерием. Как правило, в качестве критерия выступают результаты деятельности, экспертные оценки (даже незначимую связь, которая компенсируется высокой связью с критерием других субтестов). В этом случае данный субтест разрешается не изымать из теста, но надо оговаривать, что валидность по критерию в данном случае имеет инкрементную форму,

35

свидетельствующую о более низком уровне валидности теста, хотя и достаточном.

Дифференциальная валидность также имеет ограниченное зна-

чение и имеет место тогда, когда результаты одного и того же теста по-разному коррелируют с разными критериями (т.е. на результаты сопоставления критерия с тестом оказывают влияние индивидуаль- но-психологические особенности). Следовательно, измеряемое свойство имеет несколько сторон и для их измерения надо использовать несколько критериев. Например, тест интеллекта по Векслеру измеряет два разных интеллекта – вербальный и невербальный. Поэтому лучше выбрать два разных критерия, соответствующих той и другой составляющей данного теста.

Конструктная валидность демонстрируется полным, насколько это возможно, описанием переменной, для измерения которой предназначается тест. По сути, конструктная валидность включает в себя все подходы к определению валидности, которые были перечислены выше.

Можно считать, что решение вопроса о конструктной валидности теста представляет собой поиск ответа на два вопроса:

1.Существует ли реально некоторое свойство?

2.Надежно ли измеряет данный тест индивидуальные различия по этому свойству?

Из вышесказанного следует, что не существует какого-либо единичного показателя, с помощью которого устанавливается валидность психологического теста. Нельзя осуществить точные статистические расчеты, подтверждающие валидность методики (как при надежности). Тем не менее разработчик должен представить весомые доказательства в пользу валидности теста. Разработка тестов – творческий акт, и именно поэтому известных и завоевавших популярность методик, несмотря на множество изобилующих рецептами книг по их изготовлению, не так уж и много, что хорошо известно любому психологу-практику.

Далее обратимся к анализу заданий психологического теста.

36

В первую очередь необходимо определить количество заданий

(спецификацию) теста.

Прежде чем приступить к созданию теста, необходимо четко знать, для чего он нужен. Поэтому первым шагом будет формулирование цели будущего теста. После этого следует обратиться к разработке спецификации будущего теста. Наиболее удобно сделать это в виде таблицы, в которой по горизонтали будут располагаться содержательные области, которые предполагается измерять. А по вертикали – их манифестации – пути, по которым содержательные области могут проявляться (табл. 1).

Например, при конструировании «Опросника супружеского статуса» Дж. Руст и С. Голомбок (1988) основывались на опросе экспертов, в качестве которых выступали семейные терапевты и консультанты, а также на данных, полученных от клиентов этих специалистов. Экспертов просили назвать те области взаимоотношений между мужчиной и женщиной, которые они полагали наиболее важными для гармоничного брака. Информация от клиентов позволила обнаружить те проблемные зоны семейной жизни, в которые супруги хотели бы внести изменения.

На этой основе были выделены следующие содержательные области:

совместные интересы;

степень зависимости / независимости;

вербальная и невербальная коммуникация;

доверие и уважение.

А в качестве манифестации «вербальных и невербальных коммуникаций» между супругами рассматривались «установки и чувства, проявляющиеся в отношениях».

Из практических соображений обычно по каждой оси разрабатывается от 4 до 7 категорий. Меньшее число категорий часто приводит к созданию слишком узкого опросника, а большее может сделать обременительным процесс конструирования опросника. В итоге получается своего рода решетка, количество ячеек в которой будет равно количеству планируемых для изучения параметров, умноженному на количество их поведенческих манифестаций.

37

Таблица 1

Спецификация будущего опросника

Манифестации

 

Содержательные области

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Далее необходимо определить, сколько заданий, например вопросов, должно быть создано для каждой из ячеек. При решении этой задачи следует руководствоваться тем, насколько важным представляется исследователю измерение одного из параметров сравнительно с другими. В решетке, приведенной в табл. 2, допускается, что содержательным областям, обозначенным как А и В, следует приписать 40%-ный вес, а С и D – 10%-ный вес. В целом процентный вес всех содержательных областей (по горизонтали) и всех манифестаций (по вертикали) должен составлять 100 %.

Таблица 2

Определение процентного веса содержательных областей, манифестаций, а также количества заданий опросника

Манифестации

 

Содержательные области

 

Количество

 

 

 

 

 

 

заданий

А 40 %

 

В 40 %

С 10 %

 

D 10 %

А (25 %)

8

 

8

2

 

2

20

В (25 %)

8

 

8

2

 

2

20

С (25 %)

8

 

8

2

 

2

20

D (25 %)

8

 

8

2

 

2

20

Количество

32

 

32

8

 

8

80

заданий

 

 

 

 

 

 

 

 

 

Следующий шаг состоит в том, чтобы решить, какое количество заданий должно быть включено в тест. И здесь перед исследователем возникает дилемма: обеспечение, с одной стороны, надежности теста, что требует увеличения заданий, а с другой – минимиза-

38

ция количества заданий для обеспечения эффективной работы испытуемого с ними (поддержание концентрации внимания в ходе обследования). Так, для достижения удовлетворительной надежности опросника требуется не менее 20 заданий, выполнение которых обычно занимает не более 10 минут.

Наконец, важную роль в определении количества заданий теста играют особенности того контингента, который предполагается обследовать. Обычно при пилотажном исследовании, проводимом разработчиками, количество заданий должно быть по крайней мере на 50 % больше числа тех, которые будутвключены вокончательную версию.

Для того чтобы подсчитать количество заданий для каждой ячейки, мы в нашем случае делаем следующее: количество заданий для левой крайней ячейки решетки равно отношению 25 % к 32 заданиям, что составляет 8 заданий – 25:100·32 = 8 (умножают общее количество заданий, предназначенных для измерения некоторого свойства личности, на процентный вес его поведенческих проявлений). Если не получается целое число заданий для каждой ячейки, следует его округлить.

Существуют следующие требования к разработке заданий теста:

в каждом задании может быть задан только один вопрос или сформулировано одно утверждение;

каждое задание (вопрос) должно быть сформулировано предельно ясно и просто. Необходимо избегать двусмысленных формулировок и придерживаться, насколько это возможно, наиболее простых вариантов ответов;

стремиться к тому, чтобы обследуемые не могли догадаться

отом, дляизмерения какой черты предназначено то или иное задание;

задания должны отражать конкретные, а не общие аспекты изучаемой области поведения. Например, вместо задания «Нравится ли вам спорт?» лучше использовать более конкретный вопрос: «Вы регулярно играете в какую-нибудь спортивную игру?»;

следует избегать употребления таких слов, как «часто», «редко» и т.п. Иначе говоря, в формулировке заданий нужно очень осто-

39

рожно прибегать к словам, указывающим на частоту действий. То, что одним испытуемым интерпретируется как «часто», для другого совсем не так. Примером может служить вопрос «Часто ли вы употребляете спиртные напитки?». Ответ на этот вопрос не отражает реального положения дел, а характеризует субъективное мнение обследуемого (разумеется, в ряде случаев именно это мнение и интересует исследователя);

также следует избегать терминов, выражающих чувства. Лучше представить задание в контексте поведения. Например, задание «Нравится ли вам чтение художественной литературы?» лучше заменить на «Читаете ливы художественную литературу постоянно?»;

очень важно, чтобы любой из предлагаемых вариантов ответа воспринимался испытуемым как возможный, вероятный. Ответ, воспринимаемый как неправильный, будет иметь малую вероятность выбора.

После разработки всех заданий к ним следует вернуться через некоторое время и попытаться еще раз оценить их формулировки, убедиться в том, что все они легко понимаются и не содержат двусмысленностей. Для этого рекомендуется привлечь хотя бы двухтрех экспертов.

Основные проблемы, возникающие при разработке заданий личностных опросников, касаются актуализации факторов, имеющих установочную природу. Кратко остановимся на способах действия наиболее известных установок.

Установка на согласие может быть преодолена с помощью введения так называемых обратных заданий, причем их количество должно быть равно или почти равно числу «прямых» заданий. Например, утверждение «Я удовлетворен отношениями с моей матерью» может быть дополнено обратным «Я не удовлетворен отношениями с моей матерью». При введении обратных заданий необходимо тщательно выверить их смысл и убедиться в том, что они имеют то же самое значение, что и те, из которых были образованы. Также следует избегать двойных отрицаний.

40