Концепции тестирования и измерения

 

Существует множество важных концепций тестирования, и мы будем их приводить в ходе обсуждения оценки персонологами тех или иных характеристик людей. До того, как тот или иной способ тестирования получит право считаться научно приемлемым методом измерения индивидуальных различий, он должен пройти проверку по четырем специальным критериям. Эти критерии — стандартизация, нормы, надежность и валидность.

Стандартизация.Ключевым аспектом измерения личностных характеристик является стандартизация.Стандартизация подразумевает единообразие процедур проведения теста и подсчета результатов. Например, в случае применения шкал самооценки экспериментатор должен приложить максимальные усилия и убедиться, что все испытуемые читают и понимают отпечатанные инструкции, все отвечают на одни и те же вопросы, а также укладываются в заданные временные интервалы. Стандартизация также предполагает наличие следующей информации (обычно содержащейся в прилагаемом руководстве): при каких условиях тест можно или нельзя проводить, кто должен или не должен подвергаться тестированию (контрольная группа), процедуры обсчета теста, а также интерпретация полученных результатов.

Нормы.Стандартизация личностного теста включает также информацию о том, является ли данная конкретная «сырая (первичная) оценка» низкой, высокой или средней относительно других «сырых оценок» теста. Такая информация, называемая тестовыми нормами, служит стандартом, с которым сравниваются оценки испытуемых. Обычно сырые тестовые оценки переводятся в процентильные показатели, которые обозначают процентную долю испытуемых из выборки стандартизации, первичная оценка которых ниже или равна первичной оценке данного испытуемого. Например, вы можете использовать шкалу депрессии из тридцати вопросов и получить первичный тестовый результат 18 (то есть ваши ответы в 18 случаях совпали с признаками депрессии, перечисленными на листке с правильными ответами). Сам по себе показатель 18 ничего не значит до тех пор, пока вы не обратитесь к тестовым нормам и не убедитесь, что ваш результат соответствует 75 процентилям. Эта информация говорит о том, что вы в большей степени подавлены, чем 75 % из выборки ранее обследованных людей, образующих нормативную группу. Таким образом, тестовые нормы позволяют сравнивать оценки отдельных индивидуумов с оценками группы стандартизации, что в результате дает количественную оценку положения испытуемого относительно нормативной группы.

Надежность.Другое требование ко всем методам оценки личности заключается в том, что они должны быть надежными.Это означает, что повторное проведение того же самого теста или другой формы этого теста должно давать приемлемо сходные результаты или оценки. Таким образом, надежность имеет отношение к постоянству или стабильности метода оценки, которая обнаруживается при повторном обследовании данной группы людей. Количественно постоянство метода оценки определяется коэффициентом ретестовой надежности (Anastasi, 1988). Коэффициент ретестовой надежности равен обычной корреляции между результатами, полученными на одних и тех же испытуемых в каждом из двух случаев проведения теста. Ретестовая надежность дает нам оценку постоянства теста во времени. Хотя не существует каких-либо фиксированных величин приемлемого уровня надежности, коэффициенты надежности для большинства стандартизованных психологических тестов выше +0,70. Чем ближе величина коэффициента надежности к +1, тем более надежным является тест (то есть оценки испытуемых при повторном тестировании вплотную приближаются к оценкам при первом тестировании). Второй вид надежности определяют путем коррелирования параллельных форм теста. Для этого чаще всего тест делят на две сопоставимые части (например, на четные и нечетные пункты), потом по каждой половине рассчитывают суммарные баллы и между двумя рядами баллов по испытуемым рассчитывают допустимые коэффициенты корреляции. Полученный таким образом коэффициент называют коэффициентом внутренней согласованности.Внутренняя согласованность отражает внутреннее постоянство теста. Если обе части теста измеряют одно и то же свойство личности, то испытуемые, получившие высокие оценки по нечетным пунктам, должны также получить высокие оценки и по четным; а те, кто получил низкие оценки по нечетным пунктам, должны получить низкие оценки и по четным пунктам (что снова выразится в высокой положительной корреляции).

Третий тип надежности основывается на корреляции между двумя сопоставимыми вариантами одного и того же теста (состоящими из аналогичных вопросов), проведенного на одной и той же группе испытуемых. Если по этим разным формам теста получены примерно одинаковые оценки, тест обладает надежностью параллельных форм.В таком случае положительная корреляция между двумя взаимозаменяемыми формами будет означать, что пункты обоих вариантов теста измеряют одно и то же.

Наконец, надежность также касается того, насколько будут согласны между собой двое или более экспертов при подсчете результатов одного и того же теста. Этот тип надежности называется надежностью субъективных оценок.Надежность субъективных оценок должна обязательно учитываться, если тест предполагает субъективные интерпретации, подобные тем, что дают персонологи при оценке результатов проективных тестов. Этот тип надежности имеет особенно низкие значения в отношении любых качественных методов, таких как интервью, анализ сновидений и других форм свободных ответов, не поддающихся количественной оценке. Однако согласованность возрастает, когда эксперты пользуются руководствами, содержащими четкие правила оценки и инструкции для анализа подобных данных (Yin, 1984).

Валидность.Хотя надежность имеет очень большое значение, она, тем не менее, не является единственным решающим критерием оценки пригодности теста. Возможно, даже более важным является вопрос о том, измеряет ли тест именно то, что он предназначен измерять, а также предсказывает ли он именно то, что предполагалось предсказывать с его помощью. Эта проблема имеет отношение к кардинальному критерию достоинства оценочной техники — валидности.Психологи часто различают три типа валидности: 1) содержательная валидность, 2) критериальная валидность и 3) конструктная валидность.

Содержательная валидность. Чтобы считаться валидным, метод оценки должен включать такие пункты, содержание которых соответствует репрезентативной выборке измеряемой области поведения. Предположим, перед нами тест, измеряющий застенчивость. Для того чтобы быть валидным по содержанию, он должен состоять из вопросов, которые действительно раскрывают личностные аспекты застенчивости (например, «Является ли застенчивость основным источником вашего личностного дискомфорта?»), социальные аспекты застенчивости (например, «Смущаетесь ли вы, когда выступаете перед большой аудиторией?») и когнитивные аспекты (например, «Убеждены ли вы в том, что окружающие всегда осуждают вас?»). Валидный по содержанию тест застенчивости должен оценивать каждый из компонентов, входящих в понятие «застенчивость». Содержательная валидность почти всегда определяется путем соглашения экспертов о том, что каждый пункт теста фактически отражает аспекты переменной, или личностного качества, подлежащие измерению.

Критериальная валидность. Оценка личности обычно предпринимается с целью прогнозирования определенных аспектов поведения индивидуума. Предсказание поведения может касаться успешности обучения в аспирантуре, адекватности терапевтической программы, профессиональной успешности и многого другого, за очень небольшими исключениями. То, с какой точностью результаты теста предсказывают интересующий нас аспект поведения индивида в настоящем или будущем, определяется корреляцией оценок субъектов по данному тесту и показателей по некоему критерию, не зависящему от того, что должен предсказать тест. Например, предположим, что критерий — успеваемость в школе права — измеряется по среднему баллу успеваемости, тогда SAT будет считаться валидным, если он будет точно предсказывать средний балл успеваемости.

Различают два подтипа критериальной валидности. Первый получил название прогностическая валидность.Прогностическая валидность определяется способностью теста предсказывать поведение в будущем, соответственно критерию. Тест измерения интеллекта прогностически валиден, если он точно предсказывает оценки в школе. Второй подтип имеет название текущая валидность. Текущая валидность определяется величиной значимой корреляции результатов данного теста с другими имеющимися критериальными оценками. Например, если оценки пациента по тесту, измеряющему параноидные тенденции, положительно коррелируют с оценками выраженности параноидных тенденций, данными клиническими психологами, то мы можем говорить о наличии текущей валидности. Конечно, клиницисты в этом случае не должны знать заранее о результатах тестирования. Иначе имеющаяся у них информация может повлиять на оценки, которые они дают — это явление называется контаминацией критерия.

Конструктная валидность. Третий тип валидности, один из наиболее важных для оценки личности как целого, называется конструктная валидность. Она отражает степень репрезентации исследуемого психологического конструкта в результатах теста (Cronbach, Meehl, 1955). Абстрактная природа многих психологических конструктов — таких как самоактуализация, эго-идентичность, социальный интерес и вытеснение — усложняет тестирование и придает результатам неопределенность. Попросту говоря, для этих и других абстрактных концепций функционирования личности (или того, что мы иначе называем гипотетическими конструктами)не существует твердо установленных критериальных величин. Хотя иногда можно наблюдать примеры вытеснения, само вытеснение недоступно прямому наблюдению, оно не имеет физических проявлений. Далее, гипотетический конструкт, существование которого невозможно доказать на основании какого-либо поведенческого критерия, для психологии личности бесполезен, поскольку она использует для получения знаний эмпирический подход. Именно здесь и встает вопрос о конструктной валидности.

Конструктная валидизация — это процесс сбора доказательств того, что тест измеряет определенный гипотетический конструкт, выведенный из теории. Это сложный и трудоемкий процесс, требующий проведения многих исследований, в ходе которых подвергаются проверке корреляции между тестовыми оценками и теми величинами, которые предположительно связаны с рассматриваемой концепцией. Один путь валидизации заключается в установлении корреляций между тестовыми оценками исследуемого конструкта и показателями другого теста, который предположительно измеряет тот же самый конструкт. Эта процедура на практике известна как конвергентная валидизация (Campbell, Fiske, 1959). Предположим, перед нами новый тест, который, как мы думаем, измеряет конструкт самооценки. Если этот наш новый тест на самом деле измеряет самооценку, он должен положительно коррелировать с другой процедурой измерения самооценки, хорошо зарекомендовавшей себя и валидной. Если несколько разных измерений самооценки согласуются друг с другом и с нашим новым тестом, мы имеем некоторые доказательства конструктной валидности нашего нового теста самооценки.

Другой путь установления конструктной валидности — показать, что вновь разработанная измерительная процедура не коррелирует с показателями, для измерения которых данная процедура не предназначена, явно не связанными с концептуальным определением, данным теоретиком. Этот аспект валидизации известен на практике под рабочим названием дивергентная валидность (Campbell, Fiske, 1959). Например, если наш новый тест самооценки не коррелирует со значениями других тестов, разработанных для измерения концептуально отличных от представленных в нем качеств, мы получаем доказательства дискриминантной валидности (поскольку наша процедура измерения самооценки отличается от тех, что измеряют не самооценку, а нечто другое, так и должно быть). Это важный этап установления конструктной валидности оценочной процедуры.

Перечисление трудностей, сопряженных с демонстрацией конструктной валидности методов оценки, выходит далеко за пределы темы данной книги. Однако, поскольку мы сейчас рассматриваем различные типы подходов к оценке личности, мы должны помнить, что достоинство любого метода оценки определяется в конце концов его конструктной валидностью. Если данная методика содержит признаки слабой конструктной валидности, то в процессе ее использования мы можем получить результаты, не имеющие ничего общего с проверяемой концепцией.

 

 

Типы методов оценки

 

Персонологи в процессе сбора информации о людях используют множество разнообразных методов оценки. К ним относятся опросники, методы чернильных пятен, личные документы, процедуры оценки поведения, характеристики, даваемые сверстниками, рассказы о самих себе. Каждый метод имеет свои преимущества и недостатки в отношении способов получения ответа, подсчета и интерпретации данных, надежности и валидности. В этом разделе мы рассмотрим три направления измерения или оценки личности: интервью, личностные опросники и проективные методы.

 

Интервью как метод оценки

 

Интервью — один из наиболее старых и широко распространенных методов получения информации о людях (Aiken, 1984). В интервью персонолог получает информацию, задавая интервьюируемому определенные вопросы и выслушивая ответы. Интервьюер и респондент ведут диалог лицом к лицу, стремясь достичь определенного результата. Фактически сам способ проведения интервью зависит от конкретной интересующей темы или цели. Например, интервью при приеме на работу имеет целью оценить особенности личности, необходимые в данной деятельности. Интервью как метод научного исследования направлено на сбор информации о личности в рамках определенной темы исследования. Клиническое интервью служит цели диагностики проблем пациента и выбора терапии, наиболее адекватной установленному диагнозу. При всем разнообразии форм интервью их можно разделить на структурированные или неструктурированные. В интервью первого типа вопросы тщательно сформулированы и умело выстроены в нужном порядке. Схему структурированного интервью иллюстрирует, например, такая последовательность заранее составленных вопросов: «Как давно вы состоите в браке?», «Сколько детей у вас и у вашего супруга?», «Считаете ли вы, что детям нужно разрешать делать все, что они захотят?», «Если бы у вас был ребенок-подросток, разрешили бы вы ему или ей бросить школу и пойти работать на неполный рабочий день?» Как можно заметить, наиболее личные и содержащие потенциальную угрозу вопросы задаются в конце. Смысл стратегии, заключающейся в предъявлении сначала общих и безобидных вопросов, состоит в подготовке почвы для получения более интимной информации, что возможно благодаря чувству доверия к интервьюеру, возникшему у респондента в начале беседы (White, Spiesman, 1982).

В неструктурированном интервью, наоборот, вопросы построены так, чтобы у респондента оставалась определенная свобода в ответах. Интервьюер может заметить: «Вы чувствуете, что ваш супруг действительно унижает вас» или: «Это, должно быть, очень тяжелые переживания». Респондент сам выбирает, о чем бы он хотел рассказать в ответ на подобные вопросы. В свою очередь, и интервьюер может в этом случае отказаться от выбранной ранее тактики опроса, если ему кажется, что она не дает полезной информации, и выбрать другое направление беседы. По сравнению со структурированным интервью неструктурированное позволяет персонологу более гибко зондировать мысли и чувства респондента в контексте ответов на задаваемые вопросы.

Сила и слабость метода интервью.Интервью, когда его проводит опытный интервьюер, может давать чрезвычайно полезную информацию о личности индивидуума и его жизненной ситуации. Способность эффективно общаться с другими, восприятие себя и значимых других, уровень тревоги, планы на будущее и удовлетворенность работой — вот только некоторые примеры той информации, которую можно получить из удачно проведенного интервью. Хорошо спланированное интервью может также быть полезным в исследовании, посвященном проверке научной гипотезы. В то же время, когда респонденты свободны в выборе тем для рассказа о своем прошлом и настоящем и имеют возможность переходить от одного вопроса к другому без ограничений, могут возникнуть проблемы надежности и валидности. Действительно, нет достаточных оснований считать, что неструктурированное интервью более надежно или валидно. Структурирование вопросов — один из путей повышения надежности и валидности информации, получаемой в интервью. Вот почему структурированная форма оказывается более предпочтительной для клинических психологов при определении терапевтической стратегии.

Как уже было отмечено, метод интервью может быть богатым источником информации о личности. Тем не менее, интерпретация этих данных носит в высшей степени субъективный характер, и на нее могут оказывать влияние пристрастия самого интервьюера. Кроме того, личность интервьюера может незаметно влиять на то, насколько открытым и искренним проявит себя респондент во время интервью. С последним фактором связано возможное утаивание и искажение жизненно важной информации. Но все-таки интервью, особенно дополненное информацией, полученной из более объективных источников, является одним из основных и необходимых методов оценки личности.

 

Методики самоотчета

 

Ни одна работа, посвященная оценке индивидуальных различий, не будет полной без обсуждения результатов, полученных с помощью опросников самоотчета. Фактически опросники самоотчета используются более широко, чем любая другая форма оценки личности. В такого типа исследовании испытуемым предлагают отвечать письменно на бланке на вопросы, касающиеся особенностей их характера, ценностей, установок, мотивов, чувств, интересов и способностей. В нашей книге упоминается огромное количество такого рода тестов. Термин «самоотчет» в данном случае используется в значении какой-либо информации, которую субъект прямо сообщает о себе путем ответа на определенные вопросы или путем выбора одного из имеющихся утверждений при условии ограниченного количества вариантов (например, «да», «нет», «всегда», «не знаю»). На рис. 2-3 приведены различные виды форм, используемых обычно при изучении личности методом самооценки.

 

Я злюсь, когда другие меня критикуют Да Нет Трудно сказать

(Обведите кружком свой вариант ответа)

 

Меня очень волнует, нравлюсь ли я другим 1. Очень похоже на меня 2. Умеренно похоже на меня 3. Кое в чем похоже на меня 4. Не совсем похоже на меня 5. Не похоже на меня 6. Совершенно не похоже на меня

(Обведите кружком наиболее подходящий ответ)

 

Я стараюсь контролировать свои эмоции
Никогда Редко Иногда Часто Всегда

(Обведите кружком ответ, наилучшим образом характеризующий ваши чувства)

 

Дружелюбный ___ Подавленный ___ Надежный ___ Предусмотрительный ___ Доминантный ___ Уверенный ___

(Отметьте присущие вам черты)

 

Я чувствую себя ужасно, когда говорю неправду
-3 -2 -1 0 1 2 3 Совершенно Совершенно согласен не согласен

(Обведите кружком цифру, соответствующую степени вашего согласия или несогласия)

 

Рис. 2-3. Примеры различных форм регистрационных бланков, применяемых при использовании личностных шкал самоотчета

 

Характерная особенность тестов самоотчета состоит в том, что варианты ответов здесь откалиброваны (см. рис. 2-3). То есть люди, пользующиеся этими тестами, должны выбирать между ответом «верно» и «неверно», согласием и несогласием; или же они должны выбирать из альтернатив, варьирующих от 1 («очень похоже на меня») до 6 («совершенно не похоже на меня») и т. д. Объективность достигается путем ограничения степеней свободы, имеющихся у испытуемого при ответе на пункты теста. Сходным образом стандартизация процедур оценки минимизирует риск влияния личных склонностей того, кто производит оценку теста.

Опросники самоотчета отличаются друг от друга количеством личностных характеристик, измеряемых одновременно. Тесты, предназначенные для оценки одной личностной черты (одномерные тесты),обычно разрабатываются и используются для измерения какого-то определенного аспекта личности. После проведения теста исследователи проверяют, различаются ли испытуемые с низкими и высокими баллами по изучаемому параметру также и по поведенческим характеристикам и различаются ли они, кроме того, по другим личностным параметрам, определяемым также с помощью методов самооценки. Данная методология подразумевает, что измеряемая личностная черта равно присуща всем индивидуумам. Другими словами, каждый человек, принимающий участие в исследовании, может получить высокую (среднюю, низкую) оценку, но при этом оценки всех испытуемых будут одинаково значимыми, поскольку они отражают особенности личности каждого из них. Некоторые одномерные тесты также дают возможность измерять отдельно две или три черты. Примерами одномерных тестов являются «Опросник личностной и ситуативной тревожности» Спилбергера (Spielberger et al., 1970), «Шкала локуса контроля» Роттера (Rotter, 1966), «Шкала стремления к успеху» Цукермана (Zuckerman, 1978) и «Шкала самоконтроля» Снайдера (Snyder, 1974). Оценки по этим тестам предположительно отражают относительно стабильные индивидуальные различия в степени выраженности отдельных черт личности. Существует также множество опросников самоотчета, измеряющих одновременно несколько личностных характеристик. Преимущество этих многомерных тестов заключается в том, что они дают более полное представление о личности. Они очень широко применяются в клинических исследованиях, в практике консультирования и для обследования персонала учреждений. Например, 16-факторный личностный опросник, разработанный Рэймондом Кеттелом (Cattell, 1965), представляет собой тест, состоящий из 187 вопросов и измеряющий 16 исходных черт у здорового человека. Оценки, полученные по каждому из измерений личности (например, доминантность—подчиненность, доверчивость—подозрительность и мечтательность—практичность), наносятся на график для построения профиля личности. Этот профиль может использоваться специалистами, работающими в сфере прикладной психологии, в круг задач которых входит подбор кадров, что требует принятия обоснованных решений о кандидатах. Некоторые многомерные тесты эволюционируют на протяжении десятилетий по мере их применения. Один из таких тестов мы рассмотрим вскоре в качестве примера, но сначала приведем образец одномерного личностного теста.

Одномерные тесты.Существуют буквально сотни одномерных тестов; кроме того, постоянно разрабатываются новые. Объем книги позволяет привести описание только одного из них.

«Шкала самоосознания» (Self-Consciousness Scale). Эта шкала была сконструирована Фенигстейном и сотр. (Fenigstein et al., 1975) с целью измерения двух самостоятельных параметров самоосознания. Первая субшкала оценивает личное самоосознание, определяемое как степень осознания испытуемыми их собственного настроения, установок, мыслей и физического состояния. Образцы вопросов теста:

1. Я всегда стараюсь понять, что со мной происходит.

2. Я быстро реагирую на изменения в своем настроении.

3. Я много размышляю о себе.

Вторая субшкала измеряет общественное самоосознание, определяемое как степень осознанной озабоченности человека по поводу того, как он выглядит в социальных ситуациях. Образцы вопросов теста:

1. Мне не безразлично, как я выгляжу.

2. Я особенно беспокоюсь о том, чтобы произвести хорошее впечатление.

3. Я отдаю себе отчет в том, как я выгляжу со стороны.

Ретестовая корреляция показывает, что обе субшкалы самоосознания достаточно надежны. Кроме того, в нормативных данных отсутствуют различия по признаку пола. Валидность теста устанавливалась путем сравнения социального поведения людей, получивших высокие и низкие результаты по каждой субшкале. Во многих исследованиях показано, что люди с высокими показателями личного самоосознания действуют в большем согласии со своими внутренними особенностями, ценностями и установками (Fenigstein, 1987; Carver, Scheier, 1987). К тому же эти люди лучше способны предвидеть, как они поведут себя в различных обстоятельствах, а также более четко осознают свои эмоциональные реакции на события (Scheier et al., 1978; Scheier, Carver, 1977). He удивительно, что люди с высокими оценками по субшкале общественного самоосознания оказываются более чувствительными к тому, что думают о них другие, а также более строго придерживаются социальных норм и стремятся избежать негативных оценок, чем те, у кого этот показатель выражен слабо. Люди с высокими оценками по данной субшкале также больше озабочены своим внешним видом, чем те, у кого они низкие.

Многомерные тесты.Как было ранее отмечено, эти тесты обычно используются психологами для диагностики психического состояния клиентов или при составлении заключения об их личностных особенностях. Далее мы рассмотрим наиболее широко используемый и изученный многомерный личностный тест.

Миннесотский многоаспектный личностный опросник (The Minnesota Multiphasic Personality Inventory, MMPI). MMPI является самым распространенным многомерным тестом самоотчета (Lubin et al., 1985). Этот тест был разработан С. Хатуэем и Дж. Маккинли в 1940 году (Hathaway, McKinley, 1943) для помощи клиническим психологам в диагностике психических расстройств. Создатели теста были убеждены в том, что тест будет также полезен при оценке эффективности психотерапии. Хатуэй и Маккинли использовали для разработки теста эмпирическую стратегию. Подготовив наборы из сотен утверждений, на которые возможен ответ «да» или «нет», они предлагали ответить на них разным группам пациентов психоневрологических лечебных учреждений, страдавших различными психическими расстройствами. Диагнозы уточнялись в процессе опроса этих пациентов психиатрами. Контрольная группа состояла из родственников и друзей, которые проходили тестирование, когда навещали пациентов в клинике. Все полученные ответы анализировались, и те вопросы, на которые диагностическая группа давала ответы, отличные от ответов контрольной группы, вошли в тест. Например, если люди, у которых была диагностирована депрессия, с большей частотой отвечали на вопрос «Моя жизнь обычно наполнена интересными событиями и делами» отрицательно, то этот вопрос входил в состав шкалы депрессии. Систематически проводя эту оценочную процедуру в группах пациентов с разными психиатрическими диагнозами, создатели теста выделили 10 самостоятельных «клинических шкал» (табл. 2-5). В тест также входят четыре «контрольные шкалы», при помощи которых экспериментатор оценивает, не был ли испытуемый небрежен в работе с тестом, не отвечал ли он лживо и понял ли он инструкцию (см. табл. 2-5). «Шкала лжи», например, предоставляет информацию о том, в какой степени испытуемый дает скорее социально желательные ответы, чем правдивые, стремясь создать о себе благоприятное впечатление («Не могу припомнить, чтобы когда-нибудь я плохо спал ночью»).

 

Таблица 2-5. Шкалы MMPI с примерами наиболее характерных вопросов, а также описанием наиболее типичного поведения, встречающегося у людей с высокими оценками по данным шкалам

Клинические шкалы Вопросы теста (с вариантом ответа, указанным в ключе) Характеристики поведения, связанные с высокими оценками
Ипохондрия (Hs) Временами у меня бывают сильные запоры (Верно) Указывает на цинизм, враждебность, частые жалобы и чрезмерную озабоченность функционированием своего организма
Депрессия (D) Любая работа дается мне ценой больших усилий (Верно) Указывает на переживание хронического стресса, робость, пессимизм
Истерия (Hy) Иногда у меня бывает такое чувство, будто моя голова стянута обручем (Верно) Указывает на состояние подавленности, зависимости от других. Такие лица предъявляют много жалоб соматического характера, которые часто являются необоснованными
Психопатические отклонения (Pd) Люди часто критикуют мои поступки и интересы (Верно) Может указывать на антисоциальное и импульсивное поведение, чреватое неприятностями с представителями закона или официальными лицами
Не знаю, что сказать (?) Количество вопросов, оставшихся без ответа или с пометкой «не знаю» Высокая оценка может указывать на уклончивость
Шкала лжи (L) Я улыбаюсь каждому встречному (Верно) Означает тенденцию описывать себя в наиболее благоприятном свете
Шкала достоверности (F) Я думаю, что против меня составляется заговор (Верно) Указывает на небрежность, невнимательность, спутанность сознания или стремление ввести в заблуждение экспериментатора
Шкала коррекции (K) Меня ужасно задевает, когда меня ругают или критикуют (Неверно) Измеряет степень психологической защиты или отрицание симптомов
Маскулинность — феминность (MF) Я люблю возиться с цветами (Неверно) Указывает на агрессивность и бунтарство у женщин, пассивность и эстетические наклонности у мужчин
Паранойя (P) Временами я нахожусь во власти каких-то злых сил (Верно) Часто указывает на ненормальную подозрительность, бред преследования или величия, настороженность
Психастения (Pt) Иногда мне в голову приходят такие нехорошие мысли, что о них лучше не рассказывать (Верно) Указывает на тревожность, ригидность, чувство собственной несостоятельности
Шизофрения (Sc) Часто у меня бывает такое ощущение, будто все вокруг нереально (Верно) Указывает на состояние помрачения сознания, наличие «сверхценных» идей, возможно, галлюцинации и бред
Гипомания (Ma) Временами у меня мысли текут быстрее, чем я успеваю их высказывать (Верно) Указывает на гиперактивность, импульсивность, оптимизм, в некоторых случаях — на спутанность сознания или дезориентацию
Социальная интроверсия (Si) Мне нравится ходить туда, где шумно и весело (Неверно) Часто указывает на робость, незаинтересованность в других, отсутствие интереса к социальным отношениям

 

Адаптированная и заново стандартизированная версия MMPI была опубликована в 1989 году. Известный как MMPI-2, этот тест содержал то же количество вопросов (567), что и оригинальный опросник, но имел и определенные отличия. Вопросы, сформулированные с позиций мужского шовинизма и не актуальные по содержанию, а также вопросы, вызывающие неприятные чувства, были исключены из текста опросника. Устаревшие нормы заменены более репрезентативными для современной популяции. Эти и другие существенные изменения должны повысить ценность MMPI-2 и сделать его более предпочтительным по сравнению с оригинальной версией теста.

При интерпретации результатов MMPI используются два основных подхода: клинический и экспертный. В процессе клинической интерпретации исследователь просматривает показатели по каждой шкале, отмечает особенности профилей (получаемых в том числе путем объединения в одну группу высоких оценок по определенным шкалам), а также привносит в интерпретацию свой личный профессиональный опыт и знания об индивидуумах с определенными типами профиля, чтобы составить заключение об имеющихся у пациента психологических проблемах и патологических чертах характера. И наоборот, когда осуществляется экспертная интерпретация,психолог (или компьютер) просто использует атласы MMPI, содержащие эмпирически установленные характеристики типов личностных особенностей, соответствующие каждой конфигурации профиля. Процесс сравнения данного профиля личности с большим количеством ранее полученных профилей обеспечивает интерпретацию, основанную на статистических расчетах и нормах (без какой-либо субъективной оценки психолога). Сравнение данного профиля личности с другими профилями также дает возможность клиницисту поставить правильный диагноз и выбрать адекватную терапию для пациента.

Хотя MMPI зарекомендовал себя в качестве ценного диагностического инструмента, его применение ни в коем случае не ограничивается условиями клиники (Kunce, Anderson, 1984). Он применяется, например, для решения вопроса о профессиональной пригодности лиц, желающих устроиться на работу (Dahlstrom et al., 1975). Однако использование MMPI в качестве тестовой процедуры для кандидатов при приеме на работу вызывает в настоящее время споры. Эта проблема фигурировала даже в судебных разбирательствах о посягательстве на тайну личности (Dahlstrom, 1980).

MMPI также широко используют в исследованиях, посвященных изучению динамики семейных отношений, нарушений пищевых привычек, патологической зависимости от тех или иных веществ; суицидов, а также готовности к лечению или реабилитации (Butcher, Keller, 1984). Кроме того, вопросы из этого теста использовались при создании большого количества других личностных тестов, включая «Шкалу проявления тревожности Тэйлора» (Taylor, 1953), «Личностный опросник Джексона» (Jackson, 1974) и «Калифорнийский психологический опросник» (Gough, 1987). Наконец, тот факт, что MMPI переведен примерно на 125 иностранных языков, является свидетельством его популярности и ценности как метода клинической оценки (Butcher, 1984).

Сила и слабость методик самоотчета.Оценка индивидуальных различий — важный аспект персонологии. Однако может возникнуть вопрос: почему, раскрывая эту тему, мы столько внимания уделяем именно самоотчету. Основная причина, возможно, заключается в том, что тесты самоотчета дают более полную, определенную и систематизированную информацию о личности, чем нерегулярно получаемые сведения. В данном случае возможные личные предубеждения или теоретические пристрастия экспериментатора компенсируются таким достоинством метода, как объективность подсчета результатов. Кроме того, с этими тестами может легко работать человек, имеющий относительно небольшую формальную подготовку. Тесты самоотчета обычно обладают большей надежностью по сравнению с другими методами, а это само по себе является определенным преимуществом. Наконец, многомерные опросники позволяют измерять одновременно несколько личностных особенностей.

Несмотря на то, что тесты самоотчета пользуются популярностью у профессиональных психологов, их применение сопряжено с некоторыми проблемами, которые требуют рассмотрения. Основные их ограничения состоят в том, что они не защищены от преднамеренного обмана, влияния эталонов социальной желательности и установочного поведения (Kleinmuntz, 1982).

Персонологам, применяющим методы самоотчета, приходится зависеть от готовности респондентов давать о себе точную информацию. Проблема состоит в том, что в некоторых из шкал самооценки преобладают вопросы, дающие возможность испытуемым относительно легко вводить исследователя в заблуждение. Умышленная же ложь наиболее вероятна тогда, когда респондент убежден, что извлечет для себя какую-то пользу, дав ответы, не соответствующие действительности (Furnham, 1990). Претендент на вакантную должность может «смошенничать», умышленно давая положительные ответы на вопросы, от которых, как ему кажется, зависит, сложится ли о нем благоприятное мнение и будет ли он принят на работу. И, наоборот, человек может «смошенничать» в худшую сторону и преднамеренно отвечать «нет» на определенные вопросы, полагая, что это создаст о нем впечатление как о человеке с более серьезными психическими нарушениями, чем это есть на самом деле. Последнее может иметь место в ситуации, когда необходимо оценить душевное состояние обвиняемого в уголовном преступлении.

Лучшая защита от этой опасности — встроить в тест контрольные шкалы, позволяющие обнаруживать преднамеренную ложь. Например, MMPI содержит шкалы, цель которых — показывать, когда обследуемые лгут, когда проявляется их психологическая защита или когда они дают уклончивые ответы. Другой путь — вводить в тест дополнительные вопросы, прямо не относящиеся к изучаемому феномену, благодаря чему цель теста станет менее ясной для испытуемого. Тем не менее, эти попытки могут оказаться успешными только отчасти: трудно определить, до какой степени испытуемый сможет исказить информацию о себе. Поэтому по возможности важные заключения о личности испытуемого не должны основываться только на результатах теста самоотчета.

Другой недостаток шкал самоотчета связан со встречающейся у многих людей тенденцией отвечать таким образом, чтобы «хорошо выглядеть». Эта тенденция носит название социальной желательности,и она составляет проблему при использовании не только тестов самоотчета, но и других оценочных процедур. В отличие от преднамеренной лжи, в данном случае, испытуемые могут не осознавать, что они искажают ответы в благоприятном направлении; они непреднамеренно пытаются представить себя в лучшем свете, чем это имеет место в действительности.

Защитить метод от возможных искажений в сторону социальной желательности или ослабить их влияние можно с помощью нескольких приемов. Некоторые тесты самоотчета (такие как MMPI) содержат вопросы, выявляющие вероятность того, что респондент дает социально желательные ответы. В других тестах предусмотрено прямое измерение количества «приукрашивающих» ответов. Например, «Шкала социальной желательности» Кроуна—Марлоу (Crowne, Marlowe, 1964) сконструирована с целью измерения тенденции представлять себя в выгодном свете. Другой способ решить эту проблему заключается в тщательной оценке социальной приемлемости каждого вопроса до его включения в тест. В любом случае, очевидно, что при интерпретации тестового материала психологи должны знать о потенциальной возможности «загрязнения» результатов за счет тенденции социальной желательности.

Последняя проблема связана с тем, что некоторые люди склонны отвечать на вопросы теста определенным образом, независимо от содержания тестового материала. Например, одни испытуемые отвечают утвердительно гораздо чаще, чем другие, они фактически соглашаются с каждым вопросом теста. Эта тенденция отвечать согласием является основной проблемой шкал самооценки, в которых требуются ответы типа «верно—неверно» или «да—нет» (как MMPI). Если тенденцию отвечать на вопросы положительно не удастся как-то нейтрализовать, то в случаях постоянного согласия мы получим искаженные результаты, непригодные для оценки личностных особенностей данного человека. К счастью, тенденция отвечать преимущественно согласием является относительно легко решаемой проблемой. Большинство авторов формулируют вопросы теста таким образом, чтобы ответы «верно—неверно» и «да—нет» примерно в равной степени раскрывали бы измеряемую черту. Благодаря этому при подсчете показателей теста любое косвенное влияние, оказываемое тенденцией отвечать преимущественно «да» или преимущественно «нет», уравновешивается.

 

Проективные методы

 

Проективные личностные тесты первоначально предназначались для помощи клиническим психологам в диагностике характера и сложности эмоциональных нарушений у пациента. Основанием для появления проективных тестов служит положение теории Фрейда, согласно которому неосознаваемые процессы важны для понимания психопатологии. Соответственно, цель проективной оценки заключается в раскрытии неосознаваемых конфликтов личности, ее страхов и источников беспокойства. Термин проективный метод предложил Л. Франк (Frank, 1939) для обозначения методов оценки, в которых испытуемым дают неопределенные стимулы, содержание которых не предполагает четких, обусловленных данной культурой ответов. Подобные методы, представляющие собой скорее непрямой подход к оценке личности, позволяют людям «проецировать» на неопределенный материал свои чувства, потребности, установки и отношение к жизни. Предполагается, что в ответах на тестовые стимулы (такие как чернильные пятна или расплывчатые картинки) обнаруживаются признаки подавленных импульсов, защитные механизмы личности и другие ее «внутренние» аспекты. Все проективные тесты отличаются рядом важных особенностей. Все они содержат неопределенные или неструктурированные тестовые стимулы. Экспериментатор никогда не сообщает испытуемому истинной цели тестирования и не говорит, как будет подсчитывать или интерпретировать его ответы. В инструкциях подчеркивается, что правильных или неправильных ответов здесь не может быть, и испытуемый вправе отвечать так, как ему вздумается. Наконец, подсчет и интерпретация ответов испытуемого основываются в значительной степени на субъективных суждениях экспериментатора, который опирается на свой клинический опыт.

Существует много различных типов проективных методов. Линдсей подразделяет их на следующие пять категорий (Lindzey, 1939):

1. Ассоциативные методы,требующие отвечать на стимул первой пришедшей в голову мыслью или возникшим чувством. Примеры: «Тест словесных ассоциаций Меннингера» (Rapaport et al., 1968) и «Тест чернильных пятен» Роршаха (Rorschach, 1942).

2. Конструктивные методы,требующие создания или придумывания чего-либо. Например, в «Тесте тематической апперцепции» (Morgan, Murray, 1935) испытуемым предъявляют серии картинок с изображением простых сцен и предлагают составить рассказы о том, что происходит в этих сценах и какие чувства испытывают персонажи.

3. Методы завершения предлагают испытуемому завершить мысль, начало которой содержится в стимульном материале. В качестве последнего могут выступать незаконченные предложения (например, «Меня раздражает, когда...»). К методам завершения относятся «Тест рисуночной фрустрации Розенцвейга» (Rosenzweig, 1945) и «Тест незаконченных предложений Роттера» (Rotter, Rafferty, 1950).

4. Экспрессивные методы предлагают выразить свои чувства посредством такой деятельности, как рисование картинки или психодрама. Например, в тесте «Нарисуй человека» К. Маховер (Machover, 1949), от испытуемого требуется нарисовать человека, а затем — человека противоположного пола.

<Тест «Нарисуй человека» — это проективная методика, часто используемая психологами для оценки скрытых мыслей и чувств ребенка.>

5. Методы выбора,или распределения по порядку,требуют от испытуемых отбирать или располагать в порядке предпочтения набор стимулов. Например, тест Сонди (Szondi, 1944) содержит инструкцию выбирать из предложенных изображений людей те, которые или больше всего понравились, или больше всего не понравились. В настоящее время подобные методики используются редко.

Следует добавить, что эти пять категорий проективных методов не являются взаимоисключающими, и во многих тестах используются две и более из них.

Для лучшего представления о процедуре проведения, обсчете результатов и интерпретации проективных тестов мы подробнее остановимся на одном из них. Это тест Роршаха, часто используемый для оценки бессознательных процессов.

Герман Роршах, известный швейцарский психиатр, изобрел «Тест чернильных пятен» в 1921 году. В последующие годы этот тест стал наиболее популярной и широко используемой проективной методикой (Sweeney et al., 1987). Тест состоит из десяти карт. Карты содержат изображение билатерально симметричных пятен, которые Роршах получил, капнув чернила на лист бумаги и сложив его пополам (рис. 2-4). Пять карт черно-белые, пять — цветные. Каждое пятно отпечатано в центре карты из белого картона размерами около 18 x 24 см. Тест обычно проводит один и тот же экспериментатор с одним испытуемым в два этапа. На первом этапе испытуемому предлагают расслабиться и спонтанно отвечать на тестовые стимулы. Экспериментатор говорит: «Я собираюсь показать вам набор чернильных пятен и хотел бы узнать, что вы видите в каждом из них». Испытуемый берет в руки каждую карту (в определенном порядке), рассматривает ее и описывает, что он видит в этом пятне, что это пятно ему напоминает и на что оно похоже. Экспериментатор записывает все, что говорит испытуемый о каждом пятне (например: «Это напоминает мне двух медведей, танцующих вокруг походного костра»). Затем анализируется дословная запись ответов, или протокол. Экспериментатор также наблюдает за поведением испытуемого во время проведения теста, уделяя особое внимание тому, какие позы принимает испытуемый и сколько времени ему требуется, чтобы ответить по каждой карте.

 

Рис. 2-4. Чернильное пятно, похожее на те, что использованы в тесте Роршаха. Испытуемого просят объяснить, что он видит в этом пятне. (Lisa Brusso)

 

Когда ответы на все карты получены, испытуемому снова показывают карты в том же порядке. На этой стадии эксперимента, называемой «расследование», экспериментатор пытается определить, какие характеристики пятна обусловили предыдущие ответы испытуемого. Если, например, испытуемый говорит, что первая карта напоминает ему слона, может последовать вопрос: «Что именно в этом пятне напоминает вам слона?» Во второй фазе процедуры экспериментатора в основном интересуют два вопроса. Первый — какую часть площади карты занимает то, что испытуемый на ней увидел и обозначил в своем ответе. Второй вопрос касается того, какие особенности или качества пятна привели к тому или иному ответу (например, форма, цвет, характеристики людей или животных). Оба вопроса задаются в отношении каждого ответа испытуемого.

Для подсчета и интерпретации теста Роршаха предложены разные системы (Beck, 1945; Klopfer, Davidson, 1962; Piotrowski, 1957). Каждая из них является сложной и требует как длительной отработки навыков клинической оценки, так и знаний в области теорий личности, психопатологии и возрастной психологии. Независимо от того какая система используется, фактически все они оценивают ответы субъекта на основе четырех счетных факторов (Klopfer, Davidson, 1962):

1. Локализация имеет отношение к тому, какую часть площади пятна занимает фигура, упоминающаяся в ответе.

2. Детерминанты представляют особенности пятна (например, форма, цвет, тени, кажущееся движение), которые оказались существенными для формирования ответа испытуемого. Например, подсчитывается детерминанта цвета в том случае, если субъект сообщает, что видит пятно крови, потому что части пятна раскрашены в красный цвет.

3. Содержание отражает существо ответа: человек ли это, животное, растение, какой-то объект и так далее. Большинство систем подсчета выделяют в содержании несколько отдельных категорий для классификации ответов, такие как человеческие фигуры, фигуры животных, сексуальные объекты, одежда, географические очертания.

4. Популярность/оригинальность основывается на том, насколько типичен или атипичен данный ответ относительно имеющихся норм по каждой карте Роршаха в отдельности. Этот фактор обычно подсчитывается в категориях степени, поскольку количество имеющихся нормативных ответов так велико, что получение совершенно уникальной реакции в новых исследованиях маловероятно.

Дальнейший анализ основан на частоте отнесения ответов в каждую из вышеупомянутых категорий. Можно также подсчитать соотношение категорий, чтобы получить дополнительную информацию о личности. Это — примеры количественного подхода к тесту. Однако равное значение здесь имеет анализ актуального содержания ответов испытуемого, то есть качественный подход к его оценке. Содержание ответов (видит ли, например, испытуемый в основном людей или животных) имеет существенное значение для установления различий при интерпретации личностных характеристик человека.

Насколько полезен тест Роршаха для оценки личности? С эмпирической точки зрения отношение к его психометрическим свойствам у исследователей совершенно скептическое (Anastasi, 1988; Gamble, 1972; Kendall, Norton-Ford, 1982). Его внутренняя согласованность низка, ретестовая надежность также низка, прогностическая и текущая валидность в большинстве случаев сомнительна (Peterson, 1978). Еще больше усложняет картину тот факт, что в отношении теста Роршаха отсутствует необходимая степень надежности субъективных оценок. Исследования показывают удручающе низкую степень согласия между двумя или более экспертами, подсчитывающими одни и те же ответы. Короче говоря, ввиду отсутствия достаточной надежности и валидности результатов скептики отрицают полезность теста Роршаха как оценочной стратегии.

Для решения этой и других проблем исследователи разработали счетные схемы, обладающие лучшими психометрическими свойствами. Заслуживает внимания попытка стандартизации теста Роршаха с помощью введения объективных критериев и норм для детей и взрослых (Exner, 1978, 1986). Знакомство с этой разработкой, названной автором «Усовершенствованной системой», убеждает, что тест Роршаха может быть хорошим инструментом оценки. Были предприняты и усилия в направлении интерпретации тестовых ответов с помощью компьютера, а также создания параллельной формы теста для группового проведения (Holtzman, 1988). Однако, несмотря на эти усовершенствования, тест Роршаха все еще не нашел широкого применения за пределами клиники.

Полемика вокруг теста Роршаха вряд ли уляжется в ближайшее время. Несмотря на принимаемые меры по созданию надежных и валидных систем тестовых оценок (Exner, 1986), психологи-практики продолжают критиковать тест за излишне глубинную интерпретацию, не дающую возможности считать тест адекватным измерительным инструментом параметров личности. В то же время многие психологи будут продолжать использовать тест в клинической практике, невзирая на то, что говорят о нем исследования. Даже если рассматривать тест Роршаха как метод, имеющий только дополнительное диагностическое значение, маловероятно, что его популярность снизится в обозримом будущем (Lubin et al., 1985).

Сила и слабость проективных методов.Сторонники проективных методов заявляют, что последние обладают двумя уникальными преимуществами. Первое заключается в том, что тестовые стимулы здесь относительно неоднородны и неоднозначны, благодаря чему испытуемый не знает, какую психологическую интерпретацию получат его ответы. Проективные методы допускают почти неограниченное разнообразие возможных ответов, что позволяет скрыть от испытуемого истинную цель тестирования, а также снижает вероятность фальсифицированных и установочных ответов. Во-вторых, непрямой способ подачи тестового материала не приводит в действие психологические защитные механизмы испытуемого, что дает возможность получать информацию о таких аспектах личности, которые обычно скрыты от наблюдения.

Критика проективных тестов сводится к тому, что они недостаточно стандартизированы, отсутствует четкая процедура их проведения, оценки и интерпретации. В частности, оценка тестовых показателей часто зависит от навыка, клинического опыта и интуиции психолога, что делает их чрезвычайно ненадежными. Однако справедливо и другое: опыт показывает, что большая практика в обработке тестовых показателей способствует удовлетворительному уровню внутренней согласованности оценок (Goldfried et al., 1971; Exner, 1986).

Более серьезную проблему составляет интерпретация уже подсчитанных показателей того или иного теста. Хотя клинические психологи обычно полагаются на собственный опыт в интерпретации результатов проективных методик, сами методики не всегда одинаково удачны. К сожалению, интерпретация таких тестов слишком часто зависит от догадок и интуиции клинициста, а это не способствует повышению научной ценности проективных тестов.

Наконец, выдвигается еще один критический аргумент: до сих пор не получено достаточно убедительных доказательств валидности проективных тестов (Aiken, 1984; Peterson, 1978). Поэтому психологи стараются формулировать итоговое заключение не только на основании проективных тестов. Скорее, сами проективные тесты стоит рассматривать в контексте другой информации, полученной в результате интервью, анализа клинического случая и тестов самооценки.

В заключение можно сказать, что, несмотря на проблемы, связанные с применением проективных тестов, многие клинические психологи продолжают к ним обращаться при изучении неосознанных конфликтов человека, его фантазий и мотивов (Singer, Kolligian, 1987). В то же время, активное применение на практике не снижает остроту проблемы, связанной с их надежностью и валидностью.

 

 

Резюме

 

Теория выполняет роль катализатора для эмпирического исследования важных личностных феноменов и обеспечивает смысловую основу интерпретации установленных фактов и закономерностей. В отличие от несистематических наблюдений или соображений с позиции здравого смысла, при экспериментальном изучении личности те или иные заключения, касающиеся человеческого поведения, не считаются обоснованными до тех пор, пока не будут предоставлены объективные и воспроизводимые данные. Ориентация на научные исследования также предполагает наличие ясных и четких описаний процедуры измерения изучаемых переменных.

В основе всех исследовательских подходов в психологии личности лежит наблюдение. Каждый из видов наблюдения — несистематизированное, естественное и контролируемое полевое наблюдение обсуждались в данной главе как способы более строгого изучения поведения человека. Также рассматривались преимущества и недостатки каждого вида наблюдения.

Три исследовательские стратегии в изучении личности представлены методом изучения клинических случаев, корреляционным методом и экспериментальным методом. Каждая стратегия предполагает, что исследователь осуществляет объективное наблюдение за кем-то, кто что-то делает или говорит.

Метод анамнеза, или метод изучения истории болезни, обеспечивает возможность глубокого анализа отдельной личности. Этот метод направлен прежде всего на диагностику и лечение индивидуумов, страдающих эмоциональными расстройствами. Кроме того, изучение клинических случаев имело значение при создании ряда теорий личности и при изучении здоровых индивидуумов на протяжении многих лет. При описании прошлого пациента (описании клинического случая) используются разные методы, как-то: биографические и автобиографические очерки, личностные опросники и проективные тесты, интервью, а также информация, полученная от тех людей, которые довольно хорошо знают данного человека. Хотя истории болезни представляют собой ценный источник знаний о людях, этот метод не свободен от некоторых недостатков, связанных с тем, что объектом изучения здесь является конкретный человек. В частности, история болезни не устанавливает причины тех или иных наблюдаемых событий, возможность обобщения полученных данных здесь весьма ограничена, отобранные данные могут носить оттенок личных предубеждений и/или их истинность трудно проверить.

Корреляционный метод используется для установления связей между переменными и внутри них. Исследователи, использующие корреляционный метод, обычно заинтересованы в получении ответов на особые вопросы. Например, можно ли на основе успеваемости в колледже предсказать профессиональный успех в дальнейшем. Коэффициент корреляции как первичный статистический показатель обозначает направление и силу связи между переменными. Коэффициент корреляции может варьировать от -1 (полностью отрицательная зависимость) до +1 (полностью положительная зависимость). Как исследовательская стратегия корреляционный метод позволяет изучать многие аспекты человеческого поведения в естественных условиях. Кроме того, с его помощью можно изучать переменные, которые никаким иным способом невозможно исследовать по этическим соображениям. Однако корреляционный метод не дает убедительных доказательств того, что одна переменная вызывает появление другой переменной, даже если они обе тесно связаны, то есть имеют высокий коэффициент корреляции. Корреляция не предполагает установления причинных связей. В данной главе отмечается также, что определенную путаницу в интерпретацию корреляционных связей может внести третья переменная.

Экспериментальный метод дает исследователям возможность устанавливать причинно-следственные связи посредством манипуляции определенной переменной в тщательно контролируемых условиях, что позволяет наблюдать изменения второй переменной, как результат изменений первой переменной. Изменяемая переменная (условие, контролируемое исследователем) является независимой переменной. Наблюдаемый ответ, или поведение индивидуума (исход эксперимента) представляет собой зависимую переменную. Для проведения самого простого эксперимента требуются две группы испытуемых. Экспериментальная группа подвергается действию независимой переменной, а контрольная группа — нет. Распределение испытуемых по группам осуществляется случайным образом. Это дает гарантию того, что различия между группами будут обусловлены только наличием или отсутствием независимой переменной. В качестве примера рассматривался эксперимент по изучению возможных закономерностей, лежащих в основе известной поговорки «На миру и смерть красна». Результаты показали, что участницы эксперимента предпочитали находиться рядом с другими людьми, когда испытывали сильную тревогу в ожидании болезненного удара электрическим током. Следующий эксперимент показал, что испытуемые, переживающие сильную тревогу, предпочитали в это время общество только тех, кто оказался в такой же ситуации.

Будучи мощной исследовательской стратегией, эксперимент имеет ограничения при изучении поведения человека. Помехой для его применения могут быть этические соображения. Другое ограничение связано с тем, что эксперименты, проводимые в лабораторных условиях, часто носят искусственный характер, и это ограничивает возможность обобщения результатов. Присущие лабораторным условиям артефакты (например, феномен требуемых характеристик, установочные ответы) могут оказывать незапланированное воздействие на результаты исследования. Наконец, было отмечено, что экспериментальное исследование проводится в соответствии с принципом осведомленного согласия. Испытуемым сообщается заранее о любом потенциальном риске, и они могут отказаться от участия в эксперименте в любое время без всяких опасений.

Каждая стратегия исследования, используемая при изучений личности, имеет определенные преимущества и недостатки. Более того, ни один метод не является идеальным для решения всех вопросов.

Измерение индивидуальных различий, иначе называемое оценкой,является интегральным аспектом в психологии личности. Методы оценки личности должны удовлетворять критериям стандартизации, нормирования, надежности и валидности. Надежность является характеристикой постоянства теста и определяется двумя путями: методом повторного тестирования (ретестовая надежность) и методом расщепления (внутренняя согласованность). Валидность показывает, измеряет ли тест именно то, что он предназначен измерять. Рассмотрены виды валидности, включая содержательную валидность, критериальную валидность и конструктную валидность.

Центральным вопросом в процессе научного исследования является измерение различных аспектов отдельной личности. Основными подходами к оценке личности являются метод интервью, личностные тесты самоотчета и проективные тесты.

Рассмотрены и проиллюстрированы главные особенности неструктурированного и структурированного интервью как оценочных процедур. Структурированная форма предпочтительна при проведении научного исследования, в то время как неструктурированная — в терапевтической ситуации.

Методы самоотчета бывают двух типов: тесты, измеряющие единственный показатель и тесты, измеряющие одновременно несколько показателей. В качестве примера теста первого типа обсуждалась «Шкала самоосознания». Примером теста второго типа послужил «Миннесотский многоаспектный личностный опросник»; обсуждалась его диагностическая ценность. Измерения самооценки объективны в том отношении, что испытуемым предоставляется минимальная свобода в ответах, а на процедуру подсчета результатов не влияют личные склонности или теоретическая ориентация экспериментатора. Проблемы, внутренне присущие тестам самоотчета, включают предумышленный обман (подделка ответов в «хорошую» или «плохую» сторону), фальсификацию ответов в социально желательном свете и установки на определенные ответы (молчаливое согласие со всеми утверждениями теста).

Проективные методы пытаются проникнуть в неосознаваемые или очень тонкие аспекты личности, давая возможность индивидуумам при ответах на неопределенные стимулы проецировать на тестовый материал свои чувства, потребности и ценности. Перечислены различные категории этих тестов. В качестве репрезентативного примера приведен тест Роршаха. Сторонники проективных тестов утверждают, что они плохо стандартизированы, имеют низкую надежность и валидность, чувствительны к субъективизму в интерпретации.

 

 

Вопросы для обсуждения

 

1. Каковы преимущества эмпирического подхода к изучению личности по сравнению с подходом с позиций здравого смысла или интуиции?

2. Опишите метод изучения клинических случаев как исследовательскую стратегию в персонологии. Каковы его достоинства и ограничения?

3. Проанализируйте некоторые обстоятельства, в которых экспериментатор предпочел бы использовать корреляционный метод для изучения проблем личности.

4. Почему при изучении различных проблем и решении вопросов исследователи личности предпочитают применять экспериментальный метод? Какие факторы, кроме независимой переменной, должен учитывать исследователь при интерпретации результатов эксперимента?

5. Обсудите некоторые этические принципы, которые учитываются при проведении экспериментального исследования. Кто ответственен за то, чтобы эти принципы гарантированно соблюдались?

6. Объясните различия между прогностической валидностью и текущей валидностью.

 

 

Глоссарий

 

Артефакт (Artifact).He подразумеваемые в лабораторном эксперименте факторы, которые могут повлиять на изменения независимой переменной (например, испытуемый понимает, что он является объектом наблюдения со стороны экспериментатора).

Валидность (Validity).Понятие, обозначающее, что тест измеряет то, для чего он предназначен.

Гипотеза (Hypothesis).Определенное предсказание о связи между двумя или более переменными, логически вытекающее из теории.

Дивергентная валидность (Divergent validity).Степень, в которой тест не измеряет тот конструкт, для измерения которого он не предназначен.

Естественное наблюдение (Naturalistic observation).Тщательное наблюдение за поведением в реальных условиях жизни, без прямого вмешательства исследователя.

Зависимая переменная (Dependent variable).Применительно к эксперименту — переменная, измерение которой производится после того, как была изменена независимая переменная. Переменная, получаемая в результате эксперимента.

Конвергентная валидность (Convergent validity).Величина корреляции показателей данного теста с показателями другого теста, который предположительно измеряет тот же самый конструкт.

Конструктная валидность (Construct validity).Доказательство того, что тест измеряет определенный гипотетический конструкт; предполагает валидизацию как самого теста, так и тех характеристик, которые предположительно связаны с рассматриваемой концепцией.

Контрольная группа (Control group).Применительно к эксперименту — группа субъектов, не подвергающихся никако