Метод постоянных раздражителей
Другие названия этого метода — метод констант, частотный метод, метод истинных и ложных случаев. Метод состоит в предъявлении испытуемому ряда стимулов, неизменных в течение всего опыта, и название отсюда — метод постоянных раздражителей (МПР), метод констант. В случае измерения разностного порога предъявляется стандартный стимул и сравниваемый с ним. В силу того, что параметры стандартного и сравниваемого стимулов в течение всего опыта неизменны, каждый из сравниваемых стимулов образует со стандартным постоянную разницу. Отсюда еще одно название этого метода — метод постоянных разниц. Непосредственным результатом опыта являются частоты ответов, из которых значения порога находятся вычислительным путем. Эта особенность определила еще одно название этого метода — метод частот.
Метод констант пользуется репутацией самого точного и надежного, поскольку сама процедура метода предусматривает такую организацию стимуляции, которая исключает ошибки привыкания и ожидания. Возможность накопления большой статистики ответов, связанная с ограничением числа постоянных раздражителей, применяемых в измерении, повышает надежность измерения порога этим методом. Универсальность метода констант обусловлена, по-видимому, двумя обстоятельствами. Во-первых, он ставит менее жесткие требования к выходным устройствам задающей аппаратуры, чем метод средней ошибки, поскольку высокоточную дискретную регулировку выходного сигнала получить технически существенно проще. Это значительно расширяет область применения МПР. Во-вторых, дискретность стимуляции позволяет использовать, кроме суждений, и другие ответные реакции организма, например, вегетативные, электроэнцефалографические, сосудистые и др. Эти реакции отличаются двумя важными для измерения чувствительности свойствами:
1) не поддаются произвольному контролю (без специальной тренировки),
2) их величина изменяется градуально.
Использование этих реакций существенно расширяет область приложения МПР, поскольку обеспечивает его применение в тех случаях, когда исследователю невозможно (или неудобно) использовать речевой ответ для измерения порога (например, в случаях симуляции, у детей, еще не овладевших речью, у животных). Кроме того, применение непроизвольных реакций позволяет увеличить объем информации, извлекаемой из опыта, поскольку информация об изучаемом процессе содержится не только в факте появления/не появления реакции, но и в ее величине, форме и скрытом периоде, поэтому возрастает количество сведений, которое может быть извлечено из каждой градуальной реакции.
Давая общую характеристику метода констант, нельзя не отметить еще одного момента. Метод констант занимает особое место среди классических методов измерения чувствительности в связи с тем, что почти все теоретические построения психофизики относительно пороговой проблемы для своего экспериментального подтверждения обращались к этому методу. Он оказался наиболее гибким, получаемые этим методом результаты находили объяснение в русле самых различных психофизических концепций.
1. Определение разностного порога методом констант.
Процедура. В предварительных испытаниях экспериментатор ориентировочно определяет пороговую зону, т.е. тот диапазон различия стимулов, на границах которого испытуемый начинает практически всегда ощущать отличие эталонного стимула от сравниваемого. Затем экспериментатор выбирает в пределах этой зоны ограниченный ряд стимулов, которые будут сравниваться с эталоном (чаще всего 5—7). Выбор производится с таким расчетом, чтобы самый слабый среди них вызывал у испытуемого ответ "больше" в 5—10% случаев, а самый сильный — в 90—95%. Сравниваемые стимулы выбираются так, чтобы расстояния между ними на стимульной оси были одинаковыми. Последнее требование обеспечивает некоторое упрощение статистической обработки данных и является просто требованием удобства. При определении разностного порога стимулы предъявляются парами — эталон и сравниваемый — одновременно или последовательно. Стимульная последовательность, составленная из пар стимулов, является по своим свойствам случайной, но сбалансированной: каждая пара предъявляется равное число раз, частота предъявления каждой пары распределена на последовательности равномерно. Естественно, что эта последовательность составляется до опыта и испытуемому неизвестна. Обычно в опыте каждая пара стимулов повторяется 20—200 раз.
В экспериментальной практике используются два разных способа объединения стимулов в пары: 1) место эталона в паре меняется по случайному закону; 2) место эталона и сравниваемого стимула в паре фиксированы. Первый вариант решения имеет то преимущество, что позволяет компенсировать постоянные ошибки типа пространственной и временной в ходе самого эксперимента. Сильным аргументом в пользу второго способа является уменьшение вариативности результатов опыта за счет уменьшения колебаний критерия при выборе испытуемым ответа в каждой отдельной пробе. По-видимому, следует предпочитать второй способ, а пространственную ошибку можно учесть, если в одной стимульной последовательности эталон предъявляется слева, а в другой — справа. Аналогичным образом можно выявить и временную ошибку.
В каждой пробе, т.е. при предъявлении пары стимулов, испытуемый должен вынести суждение, возникло ли ощущение различия и каково оно. В методе констант используются две ("больше", "меньше") или три категории ответов ("больше", "меньше", "равно"). В любом случае порог вычисляется из пропорций суждений разного рода на каждую пару стимулов.
Психометрическая функция.
Рассмотрим случай, когда испытуемый дает две категории ответов — "больше" и "меньше". Обозначим Sst — стандартный стимул, a Svar — сравниваемый по исследуемому параметру (один из постоянных стимулов). Если Svar существенно меньше Sst, то испытуемый почти никогда не дает ответ "больше", если же Svar значительно больше Sst, то почти всегда испытуемый дает ответ "больше". В промежутке между этими двумя значениями при увеличении изменяемого параметра стимула пропорция ответов "больше" плавно возрастает от 0 до 1. Поэтому пропорцию ответов "больше" удобно использовать при представлении результатов эксперимента в виде графика, называемого психометрической функцией.
Если в эксперименте предъявить достаточно большое число раз несколько пар Svar, Sst и представить полученные данные на графике, где по абсциссе отложена физическая мера стимулов, а по ординате для каждого стимула указана пропорция ответов "больше", то точки, описывающие ответные данные, образуют кривую, имеющую, как правило, S-образную форму. Если выбрать некоторое новое значение сравниваемого стимула, которое лежит между уже опробованными, и повторить эксперимент, то соответствующая ему новая точка придется между двумя старыми. Это дает основание заключить, что для любой пары стимулов S и Sst существует вероятность P(Svar) ответа "Svar больше Sst". Психометрической функцией называется такая функция Р аргумента S, которая является монотонной, дифференцируемой и ограничена нулем и единицей (Урбан, 1907). Оценкой ее значений служат пропорции ответов "больше". Из дифференцируемости и ограниченности нулем и единицей можно сделать вывод о существовании соответствующей ей дифференциальной функции распределения. Принятые в психофизике изображения психометрической и дифференциальной кривой распределения, полученных в эксперименте, проведенном методом констант с двумя категориями ответов, представлены на рис.
Рис. 1 Психометрическая функция и соответствующая ей дифференциальная кривая:
оси абсцисс на обоих графиках — интенсивность сравниваемого стимула; ось ординат на верхнем графике — вероятность ответов "больше", ось ординат на нижнем графике — плотность вероятности ответов "больше".
Форма психометрической кривой. S-образная форма психометрической кривой допускается как пороговыми теориями Фехнера и Блеквелла, так и теориями непрерывности, хотя интерпретация ее в том и в другом случае различна. Основная суть любой пороговой теории сводится к утверждению о существовании порога как реального принципа работы сенсорной системы. Порог понимается буквально как барьер, критическое значение в континууме раздражении. Если бы значение порога было стабильно во времени, то психометрическая кривая имела бы вид линейной ступенчатообразной функции. Этого никогда не бывает. Ее S-образная форма объясняется тем, что порог флуктуирует во времени случайным образом. Различные варианты альтернативных теорий (Дельбеф, 1883; Мюллер, 1896; Ястров, 1888), отвергающие существование порога, исходили из предположения, что ощущение является непрерывной функцией, зависящей от двух переменных — интенсивности раздражителя и степени предрасположенности человека к его восприятию. Поскольку последняя зависит от случайного сочетания множества трудно учитываемых факторов, то их баланс является случайной величиной и имеет нормальное распределение. Именно поэтому и психометрическая кривая имеет S-образный вид интегральной функции нормального распределения. Фехнер (1860) также считал, что психометрическая функция является интегральной функцией нормального распределения; эта точка зрения получила название фи-гамма гипотезы. В старых работах классической психофизики фи использовалась для обозначения стимулов, а гамма — для обозначения ответов. Терстон (1928) полагал, что поскольку согласно закону Вебера различительная ступень растет с увеличением стимула, психометрическая кривая приобретает положительную асимметрию, пропорциональную дроби Вебера. Психометрическая кривая нормализуется, если взять логарифмический масштаб по стимульной оси. Различие психометрических кривых, полученных в пороговых экспериментах, столь незначительно, что трудно отдать предпочтение одной из этих гипотез.
Нейроквантовая теория Стивенса, являющаяся по существу пороговой, предсказывает прямолинейную психометрическую кривую, представленную на рис.6.
Согласно этой теории, изменение в ощущении замечается всегда, когда дополнительное возбуждение, вызванное приращением стимула, увеличивается на величину, равную одному нервному кванту. Порог различения отстоит от стандартного стимула согласно этой теории на 1,5 стимульных интервала, соответствующие нервному кванту. Фактор случайности в этой теории воплощается не в колебаниях порога, а в случайной величине остаточного возбуждения, суммируясь с которой добавочное возбуждение, вызванное приращением стимула, приводит к генерации нервного кванта. Предполагается, что условная единица стимульной оси служит физическим аналогом величины кванта. Прямолинейность психометрической кривой обусловлена равномерным распределением величины остаточного возбуждения.
Параметры психометрической кривой. Как и в других пороговых методах для характеристики распределения результатов измерения в МПР используются меры центральной тенденции (медиана — Md и среднее арифметическое — М) и меры изменчивости (полумежквартиль-ный размах — Q и стандартное отклонение — ст ). Перпендикуляр из медианы дифференциальной кривой распределения делит площадь под кривой пополам. Поскольку площадь под кривой равна единице, медиане соответствует стимул, для которого вероятность ответа "больше" равна 0,5:
Md=S0,5
Полумежквартильный размах определяется как полуразность Q3 и О1:
В последние годы в практике психофизических исследований стали часто использоваться среднее арифметическое распределения — М и стандартное отклонение. Как известно, в симметричных распределениях Md и М совпадают, а меры изменчивости строго соотнесены:
Психофизический смысл параметров психометрической кривой.
Интервал неопределенности оценивается через межквартильный размах (Q3- q1):
lU=S0.75 - S0.25.
Точка субъективного равенства определяется как медиана: PSE=Md. Константная ошибка имеет место в случае несовпадения медианы со стандартом и равна:
CE=Md - Sst
Разностный порог определяется в эксперименте с двумя категориями ответов как половина интервала неопределенности и соответствует полумежквартильному размаху психометрической кривой, построенной по ответам "больше" или "меньше". Обозначим его Q(2), где цифра в скобках указывает на количество категорий ответа, а индекс Q подчеркивает, что порог характеризуется мерой разброса:
Психофизические показатели в эксперименте с тремя категориями
ответов.
При использовании трех категорий ответов испытуемого в методе констант – “больше”, “меньше” и “равно” – психометрические кривые ответов “больше” и “меньше” не являются зеркальными и потому должны рассматриваться обе.
В соответствии с принятым операциональным определением порога как 50% точки, которое можно полностью применить к трехкатегориальному эксперименту, медиана психометрической кривой ответов "меньше" является оценкой нижнего разностного порога, а медиана ответов "больше" — верхнего разностного порога; расстояние между ними характеризует интервал неопределенности (IU), центр которого является точкой субъективного равенства (PSE). За величину разностного порога одни исследователи(Урбан, 1907; Бардин, 1976) предлагают считать согласно принятому в методе границ определению половину интервала неопределенности, т.е.
где DL(3) — обозначение указанной оценки разностного порога; Lh и LI — величины верхнего и нижнего разностного порога, соответственно.
Другие исследователи предлагают использовать в качестве пороговой меры различения полумежквартильный размах психометрической кривой ответов "больше" или "меньше". Обозначим эту оценку порога Q(3):
Э та оценка разностного порога, по мнению Каллера (1928), не зависит от частоты появлений ответов "равно" и появилась как следствие неудовлетворенности психофизиков первой мерой DL (3), поскольку величина интервала неопределенности сильно зависит от стремления испытуемого употреблять нейтральные ответы. В сaмом деле, при увеличении частоты ответов "равно" увеличивается величина интервала неопределенности, а следовательно, и разностного порога, если его оценивать как DL (3). Фернбергер (1931) показал, что величина IU сильно зависит от инструкции, с помощью которой можно управлять частотой ответа "равно". Он заключил, что испытуемые различаются по частоте употребления ответов "равно" частично в силу различия темперамента, частично — в результате различия в инструкциях. Следовательно, величина IU характеризует вклад скорее процесса решения, чем собственно сенсорной чувствительности.
Психометрические функции, полученные в МПР с тремя категориями ответов:
а— большое количество ответов "равно", б— незначительное количество ответов "равно"
Однако и вторая оценка порога различения Q(3) столь же подвержена критике. Гилфорд (1954), сравнивая оценки порогов по DL(3) и Q(3) показал, что они измеряют разные величины. Если испытуемый уменьшает число ответов "равно", крутизна психометрических кривых ответов "больше" и "меньше" уменьшается, т.е. одновременно с уменьшением IU и DL(3) увеличивается Q(3). Если же испытуемый по каким-либо причинам увеличивает число нейтральных ответов, соотношение величин DL(3) и Q(3) изменяется в противоположном направлении. Отсюда Гилфорд делает обоснованный вывод, что две оценки, которые меняются в противоположных направлениях, не могут служить мерой одного и того же.
Результатом описанной дискуссии явился отказ психофизиков от использования трех категорий ответов при измерении порогов методом констант: испытуемому либо вообще не разрешается использовать нейтральные ответы в ходе опыта, либо в случае разрешения нейтральные ответы делятся между ответами "больше" и "меньше". Вопрос о том, как делить ответы — поровну или пропорционально количеству ответов двух других категорий — много обсуждался, но исследователи так и не пришли к согласованному мнению.
При использовании двухкатегориальной системы ответов единственной используемой оценкой порога реакции является величина Q(2), поэтому везде, где это только возможно, при работе МПР применяются только две категории ответов.
Рекомендация отказаться от трехкатегориальной системы ответов при измерении чувствительности методом констант не всегда приемлема. В тех случаях, когда требуется оценка различия сложных многомерных стимулов, испытуемый затрудняется классифицировать свои ощущения в терминах "больше" — "меньше", поскольку при изменении одного параметра стимула может меняться сразу несколько сенсорных признаков воздействия, и испытуемый, "соскальзывая" с одного признака на другой, может испортить эксперимент. По-видимому, наиболее подходящим для оценки восприятия сложных стимулов, наиболее часто встречающихся в прикладных исследованиях, является метод, позволяющий испытуемому выносить суждение о различии стимулов, не "привязываясь" к какому-либо одному признаку, и обеспечивающий такую организацию эксперимента, которая позволила бы уменьшить загрубляющее оценку собственно чувствительности влияние несенсорных факторов. Модификация метода АБХ, предложенная Индлиным (1978), по-видимому, удовлетворяет этим требованиям.
2 Определение абсолютного порога методом констант.
Процедура измерения абсолютного порога от измерения разностного порога методом констант отличается только тем, что в каждой пробе испытуемому предъявляется один из нескольких (обычно 5—9) постоянных стимулов, на который испытуемый дает один из двух возможных ответов. Определение стимульного диапазона, количества предъявляемых стимулов, величины межстимульного интервала осуществляется исходя из тех же соображений, которые учитывались при организации измерения дифференциального порога. Порядок предъявления стимулов также строится как сбалансированно случайный.
По полученным в эксперименте частотам ответов на каждый из постоянных стимулов строится психометрическая кривая. За абсолютный порог принимается так называемая 50-процентная точка кривой, т.е. мера центральной тенденции (среднее М или медиана Md, чаще медиана). Почему 50-процентная точка берется в качестве пороговой меры? С точки зрения пороговой концепции эта точка есть медиана распределения моментальных значений порога, т.е. значений абсолютного порога в те моменты времени, когда происходит измерение. С точки зрения классической теории непрерывности ответ испытуемого есть функции двух переменных — величины стимула (чем больше, например, интенсивность стимула, тем чаще ответ "Да") и баланса благоприятных и неблагоприятных факторов разной природы. 50-процентной точке соответствует минимальное значение стимула, вызывающего ощущение только при балансе благоприятных и неблагоприятных факторов.
Меры изменчивости, описывающие полученное распределение, полумежквартильный размах — Q и стандартное отклонение характеризуют надежность оценки порога.
Естественно, измеряя абсолютный порог, мы должны отдавать себе отчет в том, что это не столько порог "чистого" ощущения, сколько порог реакции, т.е. величина, на которую влияют и несенсорные факторы. В частности, истинное значение порога ощущения может искажаться за счет влияния случайного угадывания. Для корректировки таких ответов в рамках пороговой концепции Блэквеллом (1953) была предложена так называемая "поправка на случайный успех". Согласно Блэквеллу, вероятность правильного ответа "Да" складывается из вероятности истинного восприятия предъявляемого стимула (Рc) и вероятности случайного угадывания неощущаемого воздействия. Последняя величина равна вероятности ответа "Да" (Р”yes”) при отсутствии стимула (иначе называемая ложной тревогой — Рfa), умноженной на вероятность отсутствия ощущения при воздействии стимула, т.е.
P”yes” = Pc + Pfa(1 – Pc)
откуда истинная вероятность правильных ответов определяется из результатов эксперимента следующим образом:
Следует помнить, что исходной посылкой Блэквелла было отрицание какой-либо сенсорной основы ответов угадывания, с чем трудно согласиться, поскольку известно, что далеко не весь опыт рефлексируется человеком.
Для того, чтобы воспользоваться "поправкой на случайный успех", необходимо ввести в эксперимент так называемые пустые пробы (пробы-ловушки), когда после сигнала "Внимание" экспериментатор не предъявляет стимула. Возникающие в этих пробах ответы "Да" позволят оценить вероятность ложных тревог.
Рассмотрим пример определения абсолютного порога методом констант. Измеряется пространственный порог тактильного восприятия — то минимальное расстояние между двумя раздражаемыми точками кожи, при котором испытуемый в 50% случаев дает ответ "два" и в 50% — ответ "один". Выбрав участок кожи, на котором будет определяться порог, экспериментатор делает несколько предварительных замеров эстезиометром, используя, например, процедуру метода границ, для того, чтобы грубо определить пороговую зону, внутри которой некоторые предъявления стимула вызывают ответ "Два", а некоторые другие предъявления стимула — ответ "Один". Экспериментатор выбирает 5 стимулов таким образом, что наименьший стимул вызывает ответ "Два" приблизительно в 5% случаев, а наибольший — в 95%. Интервалы между стимулами равны. Предъявляются стимулы в сбалансированно-случайном порядке. Каждый стимул предъявляется 100 раз. Экспериментальные данные приведены в таблице 1. По этим данным строится психометрическая кривая. Для этого на графике по абсциссе откладывается физический параметр стимула — расстояние между раздражаемыми точками в мм, а по ординате — пропорции ответов.
Таблица 1
Результаты эксперимента по определению пространственного порога тактильного восприятия
Расстояние мэвду отелами S, мм | |||||
Пропорция ответов "Зра" (Р"два") | 0.01 | 0.05 | 0.29 | 0.66 | 0.93 |
Вгзупыаг преобразования Р-дда" BZ-дю" | -233 | -1.55 | -0.55 | 0.41 | 1.48 |
8 9 10 П }1s,hh |
Рис. 10. Психометрическая кривая, построенная по результатам эксперимента по определению пространственного порога тактильного восприятия: точками показаны экспериментальные результаты. Полученная кривая является хорошим приближением к интегральной кривой нормального распределения (по Гилфорду, 1954) |
Чрезвычайно редко случается так, что одному из стимулов соответствует пороговая пропорция ответов: Р “два” == 0,5. Чаще всего соответствующую порогу точку приходится определять по полученной психометрической кривой. Графическим или вычислительным путем можно найти значения медианы (и среднего), характеризующие величину абсолютного порога (в нашем примере RL= 10,57 мм) и меры вариативности — квартили Q3 Q1 и стандартного отклонения.
Очевидно, что точность оценки порога обусловлена прежде всего "хорошестыо" аппроксимации экспериментально полученных точек гладкой кривой. К сожалению, математически корректное решение задачи подгонки точки непросто. Поэтому на практике используются два варианта построения психометрической функции: 1) с помощью линейной интерполяции отдельных участков психометрической функции в линейных координатах; либо 2) вся психометрическая функция аппроксимируется функцией нормального распределения, которое в нормальных координатах является прямой линией. Рассмотрим оба эти случая обработки экспериментальных данных.
Обработка экспериментальных данных в методе констант
Способ линейной интерполяции. Этот способ не обеспечивает высокую точность, но зато крайне прост. Линейная интерполяция основывается на представлении психометрической функции в виде отрезков прямой, которые проводятся между полученными точками.
Простейшим и наиболее часто используемым является графический способ нахождения значений медианы и квартилей. Если на графике провести горизонтальные линии на уровне пропорций ответов, равных 0.5, 0.25, 0.75, то их пересечения с построенной психометрической кривой дадут, сответственно, значения Md, Q1 и Q3 которые считываются с оси абсцисс в физических величинах стимула. Естественно, при использовании графического способа обработки результатов следует построить психометрическую функцию на координатной бумаге, выбрав достаточно крупный масштаб.
Те же значения могут быть получены и расчетным путем по следующим формулам (фактически эти формулы вытекают из решения прямоугольных треугольников):
Медиана психометрической кривой определяется как
где SI — величина ближайшего к 50-процентной точке стимула, лежащего ниже ее; S h— величина стимула, лежащего непосредственно выше 50-процентной точки; РI и Рh — соответствующие указанным выше стимулам пропорции ответов.
Первый и третий квартили вычисляются по формулам:
где SI1 — величина стимула, лежащего непосредственно ниже 25-процентной точки; Sh1 — величина стимула, лежащего непосредственно выше 25-процентной точки; РI1 и Рh1 — соответствующие указанным выше стимулам пропорции ответов.
где SI3 — величина стимула, лежащего непосредственно ниже 25-процентной точки; Sh3 _ величина стимула, лежащего непосредственно выше 25-процентной точки; РI3 и Рh3 — соответствующие указанным выше стимулам пропорции ответов.
Недостатками способа линейной интерполяции являются:
1) расточительность, так как из всех полученных в эксперименте данных используется только часть — например, для определения Md достаточно иметь две точки;
2) отсутствие возможности получить точную оценку показателей разброса — дисперсии или межквартильного размаха — Q. Если в эксперименте используется больше двух стимулов, можно определить Q1 и Q3, а если допустить, что распределение частот ответов является нормальным, то можно найти и величину стандартного отклонения через соотношение с = 1,483Q. Однако при широком диапазоне используемых стимулов и относительно малом их числе (около 5, как в нашем примере) оценка Q будет не очень точной, следовательно, и значение о также.
Способ нормальной интерполяции. Если сделать более строгое допущение о форме психометрической функции, а именно, что она является функцией нормального распределения, и если выразить масштаб оси ординат в единицах стандартного отклонения этого распределения, то психометрическая функция, имеющая S-образную форму в линейных координатах, превращается в прямую линию. После этого появляется возможность найти все интересующие исследователя параметры прямой, аналогично тому, как это делалось в случае линейной интерполяции. Но для этого нужно прежде всего преобразовать пропорции ответов Р с помощью таблиц нормального распределения в значения Z, представляющие собой нормированные по стандартному отклонению расстояния от стимульных точек до медианы. После преобразования Р в Z экспериментальные точки на графике, где по абсциссе отложен физический параметр стимула S, а по ординате — Z, могут быть аппроксимированы' прямой линией, которая проводится "на глазок" (этот способ хотя и прост, но чаще всего дает лишь грубое приближение), либо рассчитывается с помощью метода наименьших квадратов. Этот метод позволяет получить не только наилучшую аппроксимацию, но и статистически строго оценить степень "хорошести" подгонки полученной прямой к экспериментальным точкам.
Определение медианы, представленной в z-координатах психометрической функции, возможно графическим и расчетным путем. За абсолютный порог (и PSE при измерении двухкатегориальным методом констант разностного порога) принимается величина стимула, которой соответствует Z = 0. Стандартное отклонение определяется как такая величина стимула, для которой Z = +1 или Z = -1. Через стандартное отклонение можно найти и величину полумежквартильного размаха — Q, т.к. их связь в случае нормального распределения описывается равенством
Графическое представление зависимости величины Z„два„ от физического параметра стимула (т.е. психометрическая функция в нормальных координатах) приведено на рис. 11.
Определение с помощью графиков параметров психометрической функции способом нормальной интерполяции не требует преобразования в z-координаты, если имеется в наличии вероятностная бумага. Способ изготовления такой бумаги подробно описан (Бардин, 1976).
Все необходимые пороговые показатели могут быть определены и аналитическим путем с помощью соответствующих формул. Для этого можно воспользоваться двумя методами.
Во-первых, можно применить уже известный нам метод линейной интерполяции (теперь в нормальных координатах), который фактически является аналогом простого графического решения, когда мы не производим строгого построения аппроксимирующей прямой. Расчет параметров психометрической прямой производится по формулам:
где zI и zh— самые близкие к нулю отрицательная и положительная величины z, соответственно; SI и Sh — стимулы, соответствующие zI и zh (т.е. величины ближайшего подпорогового и надпорогового стимулов).
Для оценки величины стандартного отклонения следует взять разность между точками на стимульной оси, соответствующими z=l или z=-l и величиной порога — RL. Эти точки можно вычислить так:
где zI+ и zh+ — ближайшие значения z, меньшие и большие +1, соответственно; Sh+ и SI+ — стимулы, соответствующие zI+ и zh+ (т.е. ближайшие значения стимулов, ниже и выше So+).
где zI- и zh- — ближайшие значения z, меньшие и большие -1, соответственно; Sh- и SI- — стимулы, соответствующие zI- и zh- (т.е. ближайшие значения стимулов, ниже и выше S ).
Оба значения S0 и S0- вычисляются в связи с тем, что полученная в эксперименте психометрическая кривая далеко не всегда является очень хорошим приближением к кривой нормального распределения, и эти значения могут расходиться. Поэтому обычно для оценки разброса используется их среднее. В нашем примере вычисления по приведенным формулам дали следующие величины:
RL = 10.57 мм, S^ и S^ = 0.98 мм.
Во-вторых, воспользовавшись методом наименьших квадратов, можно построить наилучшую прямую, проходящую через экспериментальные точки. Эта задача решается просто в любом статистическом пакете путем выполнения процедуры построения простой линейной регрессии. Вычислив таким образом коэффициенты а и Ь линейной функции у=ах+Ь, мы без труда найдем неизвестные "x" по известным "у" (z=0 , z=l или z=-l). Понятно, что поскольку точки S^ и S0- будут симметричны относительно RL, то достаточно вычислить лишь одну из них.
3. Варианты метода констант
Метод приращения. Особенностью экспериментальной процедуры является непрерывное предъявление испытуемому стандартного стимула, к которому периодически добавляются приращения. Испытуемый отвечает, заметил ли он приращение, в терминах, например, "Да" - "Нет". Разностным порогом является приращение стимула, заметное в 50% случаев. В методе приращений измеряется разностный порог реакции, представляющий собой половину интервала неопределенности. Сомнения в отношении возможности использования интервала неопределенности в качестве показателя различения уже высказывались выше.
В экспериментах, проводимых в поддержку нейроквантовой теории, практикуется вариант метода приращений, при котором в каждой экспериментальной серии используется лишь одна величина приращения. Наличие перерывов между экспериментальными сериями с разными величинами приращений является недостатком этого метода, поскольку допускает направленное изменение характеристик испытуемого в отношении приращений разной величины.
Метод АБХ. В этом методе испытуемому предъявляются последовательно три стимула: первый обозначается А, второй — Б, третий — X. Первые два стимула различаются величиной исследуемого параметра; в качестве третьего стимула (X) используется либо А, либо Б. Испытуемый должен ответить, какой из стимулов был X. Метод АБХ при условии запрещения нейтральных ответов сводится к двухкатегориальному варианту метода констант. Этот метод широко применяется в прикладных исследованиях, где обычно используются сложные стимулы, которые нетренированный испытуемый затрудняется классифицировать в терминах "больше" — "меньше", но хорошо понимает и может выполнить задачу идентификации, когда от него не требуется вынесения суждения только по одному из одновременно меняющихся сенсорных признаков при изменении физических параметров стимула. В качестве оценки чувствительности в этом методе используется полумежквартильный размах — Q(2). Однако эта оценка загрублена влиянием несенсорных факторов, приводящих к нестабильности критерия принятия испытуемым решения.
Для существенного уменьшения этого загрубления оценки Индлин (1979) предлагает ограничиваться в пределах одной непрерывной части опыта использованием одного сравниваемого стимула.
Задание 3. Измерение порога различения длительности тональных сигналов методом постоянных раздражителей. Исследование влияния несенсорных факторов на пороговые меры
Цель задания. 1. Практическая отработка метода на примере определения дифференциального порога при различных инструкциях испытуемому. 2. Освоение процедуры вычислений различных пороговых мер, получаемых в этом методе (интервал неопределенности, точка субъективного равенства, константная ошибка). 3. Сравнение зависимости различных пороговых мер от несенсорных факторов.
Методика
Аппаратура. Задание отрабатывается на IBM-совместимом персональном компьютере. Для предъявления звуковых сигналов (тона частотой 1000 Гц) используются головные телефоны, соединенные со звуковым синтезатором персонального компьютера. Длительность стандартного стимула — 900 мс, длительность пяти переменных (сравниваемых) стимулов — 600, 750, 900, 1050 и 1200 мс.
Для выполнения учебного задания используется компьютерная программа тс.ехе.
Процедура опыта. При отработке задания каждый студент выступает сначала в роли испытуемого, а затем обрабатывает собственные экспериментальные данные. Опыт состоит из одной тренировочной и трех основных серий. Испытуемому последовательно предъявляются два звуковых стимула, его задача — сравнить их по длительности. Место стандартного и сравниваемого стимулов в паре изменяется в квази-случайном порядке. Длительность сравниваемого стимула также меняется в квази-случайном порядке. Межстимульный интервал — 500 мс. Во время звучания каждого из стимулов на экране монитора последовательно появляются номера стимулов в паре (1— 2,1 — 2и т.д. ), что позволяет испытуемому определить, в какой момент времени нужно давать ответ. Если испытуемый не дал ответ в прошедшей пробе, то предъявление пары стимулов повторяется. Межпробный интервал, в течение которого испытуемому требуется дать ответ, используя трехкатегориальную систему ответов ("первый больше", "равны" и "первый меньше"), равен 2 с. Для ответа используются цифровые клавиши — <1>, <2>, <3> .
Три основные серии отличаются друг от друга различными инструкциями испытуемому, что приводит к изменению его стратегии при выборе ответа. В значительной степени данный эксперимент повторяет известное исследование С. Фернбергера (цит. по: Бардин, 1976), в котором было четко показано, что при использовании в методе констант трехкатегорийной системы ответов значение дифференциального порога существенно зависит от сугубо несенсорных факторов.
Инструкция к первой серии — нейтральная: испытуемый должен давать ответы согласно своим впечатлениям. Инструкция ко второй серии рассчитана на минимизацию ответов в промежуточной категории ("равно"): испытуемый должен пользоваться этой категорией в тех редких случаях, когда, несмотря на все усилия, он не способен различить сигналы по длительности. Инструкция к третьей серии рассчитана на максимизацию ответов "равно": к этой категории необходимо относить все ощущения равенства или сомнения в сравнении стандарта и переменного стимулов; причем ответы "больше" и "меньше" нужно давать лишь при большой уверенности в разнице стимулов.
В каждой из этих серий испытуемым предъявляется 150 проб (по 30 предъявлении каждого переменного стимула). После каждой серии делается 2—3-минутный перерыв.
Обработка результатов. После окончания опыта испытуемый получает компьютерную распечатку, где для каждой серии приводятся частоты ответов "больше ", "равно" и "меньше" для каждого из пяти переменных стимулов.
По каждой серии обработка результатов осуществляется следующим образом:
1. Строятся два графика с психометрическими кривыми в линейных координатах. На первом графике строятся психометрические кривые для 3-х категорий ответов (см. рис. 7—9). На втором — для 2-категориального варианта, при этом нейтральные ответы делятся поровну между пропорцией ответов "больше" и "меньше" (достаточно построить только одну кривую — для ответов "больше").
2. Для расчета всех пороговых показателей (IU, DL, PSE, СЕ) используется графический метод, основанный на способе линейной интерполяции.
3. Затем, используя 2-категориальный вариант расчетов, строятся психометрические функции в нормальных координатах для ответов "больше".
С помощью метода наименьших квадратов по пяти экспериментальным точкам проводится наилучшая прямая, проходящая через эти точки. Для этого целесообразно воспользоваться статистическим пакетом "Stadia". В редакторе данных длительности переменного стимула заносятся в первую переменную (это будут значения Х ), а z-оценки — во вторую (это будут значения Y). Затем переходят в меню статистических процедур (F9) и выбирают опцию "Простая регрессия (тренд)". Войдя в нее, нужно указать номера переменных (1,2), а затем указать тип функции для построения регрессии — линейная. После этого программа построит для вас математическую модель ваших данных, представляя их в виде уравнения прямой: Y = а0 +a1X Получив коэффициенты а0 и а1, можно без труда построить на графике аппроксимирующую прямую. Статистическая оценка адекватности сделанной линейной аппроксимации приводится внизу экрана результатов анализа. Не выходя из программы, можно легко вычислить и все необходимые показатели: PSE, S0+ и S0- . Это означает, что по уравнению регрессионной прямой нужно найти 3 неизвестных Х по трем известным Y: z==0, z=+l и z=-l. Для проведения расчетов нужно снова вернуться в меню статистических методов и, выбрав ту же опцию ("Линейная регрессия"), указать другой порядок переменных — 2,1. Это будет означать , что в качестве Х мы выбираем z-оценки, а в качестве Y — длительность стимула. После расчета нового регрессионного уравнения нужно последовательно ввести три указанные выше величины z, и считать результат вычисления PSE, S0+ и S0-.
Далее вычисляются все необходимые пороговые показатели: IU, DL и СЕ.
4. Результаты обработки по каждой серии сводятся в итоговую таблицу.
Инстр-я | "Жхякая" | "Нйпралшая" | "Либеральная" | ||||||
Обр-ка | 3-х | 2-х | норм. | 3-х | 2-х | норм. | 3-х | 2-х | норм. |
IU | |||||||||
DX | |||||||||
PSE | |||||||||
СЕ | |||||||||
Таким образом, в этой таблице в компактном виде должны быть представлены все полученные пороговые показатели в зависимости от инструкции ("жесткая", "нейтральная" и "либеральная") и метода обработки (3-х категориальный, 2-х категориальный и интерполяция в нормальных координатах).
Если проводится обработка групповых результатов (см. выше), то данные, полученные по трем группам испытуемых, усредняются и также сводятся в одну общую таблицу.
Обсуждение результатов. В ходе анализа полученных результатов следует оценить влияние такого мощного несенсорного фактора как инструкция на различные пороговые показатели, а также посмотреть, зависят ли рассчитанные показатели от метода обработки результатов.
В выводах нужно оценить возможности и ограничения метода констант применительно к задаче оценки сенсорной чувствительности.
Результаты и выводы.
Инстр-я | "Жхякая" | "Нйпралшая" | "Либеральная" | ||||||
Обр-ка | 3-х | 2-х | норм. | 3-х | 2-х | норм. | 3-х | 2-х | норм. |
IU | |||||||||
DX | |||||||||
PSE | |||||||||
СЕ | |||||||||
Выводы: Мы провели практическую отработку метода постоянных раздражителей на примере определения дифференциального порога при различных инструкциях испытуемому. Мы освоили процедуры вычисления различных пороговых мер, получаемых в данном методе. При использовании в методе констант трехкатегориальной системы ответов значение дифференциального порога существенно зависит от сугубо сенсорных факторов, т. е. от инструкций. В данном случае при инструкции “= рекомендуется” величина ошибки будет минимальна.
Лабораторная работа 4.
Метод балльных оценок
Излагаемые в данной главе процедуры (ranking procedures. Шарф, 1975) относятся к наиболее распространенным методам порядкового шкалирования. В Отечественной литературе они получили общее название метода балльных оценок, хотя, как будет видно из излагаемого материала, они не ограничиваются только числовыми оценками стимулов. В некоторых случаях метод балльных оценок может дать более "сильную" шкалу, чем порядковая. Однако это счастливое исключение из правила, связанное более с измерительным опытом наблюдателя и характеристиками оцениваемых объектов, чем с особенностями самой измерительной процедуры.
В первой части этой главы рассматриваются основные принципы метода балльной оценки и приводятся наиболее распространенные алгоритмы построения шкал балльных оценок. Во второй части анализируются основные артефакты измерения, связанные с построением шкалы балльных оценок. Будут рассмотрены также некоторые специальные условия, которые рекомендуется соблюдать при использовании метода балльных оценок.
Из всех методов психологических измерений, в которых используются оценочные суждения человека/ процедура шкалирования, основанная на балльных оценках, наиболее популярна в силу своей простоты. Распространенность этого метода связана с прикладными разделами психологии, но не менее широко он используется и в академических исследованиях, например, в психодиагностике при оценке различий испытуемых или в психофизике при психологической оценке стимулов.
Наиболее распространенные разновидности метода балльных оценок делятся на пять больших классов: класс числовых методов, графических и шкалирование с использованием стандартов, кумулятивных и методов вынужденного выбора (Гилфорд, 1954). Все эти классы связаны с распределением объектов (стимулов) либо вдоль непрерывного континуума, либо в виде упорядоченных дискретных категорий. Все методы похожи тем, что конечным результатом является приписывание чисел стимулам в соответствии с порядком их распределения по континууму” а различаются они либо процедурой распределения стимула, либо способом различения стимулов и количеством вспомогательных операций, необходимых испытуемому. Существуют и некоторые другие аспекты, по которюл они различаются, но в связи с их частным характером эти аспекты будут рассмотрены по ходу описания каждого класса в отдельности. В данной главе будут описаны первые три класса методов, поскольку они наиболее часто используются в психологических измерениях.
Графические шкалы
Наиболее распространенным типом шкалы балльных оценок является, вероятно, графическая шкала. В общем случае она представляет собой прямую линию/ на которой определенным образом размечены признаки, характеризующие исследуемый класс объектов-стимулов. Линия может быть разделена на отрезки или непрерывна. Если она разделена на отрезки, то число отрезков может быть различным. Она может быть расположена горизонтально или вертикально. Пример непрерывной графической шкалы для балльной оценки скорости мышления отдельных индивидов приведен на рис. 1.
Крайне Инертный Мыслит Живой ум Чрезвычайно
медленно тугодум с обычной быстрое
мыслит скоростью мышление
Рис. 1. Пример графической шкалы для оценки скорости мышления
Испытуемый в этом случае выносит суждение в форме отметки на графической шкале. Признаки, расположенные вдоль шкалы, помогают ему сделать суждение более точным.
Параллельные графические шкалы.
Другая форма графической шкалы балльных оценок, названная шкалой балльных оценок поведения, была разработана Чемпнеем (1940) для оценки некоторых характеристик окружающей ребенка домашней среды.
В данном примере инструкция испытуемому была такова:
“Оцените родительское стремление проявить сверхзаботу о детском благополучии. Действительно ли родители паникуют в зависимости от степени важности ситуации, или есть родители относительно спокойные, холодные или беззаботные к своему ребенку даже в критических ситуациях?”. Кроме того, подчеркивалось, что поведение родителей рассматривается независимо от стоящих за ним мотивов, и в оценку включается только то поведение, которое потенциально направлено на ребенка и которое касается его физического и психического здоровья и комфорта.
Основная особенность этой шкалы состоит в том, что линии балльных оценок располагаются вдоль вертикальной линии. Дело в том, что на горизонтальной линии можно предусмотреть место только для очень коротенького описания признака. Подробное многословное описание здесь уже не поместится. Кроме того, на горизонтальной линии признак труднее локализовать в определенной точке, он оказывается как бы распространен вдоль линии, и поэтому точное положение его на шкале не совсем ясно. При использовании вертикальных линий эти трудности легко устранить. Признаки могут быть достаточно подробными для того, чтобы быть более значащими, в то же время их можно точнее локализовать в точках шкалы.
Еще одна положительная особенность этой шкалы заключается в том, что на каждой странице оценивается только одна характеристика поведения (в данном примере — "озабоченность — беспечность").
Общеизвестно, что более адекватные оценки дают процедуры, в которых испытуемый имеет возможность оценить всех членов группы по одной характеристике, а потом уже переходить к другой. Однако эта процедура дает удовлетворительные результаты, если в ней контролируется хорошо известный "гало-эффект" (см. ниже). Отметим также, что с помощью параллельных линий балльных оценок одной и той же характеристики можно сделать оценки сразу для многих объектов.
Общие рекомендации к построению графических шкал.
Есть определенные эмпирические правила, соблюдение которых способствует эффективности графических балльных оценок (Гилфорд, 1954). Не все из них достаточно бесспорны и убедительны, но исследователю нужно о них помнить:
1. Все объекты должны быть оценены по одной характеристике, и только потом можно переходить к следующей характеристике.
2. Линии должны быть по крайней мере 15 см длиной, но не намного длиннее. Линия должна быть достаточно длинной, чтобы учитывать самые точные количественные различия, которые могут дать испытуемые. Но при очень длинных линиях единство континуума для испытуемого прерывается. Длинные линии часто заставляют испытуемого локально сгущать оценки, а не распределять их непрерывно.
3. Линии не должны иметь разрывов и делений. Но единого мнения о том, какую из двух видов линий использовать, непрерывную или дискретную, нет. Непрерывная линия подчеркивает непрерывность шкалируемой характеристики. Дискретная линия может предполагать разрывность или скачкообразные качественные изменения оцениваемой переменной. Непрерывная линия может быть разделена на любое число единиц/ и деления могут быть размещены в соответствии с предпочтением испытуемого.
4. Для "неиспорченных" и необученных испытуемых "хорошая" оценка обычно связана с началом линии слева или сверху. В вертикальных шкалах "хорошую" оценку располагают вверху — это естественно для всех. В горизонтальных шкалах наличие "хорошей" оценки противоречит обычной практике математической системы координат. Но, тем не менее, испытуемые обычно предпочитают помещать положительные значения оцениваемой характеристики в начале линии, слева.
5. Описательные фразы и признаки должны быть сконцентрированы по возможности у точек на шкале. Это очень легко сделать для вертикальных шкал. Для горизонтальных шкал полезно использовать слова, располагающиеся в колонке одно над другим.
6. Необходимые признаки обычно равномерно расставляются вдоль линии; но это можно делать, только если они одинаково различны. В противном случае сами признаки должны быть прошкалированы какой-то отдельной психологической процедурой и тогда их локализация будет обусловливаться уже этой шкалой. Иногда между признаками промежутки специально искажаются, чтобы противодействовать общим смещениям (байесам) в балльных оценках. Например, чтобы противодействовать ошибке "смягчения", признаки на предпочитаемой стороне шкалы располагают с более широкими интервалами, чем признаки на непредпочитаемой стороне. Чтобы противодействовать тенденции образовывать сгущения балльных оценок к середине шкалы (эффект центрации), промежутки между средними признаками можно немного увеличить.
7. Конечные признаки не должны быть такими крайними по содержанию, что испытуемые очевидно никогда не будут ими пользоваться. Положение конечных признаков должно быть близко к концам линии.
8. В случае биполярных характеристик нейтральный или индифферентный признак находится обычно в центре линии, если не вводятся модификации, например, типа правила 6.
9. В процессе шкалирования можно использовать трафарет, который разделяет каждую линию на секции, где, в свою очередь, могут использоваться числовые оценки.
10. Деления могут быть неравными, они могут быть изменены с тем, чтобы помочь противодействовать систематическим байесам в балльных оценках или нормализовать распределения шкал.
Оценка графических шкал. У графических шкал много достоинств и сравнительно мало недостатков. Среди наиболее существенных преимуществ — простота и легкая управляемость. Эти шкалы интересны и не требуют сильной дополнительной мотивации, процедура шкалирования быстро выполняется испытуемым, не требует от него числовых операций, С точки зрения теории измерения, графическая шкала обеспечивает возможность такого точного различения, но. которое испытуемый вообще способен, т.е. графическая шкала может обладать "силой" шкалы интервалов или отношений, хотя чаще всего она представляет собой шкалу порядка.
Числовое шкалирование.
В числовом методе построения шкалы балльных оценок испытуемому дается последовательность определенных чисел (баллов или рангов) и он приписывает каждому стимулу соответствующее число из ряда. Пример такой шкалы, которую использовал Гилфорд (1954) для получения балльных оценок аффективных характеристик цветов и запахов, приводится ниже:
10—Невообразимо приятный;
9—Наиболее приятный;
8—Очень приятный;
7—Умеренно приятный;
б—Чуть-чуть приятный;
5— Безразличный;
4—Чуть неприятный;
3— Умеренно неприятный;
2—Очень неприятный;
1— Крайне неприятный;
О—Невообразимо неприятный.
Некоторые "числовые" шкалы, например, шкала успеваемости, на самом деле основываются на описательных суждениях типа:
Отлично
Хорошо
Удовлетворительно
Плохо
Очень плохо
Затем этим прилагательным экспериментатор приписывает числа, например, от 5 до 1. При такой процедуре предполагается, что психологические интервалы между прилагательными равны, но с точки зренияих уточнения лучше, чтобы сам испытуемый непосредственно пользовался этими числами (Торгерсон, 195В).
Некоторые проблемы числовых шкал:
1. Использование отрицательных чисел. Шкала аффектов и шкала успеваемости, рассмотренные выше, являются биполярными. Континуум представляет собой изменения в двух противоположных направлениях. По этой причине некоторые исследователи помещают ноль в нейтральной или средней категории, а отрицательные числа — ниже его. Это более естественно для того, кто знаком с алгеброй, но может быть неестественным для менее образованных испытуемых. Другая опасность состоит в том, что биполярность может создать впечатление о разрыве в нулевой точке шкалы и тем самым нарушить предполагаемую непрерывность. Наличие отрицательных чисел, таким образом, может иметь сложности для исследователя. По этим причинам использование отрицательных балльных оценок не рекомендуется (Гилфорд, 1954).
2 "Заякоривание" аффективной шкалы. Может показаться, что два крайних прилагательных в первом примере бесполезны и что вряд ли кто-нибудь из испытуемых будет пользоваться крайними категориями. Вообще, избегание крайних категорий, которые испытуемый заведомо не использует, можно считать хорошей тактикой. Однако имеются два аргумента в пользу того, чтобы включать именно такие конечные прилагательные. Один состоит в том, что некоторые испытуемые на самом деле все-таки используют даже самые крайние категории. Кроме того, испытуемый всегда может столкнуться с таким стимулом, который явно соответствует более крайней категории, чем любой из тех, что заносились в категорию 9 или 1. Если бы не было более крайних категорий, испытуемый вынужденно оценивал бы этот стимул как равный другим, хотя он явно видит их неравенство. Таким образом, конечные категории могут служить для выхода из крайних положений, которые иногда возникают. Другой аргумент состоит в том, что крайние категории являются "якорями" для всей шкалы. Показано, что добавление такой категории к одному из двух концов помогает расширить (т.е. увеличить дисперсию) исходное распределение балльных оценок в направлении этой категории (Хант и Фолькмен, 1977). В любом случае у испытуемых имеется общая тенденция избегать конечных категорий (и одновременно с этим сдвигать все оценки немного по направлению к середине ряда) . Если категории 0 и 10 не были включены, испытуемые будут иметь тенденцию избегать категории 1 и 9, и, таким образом/ укорачивать ряд балльных оценок. Итак, если исследователь хочет иметь эффективную шкалу из девяти точек, он должен обеспечить возможность расширить выход за эти 9 точек, а иначе он может в конце получить шкалу меньшую, чем из 9 точек.
Оценка числовых шкал. Для испытуемого числовые шкалы — самые легкие по вынесению суждений, а для экспериментатора — самые простые с точки зрения обработки результатов. Если испытуемый работает добросовестно, если свойства чисел можно в принципе применять к наблюдаемым феноменам, то балльные оценки сами по себе оказываются соответствующими "сильной" шкале, Эмпирическая проверка числовых балльных оценок на свойства шкалы интервалов и шкалы отношений сделана в ряде работ (Соколов и др./ 1978; Ратанова, 1972). Строгие методы проверки этих свойств для данных, полученных числовым методом балльных оценок, можно найти у Гилфорда (1954).