Анормальные модели распределения
Закон нормального распределения выступает в математической статистике в качестве эталонного закона распределения случайной величины. На базе этого закона разработано большинство классических методов статистического анализа данных. Значимость и универсальность этого закона отражены в важном положении математической статистики, которое известно как центральная предельная теорема. Согласно этому положению распределение средних значений исследуемой переменной величины в случайных выборках будет приблизительно нормальным по форме независимо от формы ее распределения в генеральной совокупности при условиях, что размер выборки достаточно велик и что дисперсия генеральной совокупности ограничена.
Следует отметить, что в психологии мы часто сталкиваемся с ситуацией, когда нормальное распределение исследуемых величин оказывается невозможным. Так, исследуя распределение времени реакции испытуемых, вряд ли стоит ожидать их нормального распределения, так как испытуемый оказывается ограниченным в возможности бесконечно много ускорять свои реакции (даже за счет предвосхищений стимула), но в то же время может бесконечно долго замедлять их. Таким образом, возникает неконтролируемый экспериментатором побочный фактор, действующий в одном направлении. В результате оказывается, что дисперсии относительно быстрых и относительно медленных ответов нс равны. Аналогичным образом, если мы исследуем какие-либо пропорции ответов испытуемых, например процент решенных испытуемым задач, мы должны быть готовыми к тому, что дисперсия этих показателей будет различаться в зависимости от того, насколько близки эти величины к крайним значениям. В этом случае может возникнуть необходимость оценки дополнительных параметров распределения. В качестве таковых обычно используются асимметрия и эксцесс.
Асимметрия и эксцесс представляют собой центральные моменты соответственно третьего и четвертого порядка. В случае нормального распределения они оказываются равными нулевым значениям. Чем больше эти параметры отличаются от нулевых, тем больше распределение случайной величины отличается от нормального. При этом возможны отличия в сторону как положительных, так и отрицательных значений.
Отрицательная асимметрия имеет место, когда в распределении преобладают величины, меньшие по своей величине, т.е. дисперсия меньших значений случайной величины оказывается много больше дисперсии больших значений.
Предположим, исследователь сконструировал интеллектуальный тест, который хорошо дифференцирует людей с относительно низким интеллектом и практически не различает людей с относительно высоким уровнем интеллекта. Тогда все те испытуемые, кто обладает относительно более высокими интеллектуальными способностями, будут по этому тесту набирать примерно одинаковые баллы. Однако испытуемые, обладающие относительно низким уровнем интеллектуального развития, будут в значительно большей степени разниться между собой. Таким образом, при применении этого теста мы непременно должны встретиться с отрицательной асимметрией распределения эмпирических баллов.
Противоположное должно иметь место в случае положительной асимметрии. Кстати, распределение времени реакции испытуемого, как правило, имеет именно положительную асимметрию, так что относительно долгие реакции имеют значительно бо́льшую вариативность (дисперсию), чем более быстрые. Отсутствие положительной асимметрии при измерении времени реакции на самом деле может свидетельствовать о том, что испытуемый прогнозирует свой ответ, угадывая стимулы до их предъявления, так что сам факт положительной или отрицательной асимметрии ни в коем случае не является показателем некорректности экспериментальной процедуры, как иногда это может представляться.
Эксцесс также бывает положительным и отрицательным. Отрицательный эксцесс свидетельствует о том, что имеет место более или менее равномерное распределение величин интересующей нас случайной величины. В этом случае по эмпирическим данным бывает трудно оценить моду распределения, так как частоты появления различных значений исследуемой переменной оказываются примерно одинаковыми. Иногда отрицательный эксцесс может даже свидетельствовать о существовании двух мод распределения. Бимодальное распределение может указывать на то, что экспериментатор фактически имеет дело не с одной, а с двумя переменными, описывающими два различных способа поведения.
Например, если при исследовании времени реакции в группе испытуемых обнаруживается его бимодальное распределение, это может свидетельствовать о том, что значительная часть испытуемых пыталась предугадать появление стимула, на который они должны реагировать, тогда как другая часть выполняет инструкцию экспериментатора точно, ожидая появления целевого стимула. Если же бимодальное распределение обнаружится в оценках двух разных преподавателей, принимающих у одной группы студентов независимо друг от друга один и тот же экзамен, это может говорить о том, что критерии качества ответов студентов у этих двух преподавателей различаются.
Положительный эксцесс отражает тот факт, что случайные величины тесно группируются вокруг какого-либо одного значения. Это может, в частности, свидетельствовать о том, что используемые экспериментатором средства измерения исследуемой характеристики оказались недостаточно чувствительными. В дифференциальной психометрике – психодиагностике – положительный эксцесс может указывать среди прочего на то, что ключ используемого для оценки личностных свойств опросника составлен неверно, либо на то, что испытуемые, разгадав направленность опросника, пытаются балансировать свои положительные и отрицательные ответы. В результате может оказаться, что большинство испытуемых демонстрируют по измеряемому свойству уровень, близкий к среднему.
Существуют специальные процедуры, позволяющие по наблюдаемым значениям случайной величины оценить уровень асимметрии ее распределения, равно как и эксцесс.
Так, величину асимметрии можно оценить по следующей формуле:
(1.6)
где s – величина стандартного отклонения.
Аналогичным образом оценивается величина эксцесса:
(1.7)
Однако при "ручных" вычислениях эти формулы практически не применяются, так как предполагают довольно утомительную работу при том, что сами оценки этих параметров обычно нужны лишь в качестве инструмента оценки нормальности распределения, т.е. играют вспомогательную роль. Поэтому при оценке этих параметров распределения лучше воспользоваться компьютером. Соответствующие статистические функции включают практически все электронные таблицы, равно как и специализированные статистические пакеты практически всегда включают возможности расчета эксцесса и асимметрии в своих базовых модулях описательной статистики. Если вычисленные значения оказываются близкими к нулю, значит, мы имеем дело либо с нормальным распределением, либо близким к нормальному. Если значения асимметрии или эксцесса, а может быть, и того и другого, выходят за пределы ±2, то это, скорее всего, свидетельствует об анормальности распределения исследуемой величины.
Таким образом, обработка экспериментальных данных начинается с оценки параметров распределения исследуемых случайных величин: математического ожидания, дисперсии (стандартного отклонения), асимметрии и эксцесса.