Современное состояние оценки личности 2 страница

Теория стиля жизни.Систематическое исслед. стиля жизни включает учет формирующего опыта, полученного в детстве и определяющего экзистенциальные решения относительно жизни, себя и других, к-рые влияют на актуальное поведение и могут повлиять на поведение в будущем. Т. о., хотя в фокусе исслед. оказывается раннее детство, целью яв-ся определение его влияния на настоящее и будущее. Это исслед. в формате структурного интервью вовлекает такие семейные вопросы, как порядок рождения сиблингов, отношения между членами семьи, проблемы соперничества между сиблингами, семейные ценности и ранние воспоминания индивидуума о формирующем детском опыте.

Такая позиция аналогична «модусу бытия в мире» Г. Олпорта и «модусу существования» Адриана ван Каама. Оптимистические философии подобных теоретиков включают представление о том, что прошлые решения и паттерны поведения индивидуума могут последовательно пересматриваться, модифицироваться и изменяться. Т. о., понимание стиля жизни чел. яв-ся первым шагом к изменению его поведения и/или аттитюдов.

Раскрытие и О. с. ж. индивидуума делает возможным понимание конкретного чел. как самосогласованного и самоуправляемого организма, чей лейтмотив отражается во всех личных действиях, ориентированных на движение вперед, намеренных и определяемых не простыми физиолог. реакциями на внешнюю среду, а индивидуальными ценностями.

Интерпретационные стратегии.Согласно Динкмейеру, Пью и Динкмейеру, адлерианское систематическое резюме стиля жизни включает идентификацию следующих моментов:

— Проблемы индивидуума и содержание чувства недостаточности.

— Направления, в к-рых индивидуум пытается преодолеть субъективно воспринимаемую недостаточность.

— Отношение между таким направлением и соц. интересом сотрудничества.

— Специфические зоны затруднений при решении жизненных задач.

— Как индивидуум избегает решения проблем.

— Как удается быть довольным собой, несмотря на избегание конфронтации с проблемами.

— Значимые влияния прошлой жизни индивидуума.

Д. Икстейн отмечает, что в ходе составления этого резюме должны также использоваться поддержка и ободрение в целях идентификации индивидуумом своих сильных сторон и ценных качеств. Следующие 3 общих типологии стиля жизни могут помочь сориентироваться в начале составления резюме:

1. Главные приоритеты. Адлер отмечал, что люди рано в жизни выбирают главные приоритеты для ответа на осн. экзистенциальный вопрос: «Что самое важное для моей принадлежности к данной группе?» Они включают превосходство, контроль, умение нравиться и комфорт. «Страхи, которых надо избегать» в связи с этими приоритетами включают собственную малозначимость, унижение, отвергание и стресс соответственно.

2. Четырнадцать тем общего стиля жизни. Г. Мозак выделил следующие типы личности по общему стилю жизни: добытчик (getter), стимулятор (driver), контролер (controller), правый (right), превосходящий (superior), нравящийся (liked), хороший (good), находящийся в оппозиции (opposed), жертва (victim), мученик (martyr), ребенок (baby), неадекватный (inadequate), избегающий чувств (avoid-feelings)и ищущий возбуждения (excitement-seeker).

3. Опросник стиля жизни. Р. Дрисколл и Д. Икстейн модифицировали предложенные Ф. Торном категории стиля жизни — агрессивный, конфронтирующий, защищающийся, индивидуалистичный и сопротивляющийся — в следующие, сравниваемые с животными, 5 описательных характеристик:

1) «Тигры» обычно агрессивны. Они наслаждаются проявлениями власти, любят находиться в центре внимания и могут настаивать на своем руководстве событиями.

2) «Хамелеоны» обычно конформны. Их гибкость позволяет им прямо встречать проблемы.

3) «Черепахи» обычно защищаются. Они серьезны, находчивы и ведут контролируемую ими, стабильную жизнь.

4) «Орлы» выглядят индивидуалистами. Их не заботит общественное мнение, они могут быть эгоистичными и попирают права других, идя своим путем.

5) «Лососи» обычно сопротивляются. Они предпочитают «плыть против течения», а не поддерживать разделяемые всеми ценности.

См. также Адлерианская психотерапия, Клиническая оценка

Д. Икстейн

 

Оценка труда работника (для установления заработной платы) (job evaluation)

 

Люди, выполняющие разную работу, получают разную зарплату. Различия в оплате труда обычно рассматриваются как справедливые, хотя различные обоснования этих различий могут иногда основываться на несовместимых ценностях. В большинстве орг-ций в промышленно развитых странах относительные различия в оплате труда обычно считаются сопоставимыми, если они отражают относительные различия в сравнительной стоимости работ для орг-ции. Процесс определения различий в относительной стоимости работ называется О. т. р.

Существует множество методов О. т. р. Общий подход можно описать в виде пяти этапов: а) членам комиссии по О. т. р. представляют описания работ; б) комиссией разрабатывается или ей представляют набор характеристик или параметров, по к-рым различаются виды работ, — т. н. «компенсируемые факторы» (compensable factors); в) на основании описаний работ члены комиссии оценивают в баллах или к.-л. иначе каждую работу по каждому параметру и достигают согласия в отношении оценок; г) все оценки работы суммируются (с учетом соответствующих весовых коэффициентов) согласно принятой формуле, с тем чтобы определить стоимость работы; и д) полученные суммы переводят в нормы оплаты труда. Базовые оценочные суждения выносятся на втором и четвертом этапах, на к-рых определяют компенсируемые факторы и соответствующие им весовые коэффициенты.

Базовые суждения.Какой-то чел. или к.-л. группа людей должны решить, какие характеристики работы следует использовать в качестве базиса компенсации. Определение факторов может носить общий характер в одних программах и быть исключительно точным в других. Каким бы ни был вид итогового перечня компенсируемых факторов, его необходимо составить, и должно быть достигнуто согласие в отношении относительной ценности факторов. Без такого согласия принятие конечного плана оплаты труда маловероятно. Отсюда следует, что эти суждения должны быть выработаны коллективно людьми, представляющими различные уровни и функциональные подразделения организации. Если имеется профсоюз, он также должен быть представлен. Если профсоюза нет, принцип делегирования или участия представителей трудового коллектива все равно важен.

Определение размера заработной платы.О. т. р. как таковая выявляет относительную стоимость работ в рамках изучаемого ряда. Перевод абстрактных показателей относительной стоимости в фактические шкалы заработной платы обычно требует обращения к «типовым работам» (key jobs)работам, распространенным в данном об-ве или отрасли промышленности и отличающимся более или менее унифицированными расценками. Унификация оплаты труда существует постольку, поскольку предложение и спрос на рабочую силу на рынке труда в данном случае стабилизировались. Для таких видов работ может быть статистически выведена кривая, показывающая, как меры относительной стоимости связаны с расценками на типовые работы. Та же самая кривая может быть затем использована для др. работ, с тем чтобы установить ставки заработной платы, к-рые воспринимались бы как справедливые.

Сопоставимая стоимость.Согласно законодательству США, мужчины и женщины, выполняющие одинаковые виды работ, должны получать за них одинаковую оплату. Расширенное толкование этого принципа гласит, что люди, выполняющие сопоставимую по стоимости работу, должны получать за нее равную (или сопоставимую) оплату. Р. Ливернэш подчеркивал, что системы О. т. р. должны использоваться или разрабатываться таким образом, чтобы они учитывали этот вопрос справедливой оплаты. Однако Р. Блумроузн, полемизируя с ним, утверждала, что в ходе истории женщины оказались сегрегированной профессиональной группой, включающей небольшое число профессий, а избыточное предложение рабочей силы в этих профессиях способствовало снижению заработной платы. Если такие работы включить в перечень «типовых работ», традиционная О. т. р. будет способствовать сохранению существующей дискриминации в оплате труда.

См. также Промышленная и организационная психология, Промышленная психология, Профессиографический анализ

Р. М. Гийон

 

Оценка частоты событий (frequency judgment)

 

Среди наиболее интенсивно исследуемых когнитивных функций, оценка частоты появления стимула или события, по-видимому, обладает рядом необычных свойств. В отличие от др. когнитивных функций, оценка частоты событий остается практически неизменной на протяжении возраста. Как утверждают в своих двух дискуссионных статьях Хэшер и Закс, чувствительность к частоте появления стимула почти не увеличивается со времени посещения детьми детского сада до наступления взрослости и даже, может быть, на протяжении всей взрослой жизни. Др. когнитивные функции, в особенности свободное вспоминание (free recall)и узнавание, обычно демонстрируют большие и регулярные приращения за период перехода от детства к взрослости.

Автоматизм.Основной теорет. интерес к утверждению Хэшера и Закса связан с предполагаемым автоматизмом процесса кодирования информ. о частоте. Информ. о частоте, по-видимому, кодируется без к.-л. сознательного намерения (intention)со стороны субъекта. Несмотря на существование определенных разногласий по этому вопросу, основная позиция остается по существу устойчивой к эмпирической проверке. Дети различного возраста, интеллектуального и образовательного уровня оказываются в равной степени успешными в кодировании и поиске информ. о частоте; в своем выполнении тестов на оценку частоты они оказываются столь же эффективными, как студенты колледжей и взрослые люди.

Аргумент об автоматизме подкрепляется тем фактом, что в экспериментах практически не было выявлено улучшений в выполнении заданий на оценку частоты у испытуемых, к-рых заранее информировали о характере предстоящего задания и инструктировали быть внимательными и запоминать частоту стимулов в течение эксперим. сессии; наивные испытуемые, чье кодирование информ. о частоте оказывалось «случайным», выполняли эти задания столь же успешно. Информированные испытуемые зачастую сообщают, что они просто больше запутываются в результате своих сознательных усилий следить за частотами тех многочисленных стимулов, к-рые предъявляются в ходе эксперим. сессии. Кроме того, аргумент об автоматизме поддерживается тем фактом, что практика, к-рая может оказываться влиятельной детерминантой улучшения эффективности в выполнении заданий, в к-рых задействованы такие когнитивные процессы, как воспроизведение по памяти, не оказывает влияния на выполнение заданий на оценку частоты.

Хэшер и Закс постулируют, что автоматически (т. е. без усилий) кодируются пространственная локализация и временная последовательность событий. Свидетельства в пользу автоматизма оказываются более убедительными для пространственной локализации (напр., Эллис пришел к выводу, что «основная опора» аргументации Хэшера и Закса была укреплена его собственными результатами в том, что касается пространственной локализации).

Стратегии.Несмотря на то что основная информ. о частоте может в равной степени успешно кодироваться на протяжении возрастного развития, ее поиск (в памяти) может в определенной степени изменяться в зависимости от возраста и образовательных достижений. В этом случае любые важные различия в реализации поиска могут объясняться гл. обр. использованием различных стратегий. Напр., обнаружено, что старшие дети по сравнению с младшими чаще сообщают о том, что в своих попытках найти информ. о частоте они использовали оценки степени знакомства (или силы) стимула; младшие дети чаще сообщают, что они старались считать отдельные появления стимулов.

Методы измерения.Существует два основных способа, при помощи к-рых можно измерить оценку частоты стимула или события: а) абсолютный метод, при к-ром испытуемого просят дать точную числовую оценку частоты появления каждого стимула; б) относительный метод, при к-ром предъявляются пары стимулов и задачей испытуемого яв-ся выбрать из них тот, к-рый, по его мнению, появлялся чаще.

Главное преимущество абсолютного метода состоит в том, что предоставляемые им количественные оценки поддаются разнообразным методам статистической обработки. Они включают вычисление пирсоновских коэффициентов корреляции с фактическими частотами и др. статистические процедуры, такие как оценка различий на основе t-критерия и дисперсионный анализ абсолютных оценок или числа правильных ответов, отклонений субъективных оценок от фактических частот и числовых оценок, классифицированных на основе фактических частот. Все эти и другие процедуры использовались в исслед. данной проблемы.

Главные преимущества относительного метода, или метода парных сравнений, заключаются в том, что он проще и, следовательно, в большей степени применим к детям и испытуемым с невысоким интеллектуальным уровнем, и что он может оказываться более чувствительным инструментом измерения. При сбалансированном наборе близких по частоте элементов (напр., 1 и 2, 2 и 3) и более различающихся по частоте элементов (напр., 1 и 4, 2 и 5), средняя доля правильных ответов обычно приближается к 75%; как указывалось ранее, практически отсутствует вариация в зависимости от таких переменных, как возраст, уровень интеллекта, образовательные достижения и т. д., т. е. всех тех переменных, к-рые обычно влияют на воспроизведение по памяти и узнавание изучаемых элементов.

Теория.Несмотря на отсутствие согласия по поводу теорет. объяснения механизма О. ч. с., наиболее общепринятым является объяснение Хинцмана. Оно основано на допущении, что в ответ на просьбу оценить частоту субъект воспроизводит и подсчитывает отдельные ранее пережитые ситуации, в к-рых возникал целевой стимул (напр., конкретные предложения, в к-рые входило данное слово, или, еще чаще, просто случаи его появления в списке предъявляемых слов). Это объяснение пришло на смену более традиционной т. зр., согласно к-рой на оценку частоты влияет «сила» более часто предъявлявшихся стимулов.

Объяснение на основе подсчета или многократного отслеживания представляется наиболее правдоподобным для элементов со сравнительно низкими частотами встречаемости. Хинцман признавал, что для более высоких частот могут потребоваться другие объяснения. Эта переменная частоты встречаемости элементов (item-frequency variable)неадекватно анализировалась в исслед. по данной проблеме. До сих пор, в силу противоречивого характера эмпирических результатов, остается невыясненным вопрос об отношениях между оценкой частоты и узнаванием, т. е., при низких частотах встречаемости элементов, не сводится ли задача испытуемого просто к признанию целевого слова «старым» и, следовательно, заслуживающим некоторой положительной числовой оценки, такой как 1 или 2, или «новым» (не попадавшимся ранее в списке) и, следовательно, заслуживающим только О оценки частоты?

Каковым бы ни было окончательное теорет. объяснение О. ч. с., для него несомненно потребуется более адекватное описание роли переменной частоты встречаемости элементов.

Добывание пищи животными.Определенного вида оценка частоты, по-видимому, используется животными в процессе добывания пищи (а тж в др. менее изученных формах научения животных). При добывании пищи решение о том, когда покинуть и когда вернуться в конкретные области кормления, связано с количеством успехов (нахождение пищи) и с количеством неудач, к-рые животное ассоциирует с каждым обследованным участком. Несмотря на то что животные могут тем или иным образом использовать такого рода информ. о частоте, то, как именно они это делают, еще предстоит выяснить. Представляется очевидным, что гипотеза «подсчета» в меньшей степени подходит к занятому добыванием пищи животному, нежели к чел. Определенного вида генерализованный фактор «силы», вероятно сходный с тем «ощущением знакомства», о к-ром упоминали дети старшего возраста в своих ретроспективных отчетах о выполнении ими заданий на оценку частоты, представляется, опять же интуитивно, более правдоподобным в отношении добывающих пищу животных.

См. также Социобиология животных, Оценка и принятие решений, Видоспецифичное поведение

М. Маркс

 

Оценочные (рейтинговые) шкалы (rating scales)

 

Вотличие от пунктов контрольных списков, к-рые требуют от респондентов исключительно ответов «да—нет», по пунктам О. ш. респондент (оценщик) должен выносить оценочные суждения на некотором многокатегориальном континууме. Введенные Ф. Гальтоном в прошлом столетии, О. ш. с тех пор широко используются в бизнесе, промышленности, образовательных учреждениях и др. организационных контекстах для оценки различных поведенческих и личностных характеристик. Такие оценки обычно даются др. чел. (напр., руководителем или сотрудником), однако люди могут оценивать и самих себя.

Типы оценочных шкал.В числовой О. ш. (numerical rating scale)оценщик приписывает оцениваемому им чел. одно или несколько чисел, связанных с конкретными описаниями оцениваемой характеристики. Простой пример числовой шкалы для оценки конкретного чел. по характеристике «дружелюбие» — приписывание целых чисел от 0 до 4 в зависимости от того, насколько дружелюбным воспринимается этот чел. Иллюстрацией применения числовой О. ш. яв-ся тж методика семантического дифференциала, широко используемая в исслед. коннотативных значений разнообразных понятий. Другим широко используемым оценочным методом яв-ся графическая О. ш. (graphic rating scale), в к-рой оценщика просят указать точку на линии, связанную с соответствующим описанием оцениваемого.

В стандартной О. ш. (standard rating scale), оценщик либо вырабатывает сам, либо обеспечивается готовым набором стандартов, с к-рыми он сравнивает оцениваемых. Примером является субъект-субъектная шкала (man-to-man rating scale), применяемая на протяжении многих лет в армии США для оценки перспективности офицеров. Субъект-субъектная шкала конструируется для оценивания конкретных людей в отношении определенной черты, напр. способности к лидерству, посредством обращения к оценщику с просьбой представить себе пятерых людей, к-рые попадают в различные точки некоего гипотетического континуума способности к лидерству. Затем этот оценщик сравнивает каждого чел., к-рого он должен оценить, с каждым из этих пяти людей и указывает, на кого из них данный оцениваемый в наибольшей степени походит в своей способности к лидерству.

При использовании О. ш. с вынужденным выбором (forced-choice rating scale)оценщику предъявляют два или более описаний и просят указать, какое из них в наибольшей степени подходит оцениваемому. Если имеются три или более описаний, оценщиков также могут попросить указать, какое из описаний в наименьшей степени подходит оцениваемому.

Ошибки оценивания.Преимущество метода вынужденного выбора состоит в том, что в сравнении с другими типами шкал он позволяет в большей степени контролировать определенные ошибки в оценивании. Два вида ошибок связаны с необоснованным завышением (ошибка снисходительности) или занижением оценок (ошибка строгости). Другими ошибками являются слишком частый выбор «ни то, ни другое», или средних категорий ответа (ошибка центральной тенденции) и оценивание конкретного чел. высоко по определенной поведенческой или личностной характеристике просто по причине его высоких оценок в др. областях (эффект ореола или гало-эффект). Оценщики также могут совершать ошибки контраста (contrast error), давая чел. более высокую оценку просто в силу того, что предыдущий оценивался более низко, или, напротив, давая ему более низкую оценку, потому что предыдущий оценивался более высоко.

См. также Шкалирование

Л. Р. Эйкен

 

Очевидная валидность (face validity)

 

О. в. можно определить как то, в какой степени содержание теста и его заданий (пунктов) выглядит в глазах тестируемого подходящим для данной ситуации.

Содержание очевидно валидных тестов легко опознается выполняющими их лицами, и потому ответы на них могут подвергаться сознательному или бессознательному искажению. Разработчики тестов, придерживающиеся той теорет. ориентации, согласно к-рой люди не склонны к открытому и честному самовыражению, считают, что О. в. тестов будет приводить к неточным ответам и, следовательно, нужно избегать конструирования таких тестов. Напротив, создатели тестов, занимающие противоположную позицию (люди выражают себя открыто и честно), считают прямые, «прозрачные» (т. е. обладающие О. в.) тесты предпочтительными.

Исслед. технической валидности (technical validity)показали наличие значимых положительных связей между О. в. и точностью. Задания (пункты) теста, обладающие О. в., в среднем оказываются более валидными, или точными, мерами (проще говоря, лучшими заданиями, так как обнаруживают тенденцию к более сильной связи с соотв. критерием) по сравнению с теми, к-рые не обладают О. в. Кроме того, в ситуациях, когда тестируемых просили фальсифицировать свои ответы, пункты с О. в. (к-рые предположительно более подвержены искажению) не уступали в точности измерения пунктам, не обладающим О. в.

О. в. теста оказывается важным фактором в отношениях с общественностью и при рассмотрении дел в судах. Психол. тестирование не должно быть противоречащим или нерелевантным опыту тестируемого. Сотрудничество и хороший раппорт между тестирующим и тестируемыми яв-ся наилучшим вариантом взаимодействия при любых обстоятельствах. Наличие О. в. способствует воспринимаемой целесообразности психол. теста и уменьшает вероятность возникновения у тестируемого впечатления, что тест не учитывает его индивидуальность. Недостаток О. в. (независимо от технической валидности, или точности, теста) может вызывать у тестируемых чувства раздражения, неудовлетворенности и обманутости. Такие чувства вполне м. б. эмоциональными корнями негативного общественного мнения, публичных требований прекращения оценочных программ (напр., в школах), конфликтов между наемными работниками и администрацией или даже возбуждения судебного разбирательства.

См. также Компьютеризованное адаптивное тестирование, Культурно-свободные тесты, Тестовая тревожность

Р. Р. Холден

 

Ошибка игрока (gambler's fallacy)

 

О. и., или ложный вывод Монте-Карло, отражает распространенное неправильное понимание случайности событий. Предположим, что монета подбрасывается много раз подряд. Если выпадает подряд 10 «орлов» и если эта монета яв-ся «правильной», для большинства людей выглядело бы интуитивно очевидным, что выпадение «решки» запаздывает. Однако такой вывод является ложным.

Эту ошибка получила в специальной литературе название «отрицательный эффект новизны» (negative recency effect)и состоит в тенденции к предсказанию скорого прекращения часто происходившего в последнее время события. Она основана на вере в локальную репрезентативность (т. е. на уверенности в том, что последовательность случайно возникающих событий будет носить характеристики случайного процесса даже когда она оказывается короткой). Т. о., в соответствии с этим ошибочным представлением, генератор случайных событий, напр., подбрасывание монеты, должен приводить к исходам, в к-рых — даже по прошествии короткого времени — не будет наблюдаться значительного преобладания того или другого из возможных исходов. Если выпадает серия одинаковых исходов, возникает ожидание того, что случайная последовательность скорректирует себя сама в ближайшем будущем, и отклонение в одном направлении тем самым подвергнется обязательному уравновешению отклонением в другом. Однако случайно генерируемые последовательности, в особенности если они оказываются сравнительно короткими, оказываются совершенно нерепрезентативными производящему их случайному процессу.

Ошибка игрока — это нечто большее, чем просто отражение обычного статистического невежества, поскольку она может наблюдаться в частной жизни даже искушенных в статистике людей. Она отражает два аспекта челов. когнитивной функции: а) сильную и неосознанную мотивацию людей к тому, чтобы находить порядок во всем, что они вокруг себя наблюдают, даже если наблюдаемая ими последовательность исходов возникает в результате случайного процесса, б) всеобщую челов. склонность игнорировать основанные на расчетах оценки вероятностей, отдавая предпочтение интуиции. Хотя логика может убеждать нас в том, что случайный процесс не контролирует своих исходов, наша интуитивная реакция может быть очень сильной и временами подавлять логику. Исследовавший сравнительную силу логического и интуитивного мышления Рид утверждает, что последнее зачастую оказывается более принудительным чем первое, вероятно, по той причине, что подобные умозаключения приходят на ум внезапно, следовательно, не поддаются логическому анализу и часто сопровождаются сильным ощущением своей правоты. В отличие от принципиальной невозможности отследить процесс, посредством к-рого находятся такие интуитивные «решения», процесс логического рассуждения открыт для анализа и критики. Поэтому люди управляют логическим мышлением, а от интуитивного мышления они просто получают результаты, к-рые наполняют последнее сильным ощущением чувства правоты.

О. и. наиболее распространена в ситуации, когда исходы генерируются чисто случайно. Если в развитии событий участвует некоторый фактор мастерства, чаще наблюдается положительный эффект новизны (positive recency effect). Наблюдатель скорее всего будет рассматривать серию успехов (напр., игрока в бильярд) как свидетельство его мастерства, и будет выстраивать свои прогнозы последующих исходов скорее в положительном, чем в отрицательном направлении. Даже бросание костей может приводить к положительному эффекту новизны в той степени, в к-рой индивидуум убежден, что на исход события каким-то образом влияет «искусство» бросающего.

См. также Эффект Барнума, Поведение игроков, Статистический вывод

Дж. Элкок

 

Ошибки (I и II рода) (errors (type I and II))

 

Когда статистический анализ используется для проверки гипотез, экспериментаторы обычно еще до начала сбора данных формулируют вероятностное предположение особого рода, называемое нулевой гипотезой (H0). Такое предварительное постулирование предусматривает оценку результатов исслед. на основе теории выборочного распределения и нормального закона распределения вероятностей. Нулевая гипотеза отражает связь между переменными и формулируется таким образом, чтобы она сама или её отрицание приводили к информ., к-рую можно было бы использовать для повышения ранга исследовательских гипотез. После того как данные собраны и статистически обработаны, исследователь должен принять решение о том, отклонять ли ему нулевую гипотезу или нет.

Логика принятия такого решения предполагает возможность четырёх исходов, два из которых яв-ся ошибочными. О. I р. совершается в тех случаях, когда принимается решение отклонить H0, хотя в действительности H0 верна. О. II р., напротив, состоит в решении не отклонять H0, хотя в действительности H0 неверна. Два др. возможных исхода — это правильное решение отклонить Н0(когда она на самом деле неверна) или правильное решение не отклонять её (когда она действительно верна). Собственно говоря, нулевую гипотезу как таковую невозможно доказать без знания «истинного» положения дел, но ее можно опровергнуть, если вероятность того, что полученные результаты согласуются с ней, чрезвычайно мала. Поэтому решения, принимаемые на основе проверки статистической гипотезы, обычно формулируются в виде утверждений, содержащих указание уровней вероятности или уровней достоверности правильности различных исходов в свете H0.

Вероятность совершить О. I р. обозначается символом α (альфа)и контролируется непосредственно экспериментатором. Задавая величину α, экспериментатор точно определяет уровень вероятности, связанный с решением отклонить H0 на основе доли случаев, когда такое решение будет правильным. Уровень α также называют уровнем достоверности или уровнем значимости. В соц. и поведенческих науках принято формулировать нулевую гипотезу в форме отрицания теорет. ожидания экспериментатора или выдвинутой им поисковой гипотезы. Тогда, если уровень α, как это обычно бывает, выбирается равным 0,05 или 0,01, а величина выборочной стат. достигает ее критического значения для выбранного уровня α или превышает таковое, появляется возможность отклонить H0 и сделать следующий вывод: шансы того, что эксперим. воздействие действительно производит измеряемый эффект, равны соответственно 95 из 100 или 99 из 100.

Вероятность О. II р. обозначается символом β (бета)и не может непосредственно контролироваться, так как зависит, помимо всего прочего, от величины экспериментального эффекта и «истинного» положения дел, к-рое нам в принципе неизвестно. Кроме того, выбор более жесткого уровня β увеличивает шансы совершения О. II р., поскольку неизбежно приводит к тому, что для своего обнаружения эксперим. эффект должен быть более выраженным (по величине). Тогда как H0 предполагает только одно выборочное распределение, альтернативная гипотеза чаще всего точно не определяется, и величина β будет варьировать в зависимости от того, какое из почти бесконечного ряда альтернативных выборочных распределений окажется для нее справедливым. Если выбирается конкретная альтернативная гипотеза, можно вычислить β и обратную ей величину: 1 — β называемую мощностью критерия. Единственный способ, каким экспериментатор может повысить мощность критерия и уменьшить β, состоит в увеличении числа изучаемых случаев. С увеличением объема выборки уменьшается стандартная ошибка используемой стат., а значит, и область критических значений последней, что позволяет легче отклонить Н0. Поэтому задание уровня α и выбор объема выборки имеют решающее значение при проверке статистической гипотезы и должны диктоваться соображениями сравнительной серьезности совершения О. I и II р.