Тема 3. Нормальное распределение. Уровень достоверности

Тема 1. Шкалы измерений

Глава 1. Основные понятия статистики и дескриптивный анализ.

Обычно используют следующие типы шкал измерений: номинальная(названий или

категорий), порядковая(ординальная), интервальная и относительная(шкала отношения

или абсолютная шкала). Соответственно имеются четыре типа переменных: номинальная,

порядковая (ординальная), интервальная, относительная (абсолютная).

1) Номинальные переменныеиспользуются только для качественной классификации. Это

означает, что данные переменные могут быть измерены только в терминах принадлежности к

некоторым существенно различным классам, при этом вы не сможете определить количество

или упорядочить эти классы. Часто номинальные переменные называются категориальными.

ПРИМЕРОМ номинальных переменных являются фирма-производитель, тип товара, признак

(болен - здоров) и т. д.

2) Порядковые переменныепозволяют ранжировать (упорядочить) объекты, если указано,

какие из них в большей или меньшей степени обладают качеством, выраженным данной

переменной. Однако они не позволяют определить «на сколько больше» или «на сколько

меньше» данного качества содержится в переменной. Порядковые переменные иногда также

называют ординальными.

ПРИМЕР 1 - социоэкономический статус семьи. Мы понимаем, что верхний средний уровень

выше среднего уровня, однако сказать, что разница между ними равна, допустим, 18%, мы не

можем. Само расположение шкал в порядке возрастания их информативности - номинальная,

порядковая, интервальная - является хорошим примером порядковой переменной.

ПРИМЕР 2 - интенсивность использования определенного цвета в картине художника.

Категориальные и порядковые переменные особенно часто возникают при анкетировании,

Т.к. естественно отражают характер мышления человека. Например, измерение

интенсивности посещение ресторанов можно проводить в следующей шкале: не посещаю,

Посещаю редко, посещаю, посещаю часто.

Категориальные и порядковые шкалы часто используются для описания качественных

Признаков.

3) Интервальные переменныепозволяют не только упорядочивать объекты измерения, но и

численно выражать и сравнивать различия между ними. Такого рода переменные часто

возникают в естественных науках, при снятии показателей с физических приборов, в медицине

и т. д.

ПРИМЕР - температура, измеренная в градусах Фаренгейта или Цельсия, образует

интервальную шкалу. Вы можете не только сказать, что температура 40 градусов выше, чем

температура 30 градусов, но и то, что увеличение температуры с 20 до 40 градусов вдвое

больше увеличения температуры от 30 до 40 градусов.

4) Относительные переменныеочень похожи на интервальные переменные. Их характерной

чертой является наличие определенной точки абсолютного нуля, таким образом, для этих

переменных являются обоснованными утверждения типа: X в два раза больше, чем Y.

ПРИМЕР - температура по Кельвину образует шкалу отношения, и вы можете не только

утверждать, что температура 200 градусов выше, чем 100 градусов, но и то, что она вдвое выше.

Интервальные шкалы (например, шкала Цельсия) не обладают данным свойством шкалы

отношения. Однако в большинстве статистических процедур не делается тонкого различия

между свойствами интервальных шкал и шкал отношения.

Тема 2. Генеральная совокупность и выборка

Глава 1. Основные понятия статистики и дескриптивный анализ.

Исследование обычно начинается с некоторого предположения, требующего проверки с

привлечением фактов. Это предположение - гипотеза - формулируется в отношении связи

явлений или свойств в некоторой совокупности объектов.

Для проверки подобных предположений на фактах необходимо измерить соответствующие

свойства у их носителей. Но невозможно измерить тревожность у всех женщин и мужчин, как

невозможно измерить агрессивность у всех подростков. Поэтому при проведении исследования

ограничиваются лишь относительно небольшой группой представителей соответствующих

совокупностей людей.

Генеральная совокупность- это все множество объектов, в отношении которого

формулируется исследовательская гипотеза.

В первом примере такими генеральными совокупностями являются все мужчины и все

женщины. Во втором - все подростки, которые смотрят телепередачи, содержащие сцены

насилия. Генеральные совокупности, в отношении которых исследователь собирается сделать

выводы по результатам исследования, могут быть по численности и более скромными.

Таким образом, генеральная совокупность - это хотя и не бесконечное по численности, но, как

правило, недоступное для сплошного исследования множество потенциальных испытуемых.

Выборка- это ограниченная по численности группа объектов (в психологии - испытуемых,

респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств.

Соответственно, изучение на выборке свойств генеральной совокупности называется

выборочным исследованием. Практически все психологические исследования являются

выборочными, а их выводы распространяются на генеральные совокупности.

Таким образом, после того, как сформулирована гипотеза и определены соответствующие

генеральные совокупности, перед исследователем возникает проблема организации выборки.

Выборка должна быть такой, чтобы была обоснована генерализация выводов выборочного

исследования - обобщение, распространение их на генеральную совокупность. Основные

критерии обоснованности выводов исследования - это репрезентативность выборки и

статистическая достоверность (эмпирических) результатов.

Репрезентативность выборки- иными словами, ее представительность - это способность

выборки представлять изучаемые явления достаточно полно - с точки зрения их изменчивости в

генеральной совокупности.

Зависимые и независимые выборки.Обычна ситуация исследования, когда интересующее

исследователя свойство изучается на двух или более выборках с целью их дальнейшего

сравнения. Эти выборки могут находиться в различных соотношениях - в зависимости от

процедуры их организации. Независимые выборки характеризуются тем, что вероятность

отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых

другой выборки. Напротив, зависимые выборки характеризуются тем, что каждому

испытуемому одной выборки поставлен в соответствие по определенному критерию

испытуемый из другой выборки.

В общем случае зависимые выборки предполагают попарный подбор испытуемых в

сравниваемые выборки, а независимые выборки – независимый отбор испытуемых.

Следует отметить, что случаи «частично зависимых» (или «частично независимых») выборок

недопустимы: это непредсказуемым образом нарушает их репрезентативность.

Тема 3. Нормальное распределение. Уровень достоверности.

Глава 1. Основные понятия статистики и дескриптивный анализ.

Нормальный закон распределения играет одну из наиважнейших ролей в применении и выборе

статистических методов. Закон нормального распределения на графике выражается в виде

кривой «колоколообразной» формы.

Каждому биологическому и психологическому свойству соответствует свое распределение в

генеральной совокупности. Чаще всего оно нормальное и характеризуется своими параметрами

– средним и сигмой. Так, среднее значение задает положение кривой на числовой оси, а сигма –

задает ширину этой кривой и выступает как масштаб измерения.

Наиболее важным свойством кривых нормального распределения является одинаковая доля

площади под кривой между одними и теми же значениями признака, выраженными в единицах

стандартного отклонения.

Все многообразие нормальных распределений может быть сведено к одной кривой, если

применить z-преобразование (преобразование выборки величин r (коэффициент корреляции) с

тем, чтобы приблизить их к нормальному распределению) ко всем возможным измерениям

свойств. Тогда каждое свойство будет иметь среднее 0 и сигму 1 – это называется единичным

нормальным распределением, которое используется как эталон.

Существуют такие способы проверки на нормальность распределения как графический способ,

критерий асимметрии и эксцесса, критерий нормальности Колмогорова-Смирнова. Последний

способ проверки на нормальность распределения рассмотрен в видеокурсе по статистике

«Базовый уровень».