Определение типов и значений переменных

 

Имя Тип Ширина Метка Значения Пропуски Шкала
id Числовая Код сотрудника Нет Нет Количест.
gender Текстовая Пол сотрудника Ж-женский М-мужской Нет Номинал.
bdate Дата Дата рождения Нет Количест.
job Числовая Должность 0-пропущено 1-секретарь 2-среднее звено 3-менеджер Порядков.
salary Доллар Зарплата 0-пропущено Количест.
jobtime Числовая Время работы (месяцы) 0-пропущено Количест.

 


 

Лекция 15 (07.11)

 

Частотный анализ и относительная статистика

 

1. Меры средней тенденции:

• Среднее арифмитическое

• Медиана

• Квартили

• Сумма

• Мода

 

2. Меры разбросы:

• Размах

• Стандартное (среднее квадратическое отклонение)

 

Стандартна ошибка среднего (SE) - насколько значение среднего может варьироваться от выборки к выборке из одного распределения.

 

Считается различным значение средних, если SE меньше -2 или больше 2.

 

Доверительный интервал позволяет определить вероятность того, что истинное значение среднего находится в диапазоне x = ± 1.96 от стандартной ошибки.

 

Дисперсия – мера рассеяния, сумма квадратов отклонения значений среднего, делённая на число случаев минус 1.

 

3. Меры несимметричности распределения:

• Коэффициент асимметрии – мера асимметрии распределения; показывает, насколько симметричным является распределение. Варьируется от -3 до 3.

• Коэффициент вариации (эксцесс) – мера степени сгруппированности значений вокруг среднего. У нормального распределения – 0, положительные значения – сильная концентрация, более длинные хвосты, отрицательные значения – слабая концентрация, короткие хвосты.

 

Параметр – Оценка = Ошибка оценки.

 

Ошибкой оценки называют доверительный интервал.

 

Вывод описательных статистик определяется через пункт меню Анализ – Описательные статистики – Частоты.

 

Диалоговое окно Статистики позволяет вывести такие меры вариации, как доверительный интервал, медиана, мода, квартили, минимум, максимум и т.д.

 

Есть возможность выводить частотные таблицы.

Результаты анализа отображаются в окне Вывод, позволяющем сохранить результаты в отдельный файл.

 

Процентили:

25 - 24000$ - означает, что 25% опрошенных имеют зарплату меньше 24000$.

50 - 28875$ - от 25% до 50% получают от 24 до 28 тыс.

75 - 32162$ - от 50% до 75% получают от 28 до 32 тыс.

Диалоговое окно Частоты предоставляет возможность построения диаграмм. «Диаграмма» - выбор типа: столбиковая, круговая и т.д.

 

Кнопка «Формат» позволяет ранжировать значения по возрастанию/убыванию.

 

Диалоговое окно Частоты – Формат позволяет вывести данные по двум переменным по начальной заработной плате и в настоящее время.

 

Анализ – Описательные статистики – Описательные. Предоставляет возможность расчёта мер вариации, а также вывода переменных в алфавитном порядке.

 

Таблицы сопряжённости

 

Пункт меню Анализ – Описательные статистики – Таблицы сопряжённости.

Пункт Ячейки позволяет отобразить процент по строкам/столбцам.

 

Процент по строке интерпретирует построчное представление данных, то есть, например, относительно получающих данную зарплату.

Процент по столбцам – относительно групп респондентов (М/Ж).

 

Существует возможность создавать трёхмерные таблицы, использовать при этом поле Слои.

 


 

Лекция 16 (13.11)

 

Частотный анализ

 

Для определения количества используется функция СЧЁТЕСЛИ и задаётся соответствующий критерий.

 

Вывод 1: согласно полученным данным 35,7% респондентов очень счастливы, такое же количество респондентов счастливы. Чувствуют себя не слишком счастливыми 14,3%; 14,3% - не счастливы.

 

71,4% респондентов считают себя счастливыми. 85,7% респондентов считают себя вполне счастливыми.

 

Рекомендуемые статистические характеристики для переменных, относящихся к различным типам шкал.

 

Отношение переменных к шкале Статистические характеристики
Переменные, относящиеся к интервальной шкале и подчиняющиеся нормальному распределению Среднее арифметическое, стандартное отклонение, стандартная ошибка, коэффициент асимметрии, эксцесс, размах
Переменные, относящиеся к порядковой шкале и интервальным переменным, подчиняющимся нормальному распределению Медиана, квартили, наибольшее и наименьшее значение
Переменные, относящиеся к номинальной шкале Мода

 

75% счастливых людей имеют высокий доход.

 

Вывод 2: чем выше доход, тем счастливее люди.

Считают себя в принципе счастливыми людьми со средним и низким доходом по 40% соответственно. 100% респондентов, имеющих средний доход, считают себя не слишком счастливыми. 100% несчастных людей имеют низкий доход.


 

Лекция 17 (14.11)