Основные статистические характеристики ИСД.

Отчет по лабораторным работам

по предмету «Методы и средства статистической обработки данных»

 

 

Выполнила: Галимова А.Р., гр. 4195

Проверил: Мокшин В.В.

 

Казань, 2013

 

Оглавление

1. Индивидуальное задание. 3

2. Планирование экспериментов. 4

2.1. Стратегическое планирование. 4

2.1.1. D - оптимальные планы.. 5

3. Основные статистические характеристики ИСД. 8

4. Оценка нормальности ИСД. 9

5. Временное прогнозирование. 13

6. Корреляционный анализ. 15

7. Кластерный анализ. 16

8. Факторный анализ. 22

9. Регрессионный анализ. 27

10. Дисперсионный анализ. 35

11. Оптимизация значений факторов и результативных показателей эффективности. 35

Выводы.. 36

Приложение. 37

 

 

 

Индивидуальное задание

BUF1 – на 3 места;

BUF2 − неограниченное количество мест;

GOT − экспоненциальный закон, среднее 20000 единиц времени;

VOSSТ −спец. эрл.закон, среднее в одной фазе 25 ед. вр., кол. фаз 3;

GT− равномерный закон, 225±25 единиц времени;

РК1 – экспоненциальный закон, среднее Х1=100 ед. времени;

РК2− нормальный закон, среднее Х2=90, ст. откл. 8 ед. вр.;

KAN1-KANМ– равномерный закон, 75±15 единиц времени;

Х3=М – количество каналов.

Выбор KANала для передачи по наименьшему количеству задач, по которым передана информация. Режим недоступности накладывается и снимается по KANалам независимо друг от друга.

Завершить моделирование после вывода из системы 300 задач (решённых плюс отказы).

Оптимизируемые факторы: Х1 – среднее время решения на ПК1, Х2 – среднее время решения на ПК2, Х3 – количество каналов. Х1 и Х2 менять на ±20% от указанных средних значений; Х3 от 2 до 6.

 

Построим модель в системе Arena

Рис.1 – Имитационная модель, построенная в системе моделирования Arena

 

Планирование экспериментов

 

Цель планирования – получить результаты с заданной достоверностью при наименьших затратах. Различают стратегическое и тактическое планирование.

Стратегическое планирование

 

Для стратегического планирования будем использовать концепцию «черного ящика», суть которого – абстрагирование от физической сущности процессов, происходящих в моделируемой системе и выдаче заключений о ее функционировании только на основании входных и выходных переменных. Входные, независимые переменные называются факторами. Выходные – откликами, их величина зависит от значений факторов и параметров ОИ.

Факторы в нашем случае – это показатели (параметры), которые мы будем оптимизировать; отклики – это результативные показатели эффективности функционирования моделируемой системы. Структурная схема чёрного ящика представлена на Рисунке 1.

 

 

 

Рис.1 Структурная схема концепции чёрного ящика

Планы второго порядка позволяют сформировать функцию отклика в виде полного квадратичного полинома, который содержит большее число членов, чем неполный квадратичный полином, сформированный по планам первого порядка, и поэтому требует большего числа выполняемых опытов. Полный квадратичный полином при m=3 имеет вид:

;

 

D - оптимальные планы

В D-оптимальных планах значения факторов не выходят за установленные границы диапазонов их изменения. Кроме того, они обладают еще одним существенным достоинством, обеспечивая минимальную ошибку во всем принятом диапазоне изменения факторов. На практике наиболее часто применяются планы Коно и планы Кифера.

 

Рис. 2 Геометрическая интерпретация трехфакторного плана Кифера на кубе

 

Стратегический план определяет количество вариантов системы, которые требуется промоделировать, и значения факторов в каждом варианте. Для 3-х оптимизируемых факторов предлагается D-оптимальный план по алгоритму Кифера, который состоит из 26 вариантов и представлен в Таблице 1.

 

Таблица 1 – План Кифера для 3-х факторного эксперимента

x1 x2 x3 x1 x2 x1 x3 x2 x3 x1 x2 x3 x4 x5 x6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

 

Здесь: ; ;

Вычисляем значения X1, X2, X3 по индивидуальному заданию. По условию индивидуального задания оптимизируемые факторы: Х1 – среднее время решения на ПК1, Х2 – среднее время решения на ПК2, Х3 – количество каналов. Х1 и Х2 менять на ±20% от указанных средних значений; Х3 от 2 до 6.

На PK1 условие экспоненциального закона, среднее 100 ед.времени, следовательно значение 0 - 100, 1-120, -1 -80 ( так как меняем на ±20% от указанного среднего значения.

РК2 подчиняется по условию задания нормальному закону и среднее значение 90 ед. времени и модификатором ±20 ед.времени, следовательно 0-90, 1 – 108, -1-72. Все данные заносим Таблицу 2.

 

Таблица 1 - Данные для факторов X1 , X2 , X3

  -1
х1
х2
х3

 

Y1–Коэффициент использования ПК1 (0÷1)*100%;

Y2- Коэффициент использования ПК2 (0÷1)*100%;

Y3–Среднее общее время выполнения задач.

D-оптимальный план по алгоритму Кифера для индивидуального задания и Отклики Y1 ,Y2 ,Y3 по факторам индивидуального задания, представлены в Таблице 3.

 

Таблица 2 - D-оптимальный план по алгоритму Кифера (для индивид.зад.)

x1 x2 x3 x1 x2 x1 x3 x2 x3 x1 x2 x3 x4 x5 x6

 

Таблица 4 - Отклики Y1 , Y2 ,Y3

Y1 Y2 Y3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

 

Основные статистические характеристики ИСД.

 

Основными статистическими характеристиками являются:

1. Valid N - объем выборки;

2. Mean- среднее арифметическое. Среднее значение случайной величины представляет собой наиболее типичное, наиболее вероятное ее значение, своеобразный центр, вокруг которого разбросаны все значения признака.

3. Median– медиана. Медианой является такое значение случайной величины,которое разделяет все случаи выборки на две равные почисленности части.

4. StandardDeviation- стандартное отклонение. Стандартное отклонение (или среднее квадратическое отклонение) является мерой изменчивости (вариации) признака. Оно показывает на какую величину в среднем отклоняются случаи от среднего значения признака.

5. Variance– дисперсия. Дисперсия является мерой изменчивости, вариации признака и представляет собой средний квадрат отклонений случаев от среднего значения признака. В отличии от других показателей вариации дисперсия может быть разложена на составные части, что позволяет тем самым оценить влияние различных факторов на вариацию признака.

6. Standard error of mean –стандартнаяошибкасреднего. Стандартная ошибка среднего - это величина, на которую отличается среднее значение выборки от среднего значения генеральной совокупности при условии, что распределение близко к нормальному.

7. 95% confidencelimitsofmean- 95%-ый доверительный интервал для среднего. Интервал, в который с вероятностью 0,95 попадает среднее значение признака генеральной совокупности.

8. Minimum, maximum- минимальное и максимальное значения.

9. Skewness–асимметрия. Асимметрия характеризует степень смещения вариационного ряда относительно среднего значения по величине и направлению.

10. Standard error of Skewness–стандартнаяошибкаасимметрии.

11. Kurtosis– эксцесс. Эксцесс характеризует степень концентрации случаев вокруг среднего значения и является своеобразной мерой крутости кривой.

12. Standard error of Kurtosis –стандартнаяошибкаэксцесса.

 

Таблица 5 - Результаты описательной статистики


Оценка нормальности ИСД.

Нормальный закон является наиболее употребительным. Он применяется для представления самых различных случайных процессов, таких, как продолжительность жизни людей, изменения экономических и технических показателей.

Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по формулам.

Функция плотности нормального закона имеет вид:

; . (1)

Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимаем критерий Колмогорова – Смирнова, используемый в пакете прикладных программ (ППП) Statistica 6.0.

;

; ,

где F*(vij) – эмпирическая функция распределения j-ой переменной для i-го значения;

F(vij) – гипотетическая функция распределения j-ой переменной для i-го значения;

dj – абсолютная величина разности между эмпирической и гипотетической функциями распределения.

Значения гипотетической функции распределения находятся по статистическим таблицам.

; ; .

Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, не меньше 0,20, то предположение о нормальности не отвергается. Если Рк<0,20, то предположение о нормальности рекомендуется отвергнуть.

Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.0 и Excel 2007 , на которые производится ориентация вычислений по излагаемому математическому аппарату. Представим распределение переменных на гистограммах (рис.3.-рис.8.).

На гистограммах наложена плотность нормального распределения, для проверки близости распределения к нормальному виду при помощи критерия Колмогорова-Смирнова.

 

 

Рис.3

 

Рис.4

 

Рис.5

 

Рис.6

 

Рис.7

 

Рис.8

Для анализа «нормальности» исходных статистических данных применен критерий согласия Колмогорова – Смирнова. Результаты представлены в таблице 6. Коэффициент доверия найден по статистическим таблицам.

 

Таблица 6 –Проверка нормальности

В 4 случаях из 10, что составляет 40%, ИСД соответствуют нормальному распределению по критерию Колмогорова-Смирнова. Из этого следует, что при увеличении количества учитываемых временных интервалов количество распределений, подчиненных нормальному закону, уменьшится.