Анализ полных парных связей

Отчет по лабораторной работе

«Статистические методы исследований»

 

Исполнитель: Миронов А.А.

Специальность: 03.02.08– «Экология»

Преподаватель : проф. Пименов. В.И.

Санкт-Петербург


Введение

 

Целью статистического исследования зависимостей является построение математической модели объекта. Ее знание необходимо для прогнозирования поведения или свойств объекта

При построении статистических моделей объект рассматривается как «черный ящик», а реальные взаимосвязи аппроксимируются некоторыми зависимостями.

Входные переменные или признаки называют независимыми переменными, факторами.Выходные переменные характеризуют, например, физические и химические свойства производимого продукта или технико-экономические показатели процесса. Их называют зависимыми переменными или откликами. Случайные компоненты отражают влияние неучтенных на “входе” факторов, например, изменение характеристик оборудования вследствие износа, присутствие случайных примесей, а также случайные ошибки в измерении Y.

Конечной целью статистического исследования зависимостей является построение математической модели объекта

,

которое осуществляется по результатам n измерений входных и выходных переменных (Xi,Yi), i=1,..., n.

 

 

Задание №1. Первичная статистическая обработка: расчет выборочных характеристик, интервальная оценка параметров:

1) Привести названия выборочных характеристик на русском языке и их значения;

2) Привести графики гистограммы и эмпирической функции распределения для каждого из параметров X2 и Y;

3) Записать в математической форме 95%-е доверительные интервалы для математических ожиданий mx2, my(например, 73.67<mx2 <75.63) и стандартных отклонений sx2,sy;

4) По стандартизованным величинам асимметрии A и эксцесса E сделать предположения о виде законов распределения параметров X2, Y.

 

1. Расчет основных и дополнительных выборочных характеристик для параметровX2 и Y

 

В табл. 1 представлены исходные данные для статистической обработки.

 

Таблица 1 – Исходные данные (вариант №15)

X1 X2 Y

25 66,0585 9,00123199376

26 42,0645 8,33569368849

27 39,5099 7,72719036745

28 44,3478 8,5235277758

29 53,0357 8,77742131898

30 42,8061 8,7069923663

31 39,1771 8,41498032872

32 51,8017 9,44260712517

33 47,0298 8,90801474431

34 51,2993 9,11110558875

35 63,2825 9,944641313

36 57,7105 10,0191279286

37 63,2398 10,3956277183

38 53,7431 9,85547580822

39 55,9805 9,9345447396

40 42,3791 9,37107992877

41 37,2077 9,07062956999

42 53,9396 10,1549859105

43 49,4274 10,1206430538

44 48,4345 9,94833000755

45 63,8514 11,0708674878

46 45,8418 10,0476317995

47 37,0302 9,25618207697

48 46,7369 10,1621247391

49 39,4807 9,86962108036

50 47,8018 10,5404754453

51 45,3467 10,2176414974

52 47,0218 10,3268487612

53 43,5582 10,1974533169

54 46,6813 10,5390882191

55 51,5947 10,8024021996

56 35,8886 9,63179457429

57 42,2585 10,0588443074

58 52,1683 10,8834031989

59 54,3159 11,1431298845

60 50,2236 11,1672965903

61 52,9705 11,4804739453

62 53,4466 11,4535931696

63 43,9447 10,6270501066

64 59,1381 12,0494980357

65 57,303 12,0056316316

67 45,3918 10,9333924023

68 35,7222 10,4246166881

69 56,9479 11,9883181499

70 60,3098 12,1208607867

71 39,6918 10,8818226282

72 41,0465 11,2629718612

73 45,2616 11,1806934725

 

Проведем расчет основных и дополнительных выборочных характеристик для параметровX2 и Y.

Необходимые процедуры собраны в разделе Describe=>NumericData=>One-Variable Analysis. Выборочные точечные характеристики рассчитываются табличной процедурой Summary Statistics.

В табл.2 представлены результаты расчета точечных характеристик для параметров X2и Y

Таблица 2- .Результаты расчета точечных характеристик для параметровX2 и Y

 

  Х2 Y
Count Кол-во 48,0 48,0
Average Среднее 48,8219 10,1685
Variance Дисперсия 62,6234 1,10964
Standard deviation Стандартное отклонение 7,9135 1,05339
Minimum Минимальное значение 35,7222 7,72719
Maximum Максимальное значение 66,0585 12,1209
Range Размах значений 0,906348 -0,37558
Stnd. skewness Стандартизованная асимметрия -0,904617 -0,59267
Stnd. kurtosis Стандартизованный эксцесс 2343,45 488,088
Sum Сумма всех замеров переменной 48,0 48,0

 

2. Построить гистограммы и эмпирические функции распределения для параметров X2 и Y

Построение гистограммы для выбранной переменной осуществляется процедурой Frequency Histogram после выбора инструмента Graphics Options.

График Fn(x) эмпирической функции распределения строится установкой в том же контекстном меню режимов Relative, Cumulative и Poligon вместо заданного по умолчанию режима Histogram.

На рис. 1 представлены гистограммы распределения параметров X2 и Y.

На рис. 2 представлены эмпирические функции распределения параметров X2 и Y.

       
   
 

Рисунок 1. — Гистограммы распределения параметра X2 и Y

Рисунок 2. — Эмпирические функции распределения параметров X2 и Y

 

3. Для параметров X2 , Y построить в пакете Statgraphics 95%-ое доверительные интервалы: для математического ожидания и для стандартного отклонения

 

В табл.3 отображены значения доверительных интервалов для среднего значения и стандартного отклонения параметров X2 и Y.

 

Таблица 3 – значения доверительных интервалов для среднего значения и стандартного отклонения параметров X2 и Y.

 

  95%-е доверительные интервалы для среднего значения, m 95%-е доверительные интервалы для стандартного отклонения, s
X2 46,524m<51,1197 6,58774 s<9,91229
Y 9,86262m<10,4744 0,876917 s<1,31946

 

Вывод по результатам расчета для параметров X2 и Y.

В данной таблице приведены сводные статистические данные по параметрам X1, X2 и Y. Особый интерес здесь представляют стандартизованная асимметрия и стандартизованный эксцесс, которые могут быть использованы для определения закона распределения. В нашем случае значения этих статистических данных для параметров X1, X2 и Y лежат в пределах диапазона:

· Доверительный интервал для среднего значения x2 находится где-то между 46,524

и 51,1197, а для стандартного отклонения где-то между 6,58774 и 9,91229;

· Доверительный интервал для среднего значения y находится где-то между 9,86262 и 10,4744, а для стандартного отклонения где-то между 0,876917 и 1,31946.

Эти полученные данные указывают на нормальное распределение величин X2 и Y.

 

Задание №2. Расчет парных корреляций:

1) создать новые переменные типа x1x1, x1x2, x2x2;

2) выполнить анализ полных парных связей;

3) проанализировать коэффициенты корреляции для всех возможных пар переменных, содержащих Y.

 

Создание новых переменных

 

Для задания имени новой переменной нужно последовательно выделить заголовок пустого столбца и в контекстном меню (после щелчка правой клавишей мыши) выбрать Modify Column, после чего в поле Name ввести одно из указанных имен. Создание столбца со значениями новой переменной, которые вычисляются через выражение для ранее созданных переменных выполняются с помощью команды Generate Data из контекстного меню. Задать выражения вида x1*х1, x1*x2, x2*х2. В табл.4 представлены новые переменные для анализа.

 

Таблица 4 - Новые переменные для анализа

 

X1 X2 Y X1X1 X1X2 X2X2
66,0585 9,00123199376 1651,4625 4363,72542225
42,0645 8,33569368849 1093,677 1769,42216025
39,5099 7,72719036745 1066,7673 1561,03219801
44,3478 8,5235277758 1241,7384 1966,72736484
53,0357 8,77742131898 1538,0353 2812,78547449
42,8061 8,7069923663 1284,183 1832,36219721
39,1771 8,41498032872 1214,4901 1534,84516441
51,8017 9,44260712517 1657,6544 2683,41612289
47,0298 8,90801474431 1551,9834 2211,80208804
51,2993 9,11110558875 1744,1762 2631,61818049
63,2825 9,944641313 2214,8875 4004,67480625
57,7105 10,0191279286 2077,578 3330,50181025
63,2398 10,3956277183 2339,8726 3999,27230404
53,7431 9,85547580822 2042,2378 2888,32079761
55,9805 9,9345447396 2183,2395 3133,81638025
42,3791 9,37107992877 1695,164 1795,98811681
37,2077 9,07062956999 1525,5157 1384,41293929
53,9396 10,1549859105 2265,4632 2909,48044816
49,4274 10,1206430538 2125,3782 2443,06787076
48,4345 9,94833000755 2131,118 2345,90079025
63,8514 11,0708674878 2873,313 4077,00128196
45,8418 10,0476317995 2108,7228 2101,47062724
37,0302 9,25618207697 1740,4194 1371,23571204
46,7369 10,1621247391 2243,3712 2184,33782161
39,4807 9,86962108036 1934,5543 1558,72567249
47,8018 10,5404754453 2390,09 2285,01208324
45,3467 10,2176414974 2312,6817 2056,32320089
47,0218 10,3268487612 2445,1336 2211,04967524
43,5582 10,1974533169 2308,5846 1897,31678724
46,6813 10,5390882191 2520,7902 2179,14376969
51,5947 10,8024021996 2837,7085 2662,01306809
35,8886 9,63179457429 2009,7616 1287,99160996
42,2585 10,0588443074 2408,7345 1785,78082225
52,1683 10,8834031989 3025,7614 2721,53152489
54,3159 11,1431298845 3204,6381 2950,21699281
50,2236 11,1672965903 3013,416 2522,40999696
52,9705 11,4804739453 3231,2005 2805,87387025
53,4466 11,4535931696 3313,6892 2856,53905156
43,9447 10,6270501066 2768,5161 1931,13665809
59,1381 12,0494980357 3784,8384 3497,31487161
57,303 12,0056316316 3724,695 3283,633809
45,3918 10,9333924023 3041,2506 2060,41550724
35,7222 10,4246166881 2429,1096 1276,07557284
56,9479 11,9883181499 3929,4051 3243,06331441
60,3098 12,1208607867 4221,686 3637,27197604
39,6918 10,8818226282 2818,1178 1575,43898724
41,0465 11,2629718612 2955,348 1684,81516225
45,2616 11,1806934725 3304,0968 2048,61243456

 

Анализ полных парных связей

Матрица парных коэффициентов корреляции вычисляется в разделе Describe / Numeric Data / Multiple Variable Analysis, с помощью табличной процедуры Correlations. Ввести анализируемые векторы данных y, x1, x2, x1x1, x1x2, x2x2, соответствующие исследуемым переменным. Результаты анализа представлены в табл.5.

 

Таблица 5 – Результаты анализа полных парных связей

  y x1 x2 X1 X1 X2 X2 X1 X2
у ( r )   0,8593 0,3932 0,8377 0,3777 0,9791
у (n)  
у ()   0,0057 0,0081

 

Проанализировать коэффициенты корреляции для всех возможных пар переменных, содержащих y.

Входная переменная x1: r1( приaвыч =0 ) связь между переменными положительная (прямая, величины х1 и Y с точностью до случайных погрешностей одновременно возрастают или убывают). Для сочетаний y и x1, aвыч меньшие 0.05, означают возможную значимость соответствующих связей, т.е.связь положительная;

Входная переменная X1 X2: r1( при aвыч =0 ) связь между переменными положительная (прямая, величины X1 X2 и Y с точностью до случайных погрешностей одновременно возрастают или убывают); Для сочетаний y и X1 X2, aвыч меньшие 0.05, означают возможную значимость соответствующих связей.

Входная переменная X1 X1: r1( приaвыч =0 ) связь между переменными положительная (прямая, величины X1 X1 и Y с точностью до случайных погрешностей одновременно возрастают или убывают); Для сочетаний y и X1 X1, aвыч меньшие 0.05, означают возможную значимость соответствующих связей, т.е.связь положительная;

Входная переменная X2 X2: r1( приaвыч =0 ) связь между переменными положительная (прямая, величины X2 X2 и Y с точностью до случайных погрешностей одновременно возрастают или убывают); Для сочетаний y и X2 X2, aвыч меньшие 0.05, означают возможную значимость соответствующих связей, т.е.связь положительная;

Входная переменная x2: r1( приaвыч =0 ) связь между переменными положительная (прямая, величины х2 и Y с точностью до случайных погрешностей одновременно возрастают или убывают); Для сочетаний y и X2, aвыч меньшие 0.05, означают возможную значимость соответствующих связей, т.е.связь положительная;

 

Задание № 3. Многофакторный регрессионный анализ:

 

1) выполнить пошаговую регрессию;

2)выполнить дисперсионный анализ выбранной модели регрессии.