Метод множественной корреляции
Цель работы
Применение метода множественной корреляции.
Теоретические сведения
Если необходимо исследовать корреляционную связь между многими величинами, то пользуются уравнениями множественной регрессии:
. (1.28)
Здесь мы имеем дело уже не с линией регрессии, а с поверхностью регрессии при k=2и с гиперповерхностью при k>2. В общем случае, как указывалось выше, эту поверхность называют поверхностью отклика.
Исходный статистический материал представляют в виде табл. 1.2.
Таблица 1.2
№ опыта | X1 | X2 | X3 | ……… | X | Y |
. . . N | X11 X12 X13 . . . X1N | X21 X22 X23 . . . X2N | X31 X32 X33 . . . X3N | Xk1 Xk2 Xk3 . . . XkN | Y1 Y2 Y3 . . . YN |
Перейдем от натурального масштаба к новому, проведя нормировку всех значений случайных величин по формулам:
; ; , (1.29)
где yi0, x1i0, x2i0 – нормированные значения соответствующих факторов,
- средние значения факторов,
sy, sx1, sx2 – среднеквадратичные отклонения.
; ; .
В таблице 1.3 приведен исходный статистический материал в новом масштабе.
Таблица 1.3
№ опыта | ………….. | ||||
. . . N | X011 X012 X013 . . . X01N | X021 X022 X023 . . . X02N | X031 X032 X033 . . . X03N | Y01 Y02 Y03 . . . Y0N |
В новом масштабе имеем:
; . (1.30)
Выборочный коэффициент корреляции при этом равен
(1.31)
Уравнение регрессии между нормированными переменными не имеет свободного члена и принимает вид:
. (1.32)
Коэффициенты уравнения (1.32) находятся из условия:
.
Условия минимума функции S определяются так же, как в случае зависимости от одной переменной:
; … (1.33)
и система нормальных уравнений имеет вид:
. (1.34)
Умножим левую и правую части уравнений на . В результате при каждом коэффициенте получается, согласно (1.34), выборочный коэффициент корреляции r*. Принимая во внимание, получаем систему нормальных уравнений:
(1.35)
Следует иметь в виду, что . Коэффициенты корреляции легко вычисляются простым перемножением соответствующих столбцов таблицы 1.3.
Решив систему (1.35), рассчитывают коэффициент множественной корреляции R:
. (1.36)
Коэффициент множественной корреляции служит показателем силы связи в случае множественной регрессии:
В случае выборок небольшого объема в величину R необходимо внести коррекцию на систематическую ошибку. Чем меньше число степеней свободы выборки , тем сильнее преувеличивается сила связи, оцениваемая коэффициентом корреляции. Формула для коррекции:
, (1.37)
где R’ – скорректированное значение коэффициента множественной корреляции; l – число коэффициентов уравнения регрессии.
Для практического использования уравнения (1.32) необходимо перейти к натуральному масштабу по формулам:
. (1.38)
Задание
По итогам пассивного эксперимента получен следующий статистический материал (табл. 1.4).
Необходимо установить зависимости выходной величины от входных, используя метод множественной корреляции (данные – из таблицы 1.4 и приложения 2).
Таблица 1.4а
№ | Состав питания, кг/ч | Расход флегмы, кг/ч | ||||||
Этан | Пропан | Изобутан | Бутан | Изопентан | Пентан | Гексан | ||
163.5 | 3620.8 | 9654.5 | 14344.8 | 5660.7 | 6261.3 | 1950.6 | 18306.0 | |
90.0 | 3361.4 | 6942.0 | 14195.4 | 4780.0 | 4790.6 | 3758.6 | 19451.0 | |
117.0 | 7593.0 | 6557.0 | 12891.5 | 4455.5 | 3687.5 | 3955.5 | 22301.0 | |
97.4 | 5883.5 | 4235.0 | 12328.5 | 5425.5 | 4202.0 | 6239.5 | 17876.0 | |
59.0 | 2295.0 | 4142.5 | 8360.0 | 4217.5 | 4802.5 | 2637.5 | 11000.0 | |
228.5 | 6592.5 | 8132.5 | 16640.0 | 4010.0 | 3392.5 | 3185.0 | 22400.0 | |
75.5 | 3475.5 | 7815.0 | 15770.0 | 4395.0 | 5100.0 | 8695.0 | 17970.0 |
Таблица 1.4б
Температура верха колонны, [oC] | Температура сырья, [oC] | Температура низа колонны, [oC] | Расход сырья, [м3/час] | Дистиллят, [м3/час] | ||
Y | ||||||
Y | ||||||
Таблица 1.4в
№ | Температура нагреваемой нефти t вх пара, (0С) | Температура пара t вх, (0С) | Давление на входе в ТО рвх, (кгс/см2) | Температура нефти на выходе tг, ( 0С) |
7.9 | ||||
7.9 | ||||
7.7 | ||||
8.5 | ||||
8.5 | ||||
8.0 | ||||
8.0 | ||||
8.0 | ||||
8.0 | ||||
5.6 | ||||
5.6 | ||||
8.0 | ||||
8.0 | ||||
8.0 | ||||
5.1 |
Таблица 1.4г | ||||||
Расход флегмы | ||||||
7,8 | 0,5 | 9,5 | ||||
7,7 | 9,4 | |||||
7,8 | 0,3 | 9,8 | ||||
7,8 | 9,4 | |||||
7,8 | 0,2 | 9,6 | ||||
7,8 | 0,2 | 9,5 | ||||
7,8 | 0,2 | 9,5 | ||||
7,8 | 0,2 | 9,7 | ||||
0,2 | 10,1 | |||||
0,1 | ||||||
8,1 | 0,1 | 9,9 | ||||
7,8 | 0,1 | 9,6 | ||||
7,9 | 0,4 | 9,4 | ||||
7,6 | 0,5 | 9,3 | ||||
7,3 | 0,5 | 9,2 | ||||
7,6 | 0,2 | 9,2 | ||||
7,6 | 0,8 | 9,7 | ||||
7,9 | 0,6 | 9,8 | ||||
0,5 | 9,5 | |||||
0,4 |
Порядок выполнения работы
1. Ввод исходных данных.
2. Переход к новому масштабу.
3. Получение параметров уравнения регрессии по МНК.
4. Переход к натуральному масштабу.
5. Нахождение коэффициента множественной корреляции.
6. Оценка адекватности полученной зависимости.
7. Вывод результатов.
Пример
Исходные данные запишем в следующем виде:
Найдем средние значения факторов:
Найдем среднеквадратичные отклонения:
Перейдем от натурального масштаба к новому, проведя нормировку всех случайных величин по формулам:
, , , ,
В новом масштабе имеем:
Выборочный коэффициент корреляции при этом равен:
Влияние на выход оказывают Х2 и Х3, т.к. их выборочный коэффициент корреляции по абсолютному значению превышает 0,7.
Найдем коэффициенты для нормированного уравнения регрессии:
Найдем коэффициент множественной корреляции R:
Перейдем к натуральному масштабу по формулам:
Уравнение множественной регрессии имеет вид:
Лабораторная работа № 4
Методы планирования экспериментов
Цель работы
Изучение полного факторного эксперимента 2k.
Теоретические сведения
Оптимальный двухуровневый план (план 2k). В этом случае при планировании экспериментов условия опытов представляют собой фиксированное число значений уровней — для каждого фактора. Уровни факторов представляют собой в этом случае границы исследуемой области по данному технологическому параметру.
Пусть, например изучается влияние на выход продукта у трех факторов: температуры Т в диапазоне 100-200° С, давления Р=20-60 атм. и времени пребывания t=10-30 мин. Верхний уровень по температуре , нижний , , :
;
.
Для любого фактора имеем:
; (1.39)
. (1.40)
Точка с координатами ( ) носит название центра плана, иногда ее называют основным уровнем; — единица варьирования, или интервал варьирования по оси . От системы координат перейдем к новой безразмерной системе координат . Формула перехода (кодирования):
; . (1.41)
В безразмерной системе координат верхний уровень равен +1, нижний равен -1, координаты центра плана равны нулю и совпадают с началом координат. В нашей задаче k = 3. Число возможных комбинаций N из трех факторов на двух уровнях равно N = 2k = 23 = 8. Запишем план проведения экспериментов (матрицу планирования) в виде следующей таблицы 1.5.
Значения выхода у, полученные в результате реализации плана экспериментов, приведены в последнем столбце таблицы.
Запишем кодированную матрицу планирования 23 и результаты эксперимента, введя столбец так называемой фиктивной переменной .
Приведенная в таблице 1.6 матрица планирования обладает следующими свойствами:
; (1.42)
;
, (1.43)
где k — число независимых факторов; N — число опытов в матрице планирования.
Первое свойство (уравнение 1.42) — равенство нулю скалярных произведений всех вектор-столбцов — называется свойством ортогональности матрицы планирования. Благодаря этому свойству резко уменьшаются трудности, связанные с расчетом коэффициентов уравнения регрессии, так как матрица коэффициентов нормальных уравнений (Х*Х) становятся диагональной и ее диагональные элементы равны числу опытов в матрице планирования N. Диагональные элементы обратной матрицы (Х*Х)-1.
.
Таблица 1.5
Матрица планирования 23
Значения факторов в натуральном масштабе | Значения факторов в безразмерной системе координат | Выход | |||||
№ опыта | Z1 | Z2 | Z3 | X1 | X2 | Х3 | Y |
-1 +1 -1 +1 -1 +1 +1 +1 | -1 -1 +1 +1 -1 -1 +1 +1 | -1 -1 -1 -1 +1 +1 +1 +1 |
Таблица 1.6
Матрица планирования с фиктивной переменной
N | X0 | X1 | X2 | X3 | Y |
+1 +1 +1 +1 +1 +1 +1 +1 | -1 +1 -1 +1 -1 +1 -1 +1 | -1 -1 +1 +1 -1 -1 +1 +1 | -1 -1 -1 -1 +1 +1 +1 +1 | Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 |
Таким образом,
. (1.44)
Следовательно, любой коэффициент уравнения регрессии bj определяется скалярным произведением столбца y на соответствующий столбец xj, деленным на число опытов в матрице планирования N:
. (1.45)
Пользуясь планом, представленным в таблице 1.5, сначала вычислим коэффициенты регрессии линейного уравнения:
. (1.46)
Например, для определения коэффициента b1 при х1 необходимо получить сумму произведений:
Аналогично получим:
b0 = 18,5 b2 = -0,5 b3 = +3,5
Если в рассмотрение ввести более полное уравнение регрессии с коэффициентами взаимодействия:
. (1.47)
то для определения коэффициентов b12, b13, b23 (эффектов двойного взаимодействия) и b123 (эффекта тройного взаимодействия) необходимо расширить матрицу (таблица 1.7) следующим образом:
Таблица 1.7
№ | X0 | X1 | X2 | X3 | X12 | X13 | X23 | X123 | Y |
+1 +1 +1 +1 +1 +1 +1 +1 | -1 +1 -1 +1 -1 +1 -1 +1 | -1 -1 +1 +1 -1 -1 +1 +1 | -1 -1 -1 -1 +1 +1 +1 +1 | +1 -1 -1 +1 +1 -1 -1 +1 | +1 -1 +1 -1 -1 +1 -1 +1 | +1 +1 -1 -1 -1 -1 +1 +1 | -1 +1 +2 -1 +1 -1 -1 +1 |
Эффекты взаимодействия определяются аналогично линейным эффектам.
Задание
Необходимо установить зависимости выходной величины от входных. Проверить адекватность и достоверность полученных результатов.
Для получения уравнения регрессии проведен полный факторный эксперимент (табл. 1.8).
Таблица 1.8
№ опы-та | Количество изопентана, кг/ч | Количество пентана, кг/ч | Количество гексана, кг/ч | Флегмовое число | Тепловая нагрузка на кипятильник, кДж/ч |
6477,0 | 6936,0 | 26,40 | 18,0 | 38476547,9 | |
6477,0 | 6936,0 | 10185,0 | 21,0 | 44546006,0 | |
6477,0 | 10151,0 | 2640,0 | 25,0 | 52670991,5 | |
6477,0 | 10151,0 | 10185,0 | 27,0 | 56719158,0 | |
9183,5 | 6936,0 | 2640,0 | 11,0 | 24296811,9 | |
9183,5 | 6936,0 | 10185,0 | 13,0 | 26300916,3 | |
9183,5 | 10151,0 | 2640,0 | 14,5 | 31399481,9 | |
9183,5 | 10151,0 | 10185,0 | 15,5 | 33423869,8 |
Порядок выполнения работы
Данные табл. 1.8 представляют собой матрицу планирования 2k, необходимую для проведения ПФЭ.
1. Определение коэффициентов линейного уравнения регрессии. Требуется рассмотреть линейное уравнение множественной регрессии.
y = b0+b1x1+b2x2+b3x3+b4x4
2. Определение коэффициентов уравнения регрессии с учетом эффектов двойного взаимодействия. Требуется рассмотреть уравнение с коэффициентами двойного взаимодействия:
y = b0 + b1x1 + b2x2 + b3x3 + b4x4 + b12x1x2 + b13x1x3 + b14x1x2 +
+ b23x2x3 + +b24x2x4 + b34x3x4
3. Проверка адекватности уравнений.
4. Получение уравнения регрессии в натуральном масштабе.
5. Определение относительной погрешности уравнений регрессии.
С помощью выражений (1.41), (1.42) составляется кодированный план. Коэффициенты уравнений регрессии рассчитываются по формуле (1.45).
Т.к. отсутствуют параллельные опыты, то критерий Фишера определяется на основе выражения .
Если рассчитанное значение будет превышать табличное F (к1,к2) [приложение 1], т. е.
, , ,
то рассматриваемое уравнение адекватно.
Пример приведен в теоретических сведениях.
Отчет
Отчет по лабораторным работам 1-4 темы 1 должен содержать:
1. Исходные данные.
2. Краткие сведения из теории.
3. Расчеты в программе Mathcad.
4. Полученные графики в программе Mathcad.
5. Выводы.
Приложение 1
Значения критерия Фишера (F-критерия) для уровня значимости p = 0.05
f2 | f1 | |||||||||||||
18.51 | 19.00 | 19.16 | 19.25 | 19.30 | 19.33 | 19.35 | 19.37 | 19.38 | 19.40 | 19.41 | 19.42 | 19.43 | 19.44 | |
10.13 | 9.55 | 9.28 | 9.12 | 9.01 | 8.94 | 8.89 | 8.85 | 8.81 | 8.79 | 8.74 | 8.71 | 8.69 | 8.66 | |
7.71 | 6.94 | 6.59 | 6.39 | 6.26 | 6.16 | 6.09 | 6.04 | 6.00 | 5.96 | 5.91 | 5.87 | 5.84 | 5.80 | |
6.61 | 5.79 | 5.41 | 5.19 | 5.05 | 4.95 | 4.88 | 4.82 | 4.77 | 4.74 | 4.68 | 4.64 | 4.60 | 4.56 | |
5.99 | 5.14 | 4.76 | 4.53 | 4.39 | 4.28 | 4.21 | 4.15 | 4.10 | 4.06 | 4.00 | 3.96 | 3.92 | 3.87 | |
5.59 | 4.74 | 4.35 | 4.12 | 3.97 | 3.87 | 3.79 | 3.73 | 3.68 | 3.64 | 3.57 | 3.53 | 3.49 | 3.44 | |
5.32 | 4.46 | 4.07 | 3.84 | 3.69 | 3.58 | 3.50 | 3.44 | 3.39 | 3.35 | 3.28 | 3.24 | 3.20 | 3.15 | |
5.12 | 4.26 | 3.86 | 3.63 | 3.48 | 3.37 | 3.29 | 3.23 | 3.18 | 3.14 | 3.07 | 3.03 | 2.99 | 2.93 | |
4.96 | 4.10 | 3.71 | 3.48 | 3.33 | 3.22 | 3.14 | 3.07 | 3.02 | 2.98 | 2.91 | 2.86 | 2.83 | 2.77 | |
4.84 | 3.98 | 3.59 | 3.36 | 3.20 | 3.09 | 3.01 | 2.95 | 2.90 | 2.85 | 2.79 | 2.74 | 2.70 | 2.65 | |
4.75 | 3.89 | 3.49 | 3.26 | 3.11 | 3.00 | 2.91 | 2.85 | 2.80 | 2.75 | 2.69 | 2.64 | 2.60 | 2.54 | |
4.67 | 3.81 | 3.41 | 3.18 | 3.03 | 2.92 | 2.83 | 2.77 | 2.71 | 2.67 | 2.60 | 2.55 | 2.51 | 2.46 | |
4.60 | 3.74 | 3.34 | 3.11 | 2.96 | 2.85 | 2.76 | 2.70 | 2.65 | 2.60 | 2.53 | 2.48 | 2.44 | 2.39 | |
4.54 | 3.68 | 3.29 | 3.06 | 2.90 | 2.79 | 2.71 | 2.64 | 2.59 | 2.54 | 2.48 | 2.42 | 2.38 | 2.33 | |
4.49 | 3.63 | 3.24 | 3.01 | 2.85 | 2.74 | 2.66 | 2.59 | 2.54 | 2.49 | 2.42 | 2.37 | 2.33 | 2.28 | |
4.45 | 3.59 | 3.20 | 2.96 | 2.81 | 2.70 | 2.61 | 2.55 | 2.49 | 2.45 | 2.38 | 2.33 | 2.29 | 2.23 | |
4.41 | 3.55 | 3.16 | 2.93 | 2.77 | 2.66 | 2.58 | 2.51 | 2.46 | 2.41 | 2.34 | 2.29 | 2.25 | 2.19 | |
4.38 | 3.52 | 3.13 | 2.90 | 2.74 | 2.63 | 2.54 | 2.48 | 2.42 | 2.38 | 2.31 | 2.26 | 2.21 | 2.15 | |
4.35 | 3.49 | 3.10 | 2.87 | 2.71 | 2.60 | 2.51 | 2.45 | 2.39 | 2.35 | 2.28 | 2.22 | 2.18 | 2.12 | |
4.32 | 3.47 | 3.07 | 2.84 | 2.68 | 2.57 | 2.49 | 2.42 | 2.37 | 2.32 | 2.25 | 2.20 | 2.16 | 2.10 | |
4.30 | 3.44 | 3.05 | 2.82 | 2.66 | 2.55 | 2.46 | 2.40 | 2.34 | 2.30 | 2.23 | 2.17 | 2.13 | 2.07 | |
4.28 | 3.42 | 3.03 | 2.80 | 2.64 | 2.53 | 2.44 | 2.37 | 2.32 | 2.27 | 2.20 | 2.15 | 2.11 | 2.05 | |
4.26 | 3.40 | 3.01 | 2.78 | 2.62 | 2.51 | 2.42 | 2.36 | 2.30 | 2.25 | 2.18 | 2.13 | 2.09 | 2.03 | |
4.24 | 3.39 | 2.99 | 2.76 | 2.60 | 2.49 | 2.40 | 2.34 | 2.28 | 2.24 | 2.16 | 2.11 | 2.07 | 2.01 |
Значения критерия Фишера (F-критерия) для уровня значимости p = 0.01
f2 | f1 | |||||||||||||
98.50 | 99.00 | 99.17 | 99.25 | 99.30 | 99.33 | 99.36 | 99.37 | 99.39 | 99.40 | 99.42 | 99.43 | 99.44 | 99.45 | |
34.12 | 30.82 | 29.46 | 28.71 | 28.24 | 27.91 | 27.67 | 27.49 | 27.34 | 27.23 | 27.05 | 26.92 | 26.83 | 26.69 | |
21.20 | 18.00 | 16.69 | 15.98 | 15.52 | 15.21 | 14.98 | 14.80 | 14.66 | 14.55 | 14.37 | 14.25 | 14.15 | 14.02 | |
16.26 | 13.27 | 12.06 | 11.39 | 10.97 | 10.67 | 10.46 | 10.29 | 10.16 | 10.05 | 9.89 | 9.77 | 9.68 | 9.55 | |
13.74 | 10.92 | 9.78 | 9.15 | 8.75 | 8.47 | 8.26 | 8.10 | 7.98 | 7.87 | 7.72 | 7.60 | 7.52 | 7.39 | |
12.25 | 9.55 | 8.45 | 7.85 | 7.46 | 7.19 | 7.00 | 6.84 | 6.72 | 7.62 | 6.47 | 6.36 | 6.27 | 6.16 | |
11.26 | 8.65 | 7.59 | 7.01 | 6.63 | 6.37 | 6.18 | 6.03 | 5.91 | 5.81 | 5.67 | 5.56 | 5.48 | 5.36 | |
10.56 | 8.02 | 6.99 | 6.42 | 6.06 | 5.80 | 5.61 | 5.47 | 5.35 | 5.26 | 5.11 | 5.00 | 4.92 | 4.81 | |
10.04 | 7.56 | 6.55 | 5.99 | 5.64 | 5.39 | 5.20 | 5.06 | 4.94 | 4.85 | 4.71 | 4.60 | 4.52 | 4.41 | |
9.65 | 7.21 | 6.22 | 5.67 | 5.32 | 5.07 | 4.89 | 4.74 | 4.68 | 4.54 | 4.40 | 4.29 | 4.21 | 4.10 | |
9.33 | 6.93 | 5.95 | 5.41 | 5.06 | 4.82 | 4.64 | 4.50 | 4.39 | 4.30 | 4.22 | 4.05 | 3.97 | 3.86 | |
9.07 | 6.70 | 5.74 | 5.21 | 4.86 | 4.62 | 4.44 | 4.30 | 4.19 | 4.10 | 3.96 | 3.86 | 3.78 | 3.66 | |
8.86 | 6.51 | 5.56 | 5.04 | 4.70 | 4.46 | 4.28 | 4.14 | 4.03 | 3.94 | 3.80 | 3.70 | 3.62 | 3.51 | |
8.68 | 6.36 | 5.42 | 4.89 | 4.56 | 4.32 | 4.14 | 4.00 | 3.89 | 3.80 | 3.67 | 3.56 | 3.49 | 3.37 | |
8.53 | 6.23 | 5.29 | 4.77 | 4.44 | 4.20 | 4.03 | 3.89 | 3.78 | 3.69 | 3.55 | 3.45 | 3.37 | 3.26 | |
8.40 | 6.11 | 5.18 | 4.67 | 4.34 | 4.10 | 3.93 | 3.79 | 3.68 | 3.59 | 3.46 | 3.35 | 3.27 | 3.16 | |
8.29 | 6.01 | 5.09 | 4.58 | 4.05 | 4.01 | 3.84 | 3.71 | 3.60 | 3.51 | 3.37 | 3.27 | 3.19 | 3.08 | |
8.18 | 5.93 | 5.01 | 4.50 | 4.17 | 3.94 | 3.77 | 3.63 | 3.52 | 3.43 | 3.30 | 3.19 | 3.12 | 3.00 | |
8.10 | 5.85 | 4.94 | 4.43 | 4.10 | 3.87 | 3.70 | 3.56 | 3.46 | 3.37 | 3.23 | 3.13 | 3.05 | 2.94 | |
8.02 | 5.78 | 4.87 | 4.37 | 4.04 | 3.81 | 3.64 | 3.51 | 3.40 | 3.31 | 3.17 | 3.07 | 2.99 | 2.88 | |
7.95 | 5.72 | 4.82 | 4.81 | 3.99 | 3.76 | 3.59 | 3.45 | 3.35 | 3.26 | 3.12 | 3.02 | 2.94 | 2.83 | |
7.88 | 5.66 | 4.76 | 4.26 | 3.94 | 3.71 | 3.54 | 3.41 | 3.30 | 3.21 | 3.07 | 2.97 | 2.89 | 2.78 | |
7.82 | 5.61 | 4.72 | 4.22 | 3.90 | 3.67 | 3.50 | 3.36 | 3.26 | 3.17 | 3.03 | 2.93 | 2.85 | 2.74 | |
7.77 | 5.57 | 4.68 | 4.18 | 3.86 | 3.63 | 3.46 | 3.32 | 3.22 | 3.13 | 2.99 | 2.89 | 2.81 | 2.70 |