Определение вида связи между исследуемыми параметрами

Практическое занятие 11.

Тема: Диаграмма разброса (Диаграмма рассеивания).

Цель работы:целью данной работы является приобретение навыков анализа результатов исследований с помощью диаграмм разброса и интерпретации диаграмм разброса.

Общие положения.

Параметры, характеризующие различные свойства объектов, могут быть независимыми или взаимосвязанными. Различают два вида зависимостей между параметрами (факторами): функциональные и корреляционные.

При функциональной зависимости двух величин значению одной из них обязательно соответствует одно или несколько значений другой величины. Иначе говоря, функциональная связь двух факторов возможна лишь при условии, что вторая величина зависит только от первой и не зависит ни от каких других величин.

Корреляционная зависимость возникает тогда, когда один из факторов зависит не только от второго, но и от ряда других случайных факторов или условий. Иллюстрацией подобного рода корреляционной связи может служить зависимость производительности труда рабочих от их стажа при воздействии таких дополнительных факторов, как образование, здоровье и т.д.

Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной зависимости. Они свидетельствуют лишь о том, что изменения одного признака, как правило, соответствуют определенному изменению другого. При этом неизвестно, находится ли причина изменений в одном из факторов (признаков) или она оказывается за пределами исследуемой пары признаков.

При наличии корреляционной зависимости причинный фактор оказывает очень большое влияние на исследуемую характеристику, поэтому, удерживая этот фактор под контролем, можно достичь стабильности характеристики. Корреляционная зависимость между отдельными параметрами значительно облегчает контроль процесса с технологической, временной и экономической точек зрения.

Одним из методов оценки вида и величины корреляционной зависимости является диаграмма разброса.

Предназначение диаграммы разброса - определение наличия или отсутствия зависимости между двумя видами данных, например, между показателями качества продукции и основными параметрами (показателями) производственного процесса.

Область применения - диаграмму разброса можно использовать на этапе "Анализ" для различных инструментов качества, например, диаграмма разброса может подтвердить причину, выявленную при помощи диаграммы Исикавы в процессе проектирования новой продукции.

Этапы построения диаграммы разброса:

1. Определить, между какими парами данных необходимо установить наличие и характер связи. Количество n пар данных для анализадолжно быть не менее 25 - 30 (n ≥ 25...30).

2. Для сбора данных разработать форму контрольного листка. По результатам наблюдения заполнить контрольный листок, при этом данные следует разделить на причинные факторы (их обозначают x) и следствия или характеристики (у).

3. Масштабы по осям координат выбираются по разности максимума и минимума переменных – длины осей должны быть примерно одинаковы. Вид графика зрительно должен приближаться к квадрату.

4. Нанести на график собранные данные, при совпадении точек следует это отметить, например, значками , □, ▲, или указать цифрой количество совпадений.

5. Привести необходимые сведения: название диаграммы разброса; интервал времени сбора данных; число пар данных n; названия параметров x, y и их единиц измерения и т.д. Данные, отраженные на диаграмме, должны быть понятны любому человеку, а не только тому, кто делал диаграмму.

6. Произвести анализ результатов.

Пример.

При изготовлении методом литья под давлением детали, имеющей очень тонкие стенки, столкнулись с фактом получения большого количества дефектных деталей. Было высказано предположение что, причина превышения допустимых отклонений толщины стенок от номинальных размеров заключается в изменениях давления сжатого воздуха в магистрали, которое каждый день меняется.

Таблица 1

Дата	Давление, кГс/см², x	Процент дефектов, у	Дата	Давление, кГс/см², x	Процент дефектов, у
	8,6	0,889		8,7	0,909
	8,9	0,884		9,4	0,905
	8,8	0,874		8,7	0,892
	8,8	0,891		8,5	0,877
	8,4	0,874		9,2	0,885
	8,7	0,886		8,5	0,866
	9,2	0,911		8,3	0,896
	8,6	0,912		8,7	0,896
	9,2	0,895		9,3	0,928
	8,7	0,896		8,9	0,886
	8,4	0,894		8,9	0,908
	8,2	0,864		8,3	0,881
	9,2	0,922

В таблице 1 представлены данные о давлении воздуха и о проценте дефектов, в которой переменная – давление сжатого воздуха – является причинным фактором и обозначена х, а переменная «процент дефектов» является следствием и обозначена у.

Для выбора шкал (масштабов) по осям координат из таблицы находим максимальные и минимальные значения параметров x (х_min = 8,2 и x_max = 9,4) и у (у_min = 0,864 и у_max = 0,968). При этом длину осей делают примерно равной друг другу и наносят деления шкал. Форма графика должна приближаться к квадрату. На графике, на оси абсцисс откладывают значения x, а на оси ординат – значения у (Рис. 1).

Рис. 1.

Далее на график наносятся собранные данные в порядке их получения. Каждую пару данных (x_i,y_i) отмечают точкой на координатной плоскости. Если на одну и ту же точку графика попадает два или три значения, то они обозначаются как точка в круге, или в двух кругах, или возле точки проставляется число данных, или рядом с нанесенной точкой сразу перед ней ставится еще одна, две точки и т.д.

После нанесения данных на графике указываются число данных, цель проведения работ, наименование изделия, название процесса, исполнитель, дата составления графика и т.д.

Пример оформления диаграммы разброса представлен на рисунке 2.

Объект измерения	Толщина стенки
Интервал времени
Число пар данных
Наименование изделия
Название процесса	Литье под давлением
Исполнитель
Дата составления графика
Способ формирования выборки
Метод измерения
Тип измерительного прибора	микрометр
Температура
Влажность
Имя оператора, проводившего измерения
Время измерения
Дополнительные сведения

Рисунок 2 – Диаграмма рассеяния для давления сжатого воздуха и процента дефектов.

Для тех же n пар данных можно установить аналитическую зависимость между x и y. Формула, выражающая эту зависимость, называется уравнением регрессии (или линией регрессии), и ее представляют в общем виде функцией

у = в₀ + в₁х,

где , в₀ = y - в₁x.

Вычисления по формулам дают следующие результаты

в₁ = 0.078379 / 2.7225 = 0,029,

в₀ = 0,89284 – 0,029 ∙8,764 = 0,64.

Корреляционное уравнение (линия регрессии) будет иметь вид:

у = 0,64 + 0,029х

Задав произвольные любые два значения х, определим у и построим корреляционную линию. Например:

х 8,2 9,4

у 0,878 0,913

Для указанных значений х и у на рисунке 3 показаны две точки, через которые проведена корреляционная прямая (линия регрессии).

Рис. 3.

Анализ диаграммы разброса

Форма полученной на рисунке диаграммы разброса позволяет сделать предварительные выводы о наличии или отсутствии корреляционной зависимости между двумя параметрами. О корреляционной зависимости можно говорить в том случае, когда разброс данных имеет линейную тенденцию. О характере поведения участков диаграммы разброса, на которую не попали точки, отражающие значения данных, ничего определенного сказать нельзя.

На диаграмме разброса следует выявить наличие "выбросов" и проверить их на "чужеродность" (можно использовать различные критерии, например, Граббса). Возможными причинами выбросов могут являться: ошибки измерения (записи); изменение условий работы.

Определение вида связи между исследуемыми параметрами.

Характер корреляционной зависимости, который определяется видом диаграммы разброса, дает представление о том, каким изменениям будет подвержен один из параметров при определенных изменениях другого. Так, при увеличении х на рисунке 4 у также будет увеличиваться (прямая корреляция). В этом случае при осуществлении контроля за причинным фактором х характеристика у будет оставаться стабильной.

Рис. 4 Прямая (положительная) корреляция – при увеличении х, величина у также увеличивается.

На рисунке 5 показан пример легкой прямой корреляции. При увеличении x увеличивается также и у, но разброс у велик по отношению к определенному значению x.

Рис. 5 Легкая прямая (положительная) корреляция – при увеличении х, параметр у также увеличивается, но для каждого значения х разброс параметра у довольно велик.

С помощью контроля причинного фактора x можно до некоторой степени держать под контролем характеристику у, но необходимо также иметь в виду и другие факторы, оказывающие влияние на у.

На рисунке 6 показан пример обратной (отрицательной) корреляции. При увеличении x характеристика у уменьшается. Если причинный фактор x находится под контролем, характеристика у остается стабильной.

Рис. 6 Обратная (отрицательная) корреляция – при увеличении х, величина у уменьшается.

Рисунок 7 отражает случай легкой обратной корреляции, когда при увеличении x характеристика у уменьшается, но при этом велик разброс значений параметра у, соответствующих фиксированному значению x.

Рис. 7 Легкая обратная (отрицательная) корреляция – при увеличении х, величина у уменьшается, но при этом велик разброс значений параметра у, соответствующих фиксированному значению x.

На рисунке 8 показан пример отсутствия корреляции, когда никакой выраженной зависимости между x и у не наблюдается. В этом случае необходимо продолжать поиск факторов, коррелирующих с параметром у, исключив из этого поиска фактор x.

Рис. 8 Отсутствие корреляции («облако»), между параметрами х и у зависимости не прослеживается.

Между параметрами x и у возможны также случаи криволинейной корреляции (рисунок 9).

Рис. 9 Диаграммы разброса с криволинейной корреляцией.

Если в случае криволинейной корреляции имеется возможность диаграмму разброса разделить на участки, имеющие прямолинейный характер, проводят такое разделение и исследуют каждый участок в отдельности.

Рис. 10 Разделение диаграммы разброса на участки, имеющие прямолинейный характер

На рисунках 10 б и 10 в показаны две части верхнего рисунка 10 а. При рассмотрении рисунка 10 б можно видеть, что на нем имеет место положительная корреляция, напротив, на рисунке 10 в имеет место отрицательная корреляция. Рисунки 11 и 12 повторяют рисунок 10 для других видов криволинейных корреляционных зависимостей.

Рис. 11 Рис. 12

На рисках 13 и 14 представлена диаграмма, на которой отражены данные сразу для двух показателей – параметра А и параметра В. Эти данные на диаграмме рассеяния (Рис.13) объединены и обезличены. Кажется, что никакой корреляционной зависимости нет, но стоит только разделить параметры и для каждого из них использовать свое обозначение и корреляция сразу проявляется.

Рис. 13 Рис. 14

При построении диаграммы рассеивания необходимо также строго следить за тем, чтобы длины осей диаграммы получились приблизительно одинаковыми, в противном случае, если шкалы выбраны плохо, это может привести к неправильной оценке информации.

Рис. 15

На рисунках 15 представлены диаграммы для одних и тех же данных, отличаются они тем, что на рисунке 15 б) вдвое сжата шкала измерений по горизонтальной оси по отношению к рисунку 15 а), а на рисунке 15 в) - вдвое сжата шкала по вертикальной оси. Распределение, показанное на рисунке 15 а), вполне можно интерпретировать как положительную корреляцию, что отнюдь не так ясно выражено на рисунках 15 б) и 15 в); при рассмотрении этих рисунков может даже показаться, что корреляции нет вообще. Таким образом, если шкалы выбраны плохо, это может привести к ошибочному мнению относительно изучаемого процесса.

Как видно из этих примеров, выявление того, есть корреляция или ее нет, в значительной степени зависит от размахов переменных, и совершенно не обязательно, что корреляция будет одинаковой при любых размахах. Поэтому крайне опасно сразу делать выводы по диаграмме рассеивания, а если это и делается, то требует либо проверки экспериментом, либо проведения подходящего технического исследования.

Далее ⇒