Теория статистических выводов

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ.. 5

Глава 1. ОСНОВЫ ПОСТАНОВКИ ЭКСПЕРИМЕНТА.. 6

1.1 Общие сведения. 6

1.2 Теория статистических выводов. 10

1.3 Методы многомерного анализа. 12

1.4 Типы экспериментов. 13

1.5 Моделирование как основа эксперимента. Условия получения модели 15

1.6 Точность результатов эксперимента. 16

1.7 Обработка результатов экспериментов. Их достоверность. 17

1.8 Ошибки и гипотезы.. 19

1.9 Проверка статистических гипотез и критериев. 23

1.10 Выбор информативных параметров эксперимента. 27

1.11 Метод экспертных оценок для отбора факторов. 32

1.12 Разложение вариации. 36

Глава 2. МЕТОДЫ ПАССИВНОГО ЭКСПЕРИМЕНТА.. 37

2.1 Статистический анализ экспериментальных данных. 37

2.2 Дисперсионный анализ экспериментальных данных. 39

2.3 Корреляционный анализ экспериментальных данных. 46

2.4 Регрессионный анализ экспериментальных данных. 51

Глава 3. МЕТОДЫ АКТИВНОГО ЭКСПЕРИМЕНТА. ПЛАНИРОВАНИЕ 64

3.1 Основные положения планирования эксперимента. 64

3.2 Построение плана активного эксперимента. 66

3.3 Полный факторный эксперимент. 69

3.4 Свойства матрицы ПФЭ типа 2k 73

3.5 Дробный факторный эксперимент. 75

3.6 Определение коэффициентов регрессии. 79

3.7 Проверки. 80

3.7.1 Проверка воспроизводимости опытов. 80

3.7.2 Проверка значимости коэффициентов регрессии. 81

3.7.3 Проверка адекватности модели. 82

3.8 Построение математической модели для действительных значений факторов 83

3.9 Планы второго порядка. 83

3.9.1 Ортогональные ЦКП.. 85

3.9.2 Ротатабельные ЦКП.. 86

3.10 Другие разновидности планов эксперимента. 89

Литература.. 92

контрольные работы и методические указания по их выполнению... 94

Контрольная работа № 1. 94

Контрольная работа № 2. 107

Приложение.. 124

«…доброкачественность эксперимента

является необходимым условием как для

построения передовой теории, так и для

получения практических результатов».

П. Капица

 

ВВЕДЕНИЕ

 

Сложность конструкций современных электронных средств и технологических процессов их производства, в том числе комплектующих элементов (микросхем и других элементов), не позволяет на современном этапе развития науки, как правило, решать задачи разработки конструкций и их технологических процессов производства строгим математическим путём. Эти задачи осложняются ещё и тем, что многие объекты имеют вероятностный характер функционирования. Источниками появления таких объектов являются технология, а также новые требования, предъявляемые к объектам, усложнение условий их эксплуатации и т.п. При этом имеют место случайные факторы, которые создают трудности воспроизводства объектов, получения по ним достоверной информации и теоретических зависимостей.

Решение поставленных задач в случаях отсутствия или невозможности применения строгих математических методов требует обращения к эксперименту как единственному способу устранить некоторую неопределённость, свойственную нашим знаниям об объекте. Но нужно всегда иметь в виду, что эксперимент требует больших затрат времени и средств.

Необходимость проведения эксперимента хорошо понимали выдающиеся естествоиспытатели. Так, Г. Галилей впервые начал систематически применять экспериментальный метод для решения задач механики. Леонардо да Винчи писал: «Мне кажутся пусты и полны заблуждений те науки, которые не порождены опытом, отцом всякой достоверности, и не завершаются в наглядном опыте. Опыт никогда не ошибается, ошибаются ваши суждения, ожидая от него такого действия, которое не является следствием ваших экспериментов…».


Глава 1. ОСНОВЫ ПОСТАНОВКИ ЭКСПЕРИМЕНТА

 

Общие сведения

 

Проектирование сложных объектов электронной техники и технологических процессов в настоящее время не может быть успешным без проведения различного рода экспериментов. Причиной этого являются общие черты, присущие таким объектам:

1. Вероятностный характер объекта, которому сопутствует наличие неконтролируемых или трудно контролируемых случайных факторов. Такие факторы создают сложность воспроизводства объекта с некоторой статистической оценкой. Выходные параметры в таких случаях будут иметь рассеяние.

2. Неполнота информации об объекте, связанная:

а) с недостаточностью информации о показателях качества продукта, сырья, используемого в объекте;

б) с отсутствием или недостатком теоретических зависимостей для процесса производства.

Имеются два подхода к изучению подобных объектов:

1. Аналитический подход — попытка составить описание механизма явления на языке кинетики и т.п. Построение аналитических моделей сопряжено с проведением длительных исследований для выявления, например, природы физико-химических процессов, лежащих в основе технологических операций. Модели в этом случае, как правило, представляются в виде сложных систем уравнений (алгебраических, обыкновенных, дифференциальных, в частных производных). Они позволяют описать процессы в широких пределах факторного пространства, но распространения в производственных условиях не получили в силу ряда причин: частая смена изделий, необходимость обеспечения низкой стоимости и т.п.

2. Функциональный подход — отход от физики явлений и представление объекта в виде «чёрного ящика» с набором входных и выходных переменных. Изучение объекта сводится к получению описания поведения объекта в виде зависимости «вход — выход». Это статистические функциональные модели.

Опыт показывает, что статистические модели, формируемые в результате обработки экспериментальных данных, полученных, например, на конкретном технологическом оборудовании, являются наиболее экономичными. Кроме того, что более важно, они вполне достоверно отражают реальный технологический процесс в производственных условиях. Статистические модели имеют следующие преимущества:

1) простую структуру в виде полиномов;

2) построение моделей выполняется за сравнительно небольшое время и малыми средствами в производственных условиях;

3) расчёты элементарно реализуются на персональных ЭВМ.

Другого рода статистические модели — это различного рода распределения случайных величин, например выходных параметров и т.п.

Сейчас эти подходы пытаются объединить в единый физико-статистический подход: рассматривается физика явлений, а уточнение модели ведётся функциональным способом.

В обоих подходах в основе лежит эксперимент. Экспериментально (на физическом макете) при конструировании электронной аппаратуры проводится определение тепловых режимов, достаточности экранирования и т.п. Эксперимент в технологическом процессе позволяет оценить влияние на него различных факторов, определить оптимальные условия его протекания, найти его математическую модель и т.д.

Несмотря на огромный исторический период использования экспериментов, до сих пор нет установившегося определения термина «эксперимент». Все сходятся только в одном: происхождении от латинского experimentum, что в переводе означает «проба, опыт». Остановимся на следующем понятии. Эксперимент — это целенаправленное создание условий и их систематическое изменение, необходимое для изучения заданного объекта.

Эксперимент может проводиться на объекте или его модели. Для описания объекта исследования пользуются обычно кибернетической моделью «Чёрный ящик», в которой устанавливается связь между независимыми переменными на входе хi и зависимыми переменными на выходе yj системы (рис. 1.1):

 

 

Рисунок 1.1 — Кибернетическая модель объекта

 

Независимые переменные хi встречаются под названиями: факторы, входные параметры, входы и т.п. Они могут быть управляемыми, неуправляемыми, контролируемыми и неконтролируемыми.

Зависимые переменные yj встречаются под названиями: показатели качества, внешние параметры, выходные параметры, целевые функции, функционалы, параметры оптимизации, выходы и т.п.

В основе эксперимента лежит моделирование. Отношение между экспериментом и теоретической моделью двоякое. С одной стороны, эксперимент позволяет проверить и при необходимости уточнить модель, т.е. эксперимент является источником информации при моделировании. С другой стороны, модель диктует, какой именно эксперимент следует проводить, т.е. модель является источником информации при организации эксперимента [1].

Поэтому методологией эксперимента является теория подобия и моделирования. Она указывает, как ставить эксперимент и как обрабатывать его данные, чтобы получить результат не только достоверный в данном частном случае, но и распространяющийся на группу подобных явлений [2].

Эффективность любого эксперимента зависит от соотношения между его полезным эффектом и произведёнными затратами. Проведение эксперимента требует определённых затрат времени, сил и средств. Поэтому очень важными задачами становятся правильная постановка эксперимента, устранение слепого хаотического поиска требуемых результатов (метода так называемого «ползучего эмпиризма»), замена его научно обоснованной программой проведения экспериментального исследования, которая включает объективную оценку результатов эксперимента. Следует заметить, что результат любого эксперимента всегда связан с некоторой неопределённостью. Задача хорошей организации исследования заключается только в том, чтобы эту неопределённость минимизировать, но отнюдь не в том, чтобы её полностью устранить [19].

Таким образом, в целом проведение эксперимента состоит из двух важных этапов:

1. Организация и проведение непосредственно эксперимента: выбор измеряемых параметров, размер выборки, на которой проводится эксперимент, порядок проведения измерений, план эксперимента и т.п.

2. Обработка полученных экспериментальных данных.

В соответствии с этими этапами, теория эксперимента развивалась и развивается по двум направлениям. Одно из них можно назвать обработкой опытных данных и характеризовать как методику расчёта и построения достоверных характеристик на основе опытных данных, неизбежно имеющих погрешности, отражающиеся, в частности, в «разбросе» опытных точек. Другое направление, называемое теорией планирования эксперимента, можно определить как методику проведения наблюдений за явлением (пассивный эксперимент) и одновременно такую стимуляцию изучаемых явлений (активный эксперимент), которая позволила бы наиболее быстро, с меньшим числом опытов найти наиболее характерные зависимости или точки [2].

С появлением электронных вычислительных машин (ЭВМ) возникло понятие вычислительного эксперимента. Этот эксперимент предполагает исследование математической модели объекта или процесса на ЭВМ. Это, конечно, значительно повышает эффективность эксперимента: вычислительный эксперимент дешевле, быстрее, проще, легко управляем, в него можно без труда вмешиваться, в нём можно моделировать условия, которые невозможно создать в лаборатории. Но всё это возможно при одном единственном условии: наличие достоверной математической модели. Такая модель может быть построена на основе изученных физических закономерностей, а они могут быть выявлены только в опытах. В этом состоит существенный недостаток вычислительного эксперимента, и поэтому он никогда не вытеснит натурный эксперимент. Следовательно, необходимо их разумное сочетание.

 

Теория статистических выводов

 

Теория статистических выводов используется на этапе обработки экспериментальных данных. Она является разделом математической статистики, в которой изучаются методы анализа результатов эксперимента. Эта теория включает два крупных раздела:

1. Теория проверки статистических гипотез (критерии значимости).

2. Теория оценивания.

В первом разделе рассматриваются некоторые правила (критерии), которые позволяют принять или отклонить выдвигаемые гипотезы. Во втором разделе рассматриваются задачи вычисления оценок подбираемых моделей для экспериментальных данных и определения точности этих оценок.

К свойствам оценок параметров распределений (статистикам) предъявляются требования состоятельности, несмещённости и эффективности.

Состоятельность означает, что с ростом числа наблюдений (n ® ¥) оценка сходится по вероятности к самому истинному значению параметра q, т.е. её дисперсия должна стремиться к нулю. Свойство состоятельности можно записать следующим образом

при n ® ¥.

Несмещённость означает отсутствие систематических ошибок в наблюдаемых данных, оценка не должна преувеличивать или преуменьшать значение параметра. Следовательно, оценка истинного значения параметра q будет несмещённой, если её математическое ожидание совпадает с истинным значением . Свойство несмещённости в отличие от состоятельности является свойством оценки для выборки любого конечного объёма. Несмещённость оценки не предполагает её состоятельности, но если оценка состоятельная и имеет конечное среднее, то является асимптотически несмещённой. Т.е. её математическое ожидание по вероятности сходится к истинному значению.

Эффективность — найденная оценка должна быть наиболее точной, т.е. иметь наименьшую дисперсию среди всех возможных оценок, полученных по данной выборке другими способами.

Для решения задач обоих разделов применяются два метода:

1. Метод выборочных распределений.

2. Метод максимального правдоподобия.

Метод выборочных распределений (не определяя процедуру вычисления оценок подбираемых моделей) позволяет определить точность оценок и проверить гипотезы относительно истинных значений этих параметров, не отвечая на вопрос: как определять эти оценки?

Метод максимального правдоподобия задаёт процедуру вычисления точечных оценок параметров и позволяет проверять гипотезы об истинных параметрах.

Целью обработки наблюдений обычно является получение эффективной оценки. Эту оценку при обработке выборки конечного размера можно получить только для законов распределения специального вида, допускающих достаточные оценки. Однако для довольно широкого класса законов распределения существуют асимптотически эффективные оценки. В частности, оценки максимального правдоподобия являются, как правило, асимптотически эффективными.

В теории оценивания широко используется метод наименьших квадратов (МНК). Отличаясь по процедуре вычисления оценок, этот метод совпадает с методом максимального правдоподобия в случае нормального распределения наблюдений, т.е. он позволяет получить те же свойства оценок, что и метод максимального правдоподобия.

Сам по себе МНК не связан с какими-либо предположениями о распределении случайных ошибок e1,…, en. Он может применяться и тогда, когда мы не считаем эти ошибки случайными.

Если же случайные ошибки имеют нормальное распределение, то в этом случае:

– именно в гауссовской модели МНК обладает определёнными свойствами оптимальности;

– в гауссовской модели получаемые с помощью этого метода оценки неизвестных параметров обладают ясными статистическими свойствами.