Основные требования к организации решения задач

Решения задач по моделированию проводится с целью:

¾ развить у студентов практические навыки в решении задач МИР;

¾ закрепить теоретические сведения, полученные в рамках лекционного (теоретического) курса.

Для успешного решения задач студенты должны иметь теоретическое представление о моделировании ИР. Решение задач базируется также на предшествующих знаниях студентов, полученных в ходе усвоения дисциплин учебного плана, в частности информатики, математики, теории вероятностей и математической статистики и др.

Выполнение каждой лабораторной проводится по заданию и может быть выполнено в двух вариантах:

¾ на практических занятиях в компьютерном классе под руководством преподавателя;

¾ самостоятельно в компьютерном классе, когда присутствие студента на занятии под руководством преподавателя было невозможным (болезнь, командировка)

В первом варианте план решения задач содержит следующие этапы.

1. Преподаватель формулирует задачи моделирования ИР на данное занятие, в том числе объявляет тему задачи моделирования, цель, методику и основные этапы работы; определяет форму конечного результата и порядок его приема; уточняет особенности решения задачи, указывает, на что следует обратить особое внимание при решении задачи. При необходимости формулируются особые требования к отчету и условия его предъявления и получения оценки по результатам решения каждой задачи.

2. Когда задача сформулирована, студенты могут задать преподавателю уточняющие вопросы по постановке задачи и организации ее решения, включат компьютер и приступают к работе.

3. В ходе решения задачи преподаватель контролирует работу студентов и при необходимости дает пояснения по тем или иным вопросам решения задачи.

4. Проведя полный объем работ по решению задачи, студенты составляют отчет и проверяют его качество. Если в отчете замечены несоответствия установленным требованиям или другие дефекты, студенты устраняют их и предъявляют преподавателю для контроля. При необходимости отчет может быть распечатан на принтере.

5. Преподаватель проверяет отчет; при наличии ошибок сообщает о них студенту и о методике их исправления. Если ошибки отсутствуют, преподаватель при необходимости может задать студенту вопросы по содержанию решенной задачи и составит оценку по решенной задаче.

6. Получив оценку, студент сохраняет свой отчет в соответствующей именной папке на жестком диске компьютера.

Во втором варианте план решения задачи по каждой теме - 4 академических часа. За это время студент должен проанализировать текст лабораторной работы, обращаясь к преподавателю за дополнительными пояснениями и уточнениями в случае необходимости, практически выполнить работу в той последовательности, в какой она изложена в описании соответствующей задачи. Выполнив полный объем работ по решению задачи, студент проверяет правильность результатов и предъявляет преподавателю результаты работы, выведенные на дисплей. Если замечены ошибки, студент принимает меры по их исправлению и затем снова предъявляет результаты преподавателю для контроля и приема результатов работы. Если в работе не содержится ошибок, студент составляет и оформляет отчет о лабораторной работе.

Отчет по решению каждой задачи имеет следующую структуру:

1. Наименование идентифицирующих признаков: «Отчет о решении задачи №_ по теме (наименование темы)» студента «(указываются фамилия и инициалы, вид обучения, специальность, курс, группа)».

2. Цель решения задачи – формулируется в соответствии с содержанием раздела «Цель решения задачи» соответствующей задачи.

3. Методика решения задачи – определяется в соответствии с указанной формулировкой в описании задачи и при необходимости уточняется у преподавателя в зависимости от содержания конкретной задачи.

4. Этапы решения задачи – номера и наименования этапов решения конкретной задачи в отчете, указанными в описании задачи. Содержание и порядок выполнения этапов изложены ниже.

5. Формулирование выводов – по каждому решению задачи должны быть сформулированы выводы и приведены в конце отчета.

Текст отчета излагается лаконично и вместе с тем информативно с соблюдением правил грамматики русского языка. Текст отчета о лабораторной работе набирается в редакторе Word через Times New Roman. Заголовки разделов и подразделов выделяются полужирным шрифтом. Оформленный отчет предъявляется преподавателю в экранной форме. При наличии ошибок в отчете студент их исправляет и предъявляет преподавателю повторно. В отсутствие ошибок отчет принимается и сохраняется на жестком диске.

Во втором варианте результаты решения задачи студент предъявляет преподавателю для контроля и получения оценки в виде распечатки отчета. Если в отчете и ответах на контрольные вопросы преподавателем замечены дефекты, студент в последующем принимает меры по их исправлению и повторно предъявляет отчет преподавателю.

Отчет по каждой лабораторной работе студент сохраняет в виде отдельного файла и обязан предоставить его по требованию преподавателя для контроля в период обучения. В имени файла указываются фамилия студента и номер выполненной лабораторной работы. Этот файл сохраняется в папке студенческой группы, которая создается на первом лабораторном занятии. В имени папки группы должен присутствовать индекс группы. Папка группы включается в папку «Мои документы»

Методика решения задач. При рении каждой задачи выполняются общие и специфические условия. Общие условия определяются основными требованиями к решению задачи, изложенными в настоящем параграфе, а специфические требования указаны в описании решений конкретных задач моделирования ИР, данных в лабораторных. Основной теоретической базой для решения задач является содержание лекций, которое студенты должны хорошо знать и применять в практическом решении задач. Кроме того, они должны знать дополнительную литературу, на которую в тексте описания задач даются ссылки.

Непременным условием решения любой задачи является осознание цели моделирования и ее формулирование. Формулировки цели приводятся в описании каждой задачи. Вместе с тем преподаватель или студент (по согласованию с преподавателем) может при соответствующих условиях изменить формулировку цели в моделировании ИР.

Описание решения задач выполнено на базе пакета прикладного статистического анализа «Универсальная статистическая диалоговая система “STADIA 7.0”» (далее STADIA), который подробно представлен в [2]. Следует учитывать, что при исследовании в решении задач бесплатной демоверсии пакета STADIA (такое возможно, см.: сайт Научно-производственного объединения «Информатика и компьютеры» www.statsoft.msu.ru) при выходе из программы данные не сохраняются.

Состав и последовательность решения задач обусловлены сущностью теории МИР, методикой вычислительного (машинного) эксперимента. Поэтому задачи целесообразно решать в той последовательности, в которой они приводятся. Например, в описании решения задачи «Анализ основных параметров качеств функционального стояния автоматизированной информационной системы» приводится полное описание интерфейса, применяемого в задаче. В описании последующих задач с целью исключения дублирования описания по некоторым командам и операциям опускаются.

Определив методы решения задачи, приступают к выполнению этапов моделирования. Как правило, процесс моделирования состоит из двух основных этапов – анализа ИР в его широком понимании и последующего синтеза модели ИР.

Аналитические этапы в основном направлены на изучение, познание моделируемого объекта с позиций системного анализа. Необходимо четко установить системообразующие признаки моделируемого ИР, в частности цель, задачи, функции, структуру, технологию проектирования, построения, функционирования ИР, правила, нормы, критерии и оценку его качества и др. Анализ структуры предполагает установление взаимосвязи и взаимодействия структурных компонентов между собой.

Синтез базируется на результатах анализа и предполагает соединение, построение, компоновку элементов модели ИР по определенным правилам. Наиболее продуктивным считается структурно-параметрический синтез, предполагающий последовательную реализацию таких компонентов, как идентификация, спецификация, имитация и собственно синтез модели ИР.

При выполнении работы не следует нарушать состав, последовательность и наименования этапов, указанные в тексте задачи. На каждом этапе приводится характеристика выполненных работ, направленных на достижение цели МИР и сопровождаемых иллюстративным материалом – таблицами, рисунками (графиками), полученными по ходу решения задачи. Иллюстративный материал выполняется в соответствии с правилами, приятными для публикаций. Каждая таблица и рисунок должны иметь номер и наименование. В каждом отчете таблицы и рисунки обозначаются соответственно сквозными номерами. Номер и наименование таблицы указываются над таблицей, а у рисунка – под рисунком.

По завершении этапов решения задачи необходимо сделать выводы. Это – наиболее сложная и трудная часть решения задач моделирования не только относительно ИР, но и любых реальных объектов. Наиболее распространенной ошибкой является подмена выводов сведениями о том, что выполнено в процессе решения задачи, например: «проведен анализ информационной системы…» и т.д. Подобные фразы не относятся к категории «Выводы», это просто перечисленные наименований выполненных этапов, работ, но они уже были в тексте и их не нужно дублировать. Вывод по результатам решения задачи МИР – это разновидность умозаключения, которое в явном виде не присутствует в описании решения задачи, формулируется на основе процессов анализа и синтеза решения задачи и содержит то новое знание в данной области, которое составляет потенциальную ценность для последующей рационализации решения задач моделирования ИР.

Выводы, как правило, носят теоретический и практический характер, они могут отображать вопросы анализа и синтеза, построения функционирования модели ИР или ее компонента. Может быть сделан вывод о месте и значении модели в создании и эксплуатации ИР. По каждому этапу формулируется хотя бы один вывод.

 

Лабораторная работа №1. «Анализ основных параметров качества АИС»

Постановка задачи. Основной целью решению задачи является получение практических навыков в моделировании процесса изучения существенных характеристик функционального состояния исследуемой АИС как наиболее распространенного класса ИР, а также закрепления теоретических значений, полученных в лекционном курсе.

Решение задачи базируется на применении средств системного анализа, теории вероятностей и математической статистики. Работа состоит в том, чтобы на основе собранного статистического материала выполнить анализ функционального состояния АИС программными средствами диалоговой системы STADIA. На основе анализа вырабатываются стратегия и тактика рационализации функционирования АИС.

В ходе исследования реально функционирующей АИС методом прямого наблюдения обнаружены и зафиксированы в «Ведомости дефектов» ошибки по достоверности документной информации, допущенные на различных этапах технологии АИС. Дефекты по достоверности могут иметь различные модификации, например замена истинного символа (символов) на другой (ошибочный), транспозиция («наползание») цифр показателя, пропуск реквизита–основания показателя, сбой программы, откат компьютера и др.

В технологии АИС обнаружение и исправление дефектов, в частности по достоверности, снижает эффективность использования временных, финансовых, трудовых и иных ресурсов. Это отрицательно влияет на качество АИС, например, на ее выходные характеристики – производительность АИС, себестоимость обработки документов и др.

В данном примере выборка дефектов по достоверности представлена во временной шкале измерения – в минутах. В каждый дефект как случайное событие представлен количеством минут, затраченных на обнаружение и исправление дефекта по достоверности. Исходные статистические данные идентифицируем как переменную х1, состоящую из 30 значений: 3, 1, 5, 2, 4, 6, 1, 4, 2, 5, 6, 4, 6, 45, 2, 4, 3, 7, 5, 4, 6, 4, 3, 5, 4, 5, 3, 5, 4, 3.

Основные этапы решения. Решение данной задачи состоит из нескольких этапов:

1. Ввод статистических экспериментальных данных. В нашем случае применяется ППСА STADIA. Ввод данных производится посредством набора на клавиатуре экспериментальных данных, указанных выше, в форме электронной таблицы или матрицы данных. Данные по каждой переменной записываются в соответствующий вектор-столбец матрицы (в нашем примере в столбец х1 электронной таблицы (рис.1.1)).

Рис. 1.1 Ввод исходных данных

2. Получение описательной статистики основных параметров АИС по достоверности. Для расчета значений описательной статистики щелкнуть мышкой по меню «Статистика». В появившемся подокне «Статистические методы» в подменю «Параметрические тесты» щелкнуть мышкой по опции «Описательная статистика» (рис. 1.2) появится подокно «Анализ переменных».

Рис. 1.2 Структура подокна «Статистические методы»

Из субполя «Переменные» переменную х1 необходимо переслать в субполе «Для анализа». Для этого сначала нужно выделить переменную х1, щелкнув по ней однократно левой клавишей мышки, а затем щелкнуть левой клавишей по кнопке Стрелка вправо и поместить переменную х1 в субполе «Для анализа».

Чтобы устранить повторы в операционном решении последующих задач, в частности числа рисунков, дадим некоторые пояснения по интерфейсу. В данном подокне кнопки Стрелка влево и Стрелка вправо служат для пересылки переменных из одного субполя в другое. Нажатие кнопки «Все» реализует команду по перемещению всех переменных в необходимое субполе. Для вычисления и вывода статистических оценок необходимо кликнуть кнопку Утвердить, после чего получим результат расчета по переменной х1 (рис. 1.3). Под рубрикой «ОПИСАТЕЛЬНАЯ СТАТИСТИКА. Файл» приведены краткие данные, которые в нашей задаче следует понимать так: Переменная – х1, Размер [выборки] (число значений по переменной х1) – 30, Диапазон значений – от 1 до 45 мин., Среднее [выборочное значение] – 5,367 мин., Ошибка – 1,394, Дисперсия – 58, 31, Стандартное отклонение – 7,636, Сумма [всех значений данных переменной х1] – 161.

Рис. 1.3 Результаты расчета статистических оценок и дополнительной статистики

Если необходимо получить дополнительные статистические оценки, нужно кликнуть в подокне “Confirm” кнопку YES, в противном случае – кнопку NO. В нашей задаче после активизации кнопки YES получаем результаты с набором дополнительных статистических оценок по переменной х1 (рис. 1.3).

При необходимости записи оценок по параметрам «Среднее», «Стандартное отклонение» и «Сумма в матрицу данных», т.е. в электронную таблицу данных, нужно кликнуть в подокне “Confirm” кнопку YES, в противном случае – кнопку NO.

В рубрике «ОПИСАТЕЛЬНАЯ СТАТИСТИКА» в ходе исследования даются основные параметры, характеризующие собранные данные о дефектах по достоверности, в частности: выборочное среднее значение, разброс значений или стандартное отклонение, характеристики формы распределений значений – мода, медиана, асимметрия, эксцесс, квартили и т.д.

Результаты обработки данных представляются в виде соответствующих экранов – исходных данных, результатов вычислений и построенных графиков. Вызов и смена экранов выполняются щелчком мышки по соответствующей надписи (Dat, Rez) в нижней командной линейке экрана.

Приведем краткие определения и пояснения некоторых понятий описательной статистики. Полное описание и порядок вычисления значений оценок в ППСА STADIA изложены в [2,3].

Выборочное среднее – среднее выборочное значение, вычисляемое как сумма всех значений, деленная на их число.

Медиана m – выборочное значение, которое делит выборку пополам: число выборочных значений, меньших m, равно числу выборочных значений, больших m. При симметричном распределении значений переменной выборочное среднее обычно близко к значению медианы.

Квартили – два выборочных значения, которые относительно медианы делят выборку на четыре равные части.

Стандартное, или среднеквадратическое, отклонение показывает, насколько сильно выборочные значения разбросаны относительно среднего. Для нормально распределенных данных в границах двух стандартных отклонений относительно среднего значения размещается несколько более 95% наблюдений. Эта оценка используется в экспериментальных исследованиях ИР для обозначения лабораторной нормы.

Дисперсия – близка к квадрату стандартного отклонения, но в отличие от него дисперсия обладает свойством аддитивности: сумма дисперсий нескольких выборок равна дисперсии объеденной выборки.

Ошибка среднего – характеристика точности вычисления среднего значения с учетом разброса выборочных значений и объема выборки. Для нормально распределенных данных в границы двух ошибок с вероятностью 95% попадет оцениваемое среднее значение генеральной совокупности, что соответствует 95%-ному доверительному интервалу среднего.

Доверительны интервал – для некоторой выборочной оценки (среднего, дисперсии, доли и др.) – диапазон значений наблюдаемой случайной переменной, который с заданной (доверительной) вероятностью содержит неизвестное генеральное значение оцениваемой характеристики этой переменной. Например, среднее выборочное значение оценивается (вычисляется) по ограниченной выборке из потенциально бесконечной генеральной совокупности, которая априори содержит неизвестную случайную ошибку, т.е. отклонение от генерального среднего. Ошибка будет статистически уменьшаться при увеличении объема выборки при снижении заданной точности такого предсказания (доверительная вероятность). Так, 95%-ный доверительный интервал относительно вычисленного выборочного среднего означает, что в этом диапазоне с вероятностью 95% содержится оцениваемое генеральное среднее. Доверительные интервалы могут служить эффективным средством количественной проверки статистических гипотез.

Асимметрия и эксцесс характеризуют степень не симметрии выборочного распределения относительно среднего значения и степень выраженности его центрального пика. Для нормального закона распределения эти показатели имеют следующие значения: асимметрия = 0 (события распределены симметрично относительно среднего значения выборки), эксцесс = 3.

3. Визуализация данных. Для выбора тактики дальнейшего анализа целесообразно применить графическое представление – визуализацию данных посредством отображения переменной х1 на графике. Для этого в главном окне STADIA кликнуть мышкой меню «Графики», после чего появится подокно «Графики данных» (рис. 1.4). Затем в группе опций «Научные» кликнуть кнопку «1=функции: Y=f(X)», после чего появится подменю «Графики данных».

Рис. 1.4 График распределения переменной х1

В появившемся подокне «Графики данных» в субполе «Переменные» выделить мышкой переменную х1 и переслать ее в субполе «На графике», это позволить проанализировать значения переменной х1. Как видно из графика, распределение переменной х1 в основном равномерно, но одно значение (45 мин), которое не согласуется с общим характером выборки, заходит за границы переменной. Наличие подобного значения – выброса, или флуктуации, - как правило, искажает картину экспериментальных данных и может снизить качество моделирования. Для его устранения в моделировании применяют способ фильтрации данных, или преобразования данных.

4. Преобразование данных. Данные в электронной таблице необходимо просмотреть и скорректировать, например, удалить или сгладить высокоамплитудные выбросы. Так, в нашем случае 14-1 дефект продолжительностью 45 мин явно не репрезентативен, поэтому его значение целесообразно заменить на близкое к значению средней выборочной, полученному в результате вычислений. Вычисленное нами среднее выборочное равно 5,367, заменим в электронной таблице значение 45 на округленное значение 5. По отфильтрованным данным путем реализации описанных выше последовательных команд получим более адекватные статистические оценки (рис.1.5).

Рис.1.5 Результаты расчета описательной статистики до фильтрации и после фильтрации экспериментальных данных

Для расширения аналитической базы построим график по отфильтрованным экспериментальным данным (рис.1.6).

Рис. 1.6 График отфильтрованных данных переменной х1

5. Анализ функционального состояния АИС по критерию доверительности информации. Априори можно предположить следующее. Ошибки (искажения) истинного значения содержавшихся в документах данных отрицательно влияют на эффективность технологического процесса АИС. Так как в моделировании функционального состояния АИС большое значение имеет адекватность привлекаемых к моделированию данных, необходимо провести сравнительный анализ полученных экспериментальных данных до фильтрации и после.

Анализ базовых статистических оценок подтверждает, что фильтрация положительно влияет на достоверность привлекаемых к моделированию экспериментальных данных, следовательно, и на адекватность модели анализа. Например, среднее выборочное обнаружения и исправления дефекта по достоверности до фильтрации составляло 5,367 мин, а после фильтрации – 4,033 мин. Таким образом, этот показатель в результате уточнения скорректирован на 25%. Практически это означает, что в информационно-вычислительной структуре при организации технологического процесса обработки данных трудоемкость процедур диагностики и коррекции дефектов по достоверности обрабатываемых данных может быть снижена на 25%, следовательно, при определенных условиях может быть сокращена штатная численность работников, занятых в технологии обработки данных АИС.

Точность расчета среднего выборочного подтверждается следующими оценками. Если до фильтрации значение ошибки составляло 1,394, то после фильтрации стало существенно меньше 0,2774. Подобное влияние наблюдается и по таким параметрам, как дисперсия и стандартное отклонение. Дополнительные статистические оценки так же подтверждают лучшее качество отфильтрованных данных. Например, если до фильтрации значимость относительно асимметрии и эксцесса имела нулевые значения, то после фильтрации значимость стала более адекватной – соответственно 0,2795 и 0,3171. Это логично, так как значения оценок асимметрии и эксцесса для отфильтрованных данных равны соответственно 0,2369 и 2,473, что намного ближе к стандартам математической статистики (нормальное распределение): 0 для асимметрии и 3 для эксцесса, чем у данных до фильтрации – соответственно – 4,875 и 25,9.

6. Формулирование выводов. Выводы целесообразно построить в соответствии с этапами выполнения работы, сформулировав по каждому из этапов резюме по наиболее существенному аспекту этапа. Выводы должны быть связаны между собой, так же как и этапы решения задачи. Содержание выводов должно отражать, с одной стороны, последовательность решения задачи, а с другой – содержание этапа, его место и значение в комплексе работ по решению задачи. Полезно дать собственную оценку эффективности пакета STADIA в решении задачи. После формулирования выводов необходимо еще раз проверить качество полученных результатов по решению задачи.

7. Составление и оформление ответа следует выполнить в соответствии с требованиями, изложенными выше.

 

Варианты заданий

 

Контрольные вопросы

1. Какие факторы влияют на выбор методов и средств для решения задач МИР?

2. Охарактеризуйте основные этапы решения задач МИР в их логической последовательности.

3. При каких условиях применяется фильтрация экспериментальных данных?

4. По каким критериям в ППСА STADIA статистические оценки разделены на основную и дополнительную статистику?

5. Какая связь между адекватностью модели ИР и проверкой экспериментальных данных на из согласие закону распределения?

6. Какие параметры следует привлекать для оценки эффективности АИС в моделировании ИР?

7. Как проводится проверка адекватности регрессионной модели в МИР?

 


Лабораторная работа №2. «Определение закона распределения экспериментальных данных о качестве технологического процесса обработки данных»

Постановка задачи. Основной целью решения задачи является получение практических навыков в моделировании закона распределения экспериментальных данных о качестве тех­нологического процесса в АИС, а также закрепление теоретических сведений, полученных в лекционном курсе.

Решение задачи базируется на применении средств теории ве­роятностей и математической статистики [2,3]. В работе по­средством последовательных вычислительных процедур должен быть установлен статистический закон распределения, которому подчиняются экспериментальные данные о дефектах технологи­ческого процесса обработки данных АИС. Необходимые вычис­ления выполняются программными средствами диалоговой сис­темы STADIA. На основе результатов вычисления определяется закон распределения, в соответствии с которым выполняются по­следующие вычисления в процессе моделирования и улучшения качества технологического процесса обработки данных.

В практике экспериментального исследования АИС надеж­ность и достоверность результатов исследования в значительной мере зависят от точности экспериментальных данных случайной выборки, полученной в ходе наблюдения и сбора данных о дефек­тах, возникающих на различных этапах технологического процес­са обработки данных АИС. При этом очень часто возникает необходимость ответить на следующие вопросы: какова вероятность тех событий, которые отражает статистическая структура дефек­тов, т.е. экспериментальные данные? Каковы точность, надеж­ность вычислительных результатов, получаемых на основе обра­ботки экспериментальных данных? Какая методика вычислений позволит получить адекватную модель исследуемого технологиче­ского процесса обработки данных или какого-либо другого вида ИР? Обоснованность этих вопросов обусловливается многими причинами. Одной из них является то, что АИС и ее компоненты, в частности технологический процесс обработки данных, в силу сво­его человеко-машинного характера относятся к классу вероятност­ных систем. Разумеется, собранные экспериментальные данные и результаты их обработки будут отражать вероятностный характер технологии обработки данных, а качество модели ИС зависит от уровня надежности, достоверности результатов расчетов, которые определяются уровнем надежности исходных экспериментальных данных. Для повышения надежности результатов вычислений и улучшения качества моделирования необходимо определить ха­рактер экспериментальных данных путем выявления закона, кото­рому подчиняются экспериментальные данные о дефектах.

Расчетные работы по моделированию ИР, как правило, бази­руются на наборе исходных экспериментальных данных, в част­ности на оценках описательной статистики (см. ЛР №1). Надеж­ность последних увязывается с определением закона распределе­ния вероятностей, которому подчиняются случайные числа выборки.

В качестве исходных экспериментальных данных выступает выборка по дефектам полноты данных в документах. Такими де­фектами являются отсутствие (пропуски) необходимых чисел, слов, показателей и других обязательных элементов документов, текстов, файлов, сообщений, зафиксированных на различных но­сителях или передаваемых по каналам связи.

Приведем последовательность получения исходных данных для экспериментальной оценки качества обработки информации реальной ИС корпоративного уровня.

На первом этапе производятся учет и прием первичных документов – заполненных учетных бланков (УБ), поступающих от подчиненных предприятий в ИВЦ организации; взята выборка объемом 101 пачка УБ. Дефектной считается та пачка, которая поступала с опозданием, после срока, установленного организацией. Каждая пачка регистрировалась случайным событием в ведомости дефектов отдельной строкой. На данном этапе также выявлялись дефекты по полноте – отсутствие значений показателей в УБ. Объем выборки в данном случае составил 250 УБ. Дефекты по достоверности на данном этапе не проявились.

На втором этапе (прием УБ после их индексирования (кодирования) в ИВЦ) путем анализа УБ и журнала регистрации приема УБ от предприятий методом случайных чисел была взята выборка объемом 164 пачки УБ за определенный период. Техническими условиями по плану-графику установлено время кодирования – 200 УБ за рабочую смену, поэтому как дефектные идентифицировались те пачки УБ, время кодирования которых превысило установленное. На данном этапе дефектов по полноте обнаружено не было, а дефекты по достоверности не выявлялись.

На третьем этапе (компьютерный ввод УБ и обработки документации) была взята выборка объемом 200 УБ и дефекты по своевременности и полноте не обнаружены.Дефекты по достоверности регистрировались отдельной строкой в ведомости.

На четвертом этапе обработки (выдача исходных (результатных) документов абонентам ИС) взята выборка объемом 4806 УБ, в которой были выявлены только дефекты по достоверности – 10 ошибочных символов.

В технологических процессах обработки данных АИС на обнаружение и исправление указанных дефектов расходуются временные, трудовые, аппарат­ные, программные и финансовые ресурсы. В данной выборке из 30 чисел каждое число представляется дефектом по полноте и из­меряется в минутах: 9, 12, 11, 14, 16, 11,14, 12, 15, 12, 14,12, 13, 11, 14, 13, 10, 15, 13, И, 12, 10, 12, 13, 12, 14, 11, 13, 16, 13.

Основные этапы решения. Решение данной задачи состоит из не­скольких этапов.

1. Ввод статистических экспериментальных данных. Компьютерный ввод экспериментальных данных в объеме 30 чисел (см. ЛР №1) вы­полняется в соответствии с регламентом ввода, указанным в ЛР №1. В результате процедуры ввода в электронной таблице в столбце xl размещаются 30 значений, формирующих переменную х 1. При от­сутствии ошибок ввода следует приступить к следующему этапу.

2. Проверка распределения экспериментальных данных на нормаль­ность. Общепринятой формой представления выборочного рас­пределения является гистограмма. При ее построении диапазон изменения выборочных значений разбивают на равные интерва­лы и подсчитывают число значений, попадающих в каждый ин­тервал. При графическом представлении гистограммы на каждом интервале строится прямоугольник высотой, пропорциональной числу выборочных значений, попавших в интервал.

Для запуска процедуры проверки распределения на нормаль­ность необходимо через меню «Статистика» обратиться к подме­ню «Статистические методы» и в разделе «Параметрические тес­ты» кликнуть кнопку 2=Гистограмма/нормальность, по­сле чего появится подокно «Гистограмма».

В этом подокне программа предлагает пользователю число ин­тервалов гистограммы (в нашем случае — 6) с указанием левой и правой границ. Пользователь имеет возможность по своему усмот­рению изменить число интервалов. Но поскольку программный модуль определяет рациональное число интервалов, то целесооб­разно согласиться с предлагаемым программой числом интервалов.

Далее следует кликнуть кнопку Утвердить, после чего появит­ся окно Результаты, содержащее данные по гистограмме и тесту нормальности, а также подокно «Confirm» с вопросом Сохранить гистограмму в матрице данных? (рис. 2.1).

Рис. 2.1 Окно «Результаты», отображающее данные по гистограмме и тесту нормальности

Для получения полного состава данных по проверке экспери­ментальных данных на нормальность надо кликнуть кнопку Yes, после чего появится гистограмма (рис. 2.2).

В подокне «ПОСМОТРИТЕ ГРАФИК» нужно кликнуть кнопку Оставить, чтобы сохранить гистограмму в окне Grl.

Рис. 2.2 Гистограмма дефектов по показателю полноты данных

Под записью Переменная: xl для каждого интервала гисто­граммы на экран выводятся значения: Х-лев — левая граница ин­тервала в исходных единицах; Х-станд — значения в единицах стандартного отклонения; Частота — число выборочных значе­ний, попавших в интервал; % — доля выборочных значений, %; Накопл. — накопленное число выборочных значений, включая те­кущий интервал; % — накопленная доля выборочных значений, включая текущий интервал.

Затем проводится проверка нулевой гипотезы об отсутствии различий между выборочным распределением и нормальным и расчет трех статистик (критериев):

¾ критерия Колмогорова, который реагирует на наибольшую раз­ность между распределениями, обычно появляющуюся вблизи максимума функции плотности вероятности, поэтому он плохо адаптирован к выявлению различий на концах («хвостах») распре­делений;

¾ критерия омега-квадрат, который является более равномерным, учитывает различия между распределениями на всем интервале выборочных значений, однако он менее исследован в плане со­ставления таблиц критических значений и предельных аппрокси­маций для распределений различных типов;

¾ критерия хи-квадрат, который также довольно равномерно учи­тывает различия во всем диапазоне выборочных значений, однако требует большей осторожности при применении к непрерывным распределениям, поскольку его результаты существенно зависят от объема выборки и разбиения выборочного пространства на ин­тервалы.

По каждому критерию определены три параметра — собствен­но значения критерия, значимость и степень свободы.

Проверка выборочного распределения на нормальность мо­жет быть выполнена несколькими способами, которые дополня­ют друг друга:

¾ визуальный способ в качестве предварительной субъективной оценки — по виду гистограммы выборочного распределения, ко­торая сравнивается с представленной кривой плотности вероят­ности нормального распределения;

¾ проверка нулевой гипотезы соответствия распределений по коэф­фициентам асимметрии и эксцесса (см. ЛР №1); в математической статистике индикатором для проверки нулевой гипотезы наряду с другими данными служит уровень значимости Р. Нулевая гипоте­за может быть принята при Р>0,05. В нашем случае уровни значи­мости Р по критериям Колмогорова, омега-квадрат и хи-квадрат соответственно равны 0,2281, 0,2124, 0,5119, что указывает на воз­можность принятия нулевой гипотезы о соответствии экспери­ментальных данных нормальному закону распределения;

¾ проверка соответствия формы распределений по критериям Кол­могорова, омега-квадрат и хи-квадрат.

3. Уточнение закона распределения. Чтобы более точно определить закон распределения случайных величин выборки, прибегают к проверке распределения на соответствие конкретному закону. Для установления закона следует кликнуть мышкой меню «Ста­тистические методы», в подполе «Распределения и частоты» кликнуть мышкой кнопку Согласие распределений, после чего на экране появится подокно «Распределения».

Средствами ППСА STADIA можно выполнить проверку наи­более часто встречающихся в практике законов распределения: нормального, экспоненциального, Релея, Вейбулла, логистического, экстремальных значений, Эрланга, логнормального.

В диалоговом окне законов распределения нужно выбрать пу­тем последовательной проверки и анализа распределений наиболее адекватный вид распределения для исследуемой выборки. При этом наиболее близкий закон подбирается визуально — по расстоянию от центра интервальных «сгустков» случайных вели­чин до кривой плотности вероятности распределения. Как прави­ло, проверку начинают с нормального распределения, для чего следует кликнуть мышкой кнопку Нормальное, после чего полу­чим график (рис. 2.3).

Рис.2.3 График проверки данных на соответствие нормальному закону

На графике линией отображаются теоре­тические параметры закона нормального распределения, а распо­ложенными вертикально точками — интервальное распределение фактических экспериментальных (эмпирических) данных. Гра­фик на рис. 2.3 довольно четко показывает совпадение теорети­ческой функции с эмпирической функцией распределения как по центральной части гистограммы, так и на ее «хвостах», т.е. левой и правой частях распределения. Более точное заключение можно дать на основе результатов расчета статистических параметров распределения.

Для дальнейшего отображения графика на рабочем листе Grl электронной таблицы в верхнем окне «ПОСМОТРИТЕ ГРАФИК» надо кликнуть мышкой кнопку Оставить, после чего в рабочем листе «Результаты» появится отображение результатов расчетов по проверке соответствия экспериментальных данных параметрам закона нормального распределения (рис. 2.4).

Рис.2.4 Подокно «Результаты» с отображением оценок соответствия данных закону нормального распределения

В рубрике «Распределение нормальное» даны два параметра — среднее выборочное значение (в нашей задаче время обнаружения и исправления дефекта по полноте данных) 12,6 мин и оценка по ошибке среднего выборочного 1,734; это незначительная ошибка. Тот факт, что распределение экспериментальных данных не отли­чается от теоретического закона нормального распределения дан­ных, подтверждается оценками по критериям Колмогорова и оме­га-квадрат.

Следует проверить, отвечает ли распределение эмпирических данных другим законам. Вернемся в подокно «Распределение» и выполним проверку соответствия закону экспоненциального распределения. Для этого нужно кликнуть мышкой кнопку Экс­поненциальное, после чего появится соответствующий график (рис. 2.5). Из графика видно, что теоретическая линия закона экспоненциального распределения пересекается только с одним из средних интервалов значений эмпирических данных, на «хво­стах» гистограммы наблюдается резкое расхождение. Поэтому можно сделать вывод, что в данном случае соответствие малове­роятно.

Рис. 2.5 График проверки данных на соответствие экспоненциальному закону

Чтобы подтвердить этот вывод, кликнем мышкой кнопку Ос­тавить в подокне ПОСМОТРИТЕ ГРАФИК. В дальнейшем этот график при необходимости можно отобразить посредством кноп­ки рабочего листа Gr2. Одновременно с графиком в рабочем листе электронной таблицы Rez выводятся результаты расчетов стати­стических оценок по закону экспоненциального распределения. Кликнув мышкой кнопку Rez, получим отображение указанных результатов, которые подтверждают наше предположение, сде­ланное по виду графика. В соответствии с проверкой по первой гипотезе программа дала заключение «Распределение отличается от теоретического». Таким образом, распределение эмпирических экспериментальных данных не соответствует экспоненциальному закону распределения, что подтверждается также значениями оценок по критериям Колмогорова и омега-квадрат.

В соответствии с описанным способом проверки стоит выпол­нить проверку по остальным законам распределения. Практиче­ски это расширяет представление о моделируемом ИР и позволяет принять правильное решение о стратегии и тактике моделирова­ния.

4. Формулирование выводов выполняется по окончании проверки по всем законам распределения. В выводах должна содержаться квинтэссенция решения данной задачи.

5. Составление и оформление отчета. По окончании работы необходимо составить и оформить отчет.

 

Варианты заданий

 

Контрольные вопросы

1. Назовите различия между макетным и процедурным моделированием ИР.

2. Определите последовательность этапов вычислительного эксперимента в МИР.

3. Какие данные регистрируются в дефектной ведомости?

4. Какие инструкции разрабатываются для проведения вычислительного эксперимента?

5. Какие сведения может отражать дендрограмма кластеризации?

6. Чем отличается свободный (нулевой) коэффициент от коэффициента регрессии?

7. Чем различаются регрессионные модели по производительности технологического процесса обработки данных и себестоимость подготовки документов?

8. По каким статистическим параметрам проводится оценка адекватности модели регрессионного анализа?


Лабораторная работа №3. «Оценка эффективности модернизации качества АИС»

Постановка задачи. Основной целью решения за­дачи является получение практических навыков в моделировании процесса проверки эффективности (результативности) меро­приятий по улучшению технологии функционирования АИС, а также закрепление теоретических знаний, получен­ных в лекционном курсе.

Решение задачи базируется на применении средств системно­го анализа и математической статистики [2,3]. Работа состоит в том, чтобы на основе собранных статистических данных выпол­нить анализ функционального состояния АИС программными средствами диалоговой системы STADIA и на основе результатов сравнительного анализа выработать стратегию и тактику улучше­ния качества работы АИС.

Допустим, что в результате реализации организационно-тех­нических мероприятий проведена модернизация технологиче­ского процесса обработки данных АИС. Требуется проверить на­личие положительного эффекта от модернизации АИС. Если указанный эффект достигнут, то необходимо также узнать, насколько улучшились функциональные параметры АИС. Срав­нение двух выборок по параметру полноты документной инфор­мации АИС проводится на основе критерия интегральных разли­чий Колмогорова—Смирнова.

По условию решения задачи необходимо в качестве исходных данных взять две выборки по какому-либо определенному пара­метру. В нашей задаче это будет полнота документной информа­ции, обрабатываемой на этапах технологического процесса обра­ботки данных АИС. В каждой выборке имеется по 30 значений. Первая выборка xl сформирована до модернизации технологиче­ского процесса обработки данных АИС, а вторая выборка х2 — по­сле модернизации. Числа первой выборки указаны в ЛР №2, а числа выборки х2 следующие: 5, 9, 5, 12, 10, 6, 11, 9, 7, 8, 7, 9, 7, 6, 7, 8, 4, 6, 8, 5, 9, 6, 10, 7, 9, 7, 10, 9, 6, 8.

Основные этапы решения задачи. Решение задачи состоит из не­скольких этапов.

1. Ввод исходных данных. Данные первой и второй выборок вводятся соответственно в столбцы xl и х2 электронной таблицы, в резуль­тате чего формируются две одноименные переменные, т.е. набор чисел по переменным xl и х2. Ввод осуществляется в соответствии с регламентом ввода данных в электронную таблицу, рассмотрен­ным в ЛР №1.

2. Преобразование данных к рабочему виду. С целью проведения стати­стической обработки исходные данные по каждой выборке после­довательно преобразуются в форму гистограмм. Для этого необ­ходимо кликнуть мышкой меню «Статистика», затем в подокне «Статистические методы» в поле «Параметрические тесты» клик­нуть кнопку Гистограмма/нормальность (см. ЛР №2). В результате появится подокно «Анализ переменной», в левом поле которого отображены переменные xl и х2.

Далее последовательно получают гистограммы по перемен­ным следующим образом: 1) кликнуть переменную xl; 2) кликнуть Стрелку вправо; 3) при появлении переменной xl в поле «Для ана­лиза» кликнуть кнопку Утвердить, после чего на экране появится подокно «Гистограмма», идентичное описанному выше (ЛР №2); 4) в подокне «Гистограмма» кликнуть кнопку Утвердить, после чего появятся отображение результатов расчета по xl и подокно «Confirm», в котором на вопрос «Сохранить гистограмму в матри­це данных?» следует кликнуть кнопку Утвердить. В результате отобразится гистограмма по переменной xl, ранее уже нами полу­ченной (см. рис. 1.4); 5) для получения данных по переменной х2 необходимо повторить процедуры 1—4 с данными по перемен­ной х2.

Когда данные получены по обеим переменным, можно выпол­нить визуальную проверку эффективности путем сопоставления двух гистограмм. Если у переменной xl минимальное значение дефекта по полноте начинается с 9 мин (левый «хвост» гистограм­мы), то у переменной х2 этот параметр меньше — 4 мин. Подобное условие наблюдается и по правым «хвостам» гистограмм: у пере­менной xl максимальное значение дефекта равно 16 мин против 12 мин у переменной х2. Это позволяет сделать предварительное заключение, что в результате модернизации качество технологи­ческого процесса обработки данных АИС улучшилось. Этот вы­вод подтверждают полученные в результате расчетов значения критериев Колмогорова, омега-квадрат и хи-квадрат: у перемен­ной х2 указанные значения меньше, чем у переменной xl.

Для более достоверного заключения необходимо привлечь к сравнительному анализу и более информативные статистические оценки. Для этого следует получить оценки описательной стати­стики по каждой переменной. Результатом расчетов являются оценки описательной статистики (рис. 3.1).

3. Проверка и анализ интегральных различий двух выборок. Для получе­ния результатов нужно: 1) через меню «Статистика» в поле «Непа­раметрические тесты» кликнуть мышкой опцию «Произвольных альтернатив»; 2) в появившемся поле «Анализ переменных» вы­брать переменные xl и х2; 3) переслать их в правое подполе; 4) кликнуть мышкой опцию Утвердить, что даст результаты до­полнительных расчетов по критерию Колмогорова—Смирнова (рис. 3.1). В соответствии с критерием Колмогорова—Смирнова по параметру «гипотеза 1» программа дала заключение «Есть ин­тегральные различия между выборками», подтвердив предполо­жение, выдвинутое на основе визуального сравнения гистограмм двух выборок.

Рис.3.1 Отображение дополнительных расчетов по критерию Колмогорова-Смирнова

Чтобы численно оценить эффективность модернизации тех­нологии обработки данных АИС, следует обратиться к оценкам описательной статистики, в частности к значению «среднее выбо­рочное» — среднее время обнаружения и исправления дефекта по полноте данных (в минутах) до модернизации (переменная xl) и после модернизации (переменная х2). Если у переменной xl это значение составляет 12,6 мин, то у переменной х2 — 7,667 мин. Следовательно, среднее время обнаружения и коррекции дефекта по полноте данных в технологии модернизированной АИС сокра­тилось на 40 %.

4. Формулирование выводов необходимо выполнить в соответствии с основными этапами решения задачи, обращая особое внимание на последовательность применения средств сравнительного ана­лиза.

5. Составление и оформление отчета о решении задачи производятся после выполнения работ в полном объеме. Затем проводится кон­троль качества выполненных работ. Выявленные дефекты ис­правляются, и отчет предъявляется преподавателю для получения зачета.