Методические указания для выполнения контрольной работы

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА

 

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

 

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙСООБЩЕНИЯ»

 

СОГЛАСОВАНО:  
Выпускающей кафедрой «Железнодорожная автоматика, телемеханика и связь»  
Зав. кафедрой ____________________А.В. Горелик (подпись, Ф.И.О.) « ___ » _____________ 20 ____ г.  

 

Кафедра: «Железнодорожная автоматика, телемеханика и связь»

(название кафедры)

Авторы: Коптева Л.Г., док. тех. н,.

(ф. и .о., ученая степень, ученое звание)

 

 

ЗАДАНИЕ НА КОНТРОЛЬНУЮ РАБОТУ ПО ДИСЦИПЛИНЕ

Информационные хранилища и аналитические системы

(название дисциплины)

Направление/специальность: 09.03.02 Информационные системы и технологии

(код, наименование специальности /направления)

Профиль/специализация «Информационные системы и технологии на транспорте» (ИС)

Квалификация (степень) выпускника: бакалавр

Форма обучения: заочная

 

Москва 2015 г.

 

Контрольная работа охватывает различные разделы программы по дисциплине «Хранилища данных». Перед выполнением контрольной работы студент должен изучить теоретический материал, данный в лекциях, теоретический материал и методические указания к лабораторным работам, рекомендованную литературу, а также методические указания к контрольной работе.

Цель контрольной работы – это Проектирование аналитического хранилища данных

Студент должен в контрольной работе:

сдать распечатанный титульный лист и вложить его в файл вместе с диском, на котором записана контрольная работа: пояснительную записку желательно распечатать также.

Пояснительная записка к контрольной работе должна содержать:

* задание и исходные данные;

* решение.

На титульном листе указывается название университета, тема контрольной работы, исполнитель, фамилия преподавателя, принявшего работу.

В ходе защиты работы студент должен продемонстрировать знание теоретических вопросов по теме. Вариант работы студент выбирает согласно последней цифре шестизначного учебного шифра.

Работы, в которых не соблюдены изложенные выше требования, а также работы, выполненные не по своему варианту, не зачитываются

 

 

Задание на контрольную работу

 

Процесс изучения дисциплины направлен на формирование компетенций в области проектирования ХД.

В результате изучения дисциплины студент должен:

Знать: архитектуру ХД, основные принципы проектирования ХД, классификацию средств аналитической обработки данных, подходы к реализации процесса наполнения ХД

Уметь: осуществлять многомерное моделирование предметной области, определять требования к интеграции данных при наполнении ХД.

Владеть: навыкамипроектирования структуры Хранилища данных, навыками многомерного моделирования и анализа данных

 

Проектирование аналитического хранилища данных ( в SSAS)

Разработка структуры источника данных для аналитического хранилища

Проектирование измерений хранилища

Проектирование куба хранилища

Создание вычисляемых показателей

В Excel построение 2х графиков функций выбранных для анализа показателей

Темы проблемных областей для проектирования хранилищ данных для вариантов заданий:

1. Потребление электроэнергии

2. Использование помещений

3. Заработная плата

4. Текучесть кадров в регионе

5. Текучесть кадров на предприятии

6. Пассажирские перевозки

7. Грузовые перевозки

8. Простои транспорта (вагонов, самолетов, пароходов, грузовиков)

9. Автомобильный трафик

10. Использование автотранспорта

Методические указания для выполнения контрольной работы

 

В настоящее время возникло понимание, что накопленные информационные массивы могут быть полезны. В них можно попытаться выявить скрытые, на первый взгляд, закономерности и вывести из них правила, которым подчиняется предметная область информационной системы. Впоследствии эти правила можно использовать для стратегического планирования, для принятия управленческих решений и прогнозирования их последствий.

Осознание пользы накапливаемой информации и возможности использовать ее для решения аналитических задач привело к появлению нового класса вычислительных систем - систем поддержки принятия решений (OLAP), ориентированных на аналитическую обработку данных. Под системой поддержки принятия решений понимают человеко-машинный вычислительный комплекс, ориентированный на анализ данных и обеспечивающий получение информации, необходимой для разработки решений в сфере управления.

Принципы, лежащие в основе систем поддержки принятия решений, не позволяют эффективно обрабатывать транзакции, поэтому данные, применяемые для анализа, стали выделять в отдельные базы данных. Впоследствии эти базы данных стали называть хранилищами данных (ХД) "Building Data Warehouse".

Нельзя не заметить, что данные и принципы их хранения в OLAP и системах операционной обработки различаются.

Запросы OLAP в большинстве случаев более сложные, чем те, которые применяются в системах операционной обработки данных. Например, в OLTP-системе банка запрос может сводиться к получению сведений о сумме на счету конкретного клиента. В аналитической системе запрос может быть таким: "Найти среднее значение промежутка времени между выставлением счета и оплатой его клиентом в текущем и прошедшем году отдельно для разных групп клиентов".

Для получения информации приходится применять специализированные языки, ориентированные на аналитическую обработку данных. Также для выполнения аналитических запросов могут быть использованы приложения, написанные специально для решения тех или иных аналитических задач.

Для того чтобы можно было извлекать полезную информацию из данных, они должны быть организованы особым, отличным от принятого в OLTP-системах образом. Связано это со следующими факторами.

Во-первых, для выполнения аналитических запросов необходима обработка больших информационных массивов.

Во-вторых, выполнение некоторых аналитических запросов, например, анализ тенденций и прогнозирование, требует хронологической упорядоченности данных.

В-третьих, данные, используемые для целей анализа, как правило, отличаются от данных систем обработки транзакций. При обслуживании аналитических запросов чаще используются не детальные, а обобщенные (агрегированные) данные. Так, например, для прогнозирования объема продаж сети универмагов будет излишним иметь информацию о каждой сделанной покупке, достаточно знать значение прогнозируемой величины за несколько предыдущих лет.

В отличие от систем операционной обработки данных в OLAP, использующих концепцию ХД, критерии поиска и состав выдаваемой в виде отчета информации не фиксируются при ее разработке, пользователи оперируют в основном заранее не регламентированными запросами.

Рассмотрим определения, данные Инмоным, чтобы подробнее рассмотреть свойства, присущие хранилищам данных.