Теми семінарів з курсу Інтелектуальний аналіз даних

(15-20 слайдів)

1. Предмет і сутність дисципліни інтелектуальний аналіз даних

2. Задача класифікації

3. Задача регресії

4. Задача прогнозування

5. Задача кластеризації

6. Задача асоціації

7. Що таке дані?

8. Що таке інформація?

9. Що таке знання?

10. Багатомірні дані, куби

11. Метадані

12. Методи й алгоритми Data Mіnіng

13. Кібернетичні методи Data Mіnіng

14. Штучні нейронні мережі (розпізнавання, кластеризація, прогноз);

15. Еволюційне програмування (у т.ч. алгоритми методу групового обліку аргументів);

16. Генетичні алгоритми (оптимізація);

17. Асоціативна пам'ять (пошук аналогів, прототипів) ;

18. Нечітка логіка;

19. Дерева розв'язків;

20. Системи обробки експертних знань.

21. Сучасні програмні системи для Data Mіnіng

22. Сфери застосування Data Mіnіng

23. Data Mіnіng і Банківська справа

24. Data Mіnіng і Маркетинг

25. Data Mіnіng і Промислове виробництво

26. Data Mіnіng і Фондовий ринок

27. Data Mіnіng і Роздрібна торгівля

28. Data Mіnіng для наукових досліджень

29. Text Mіnіng: предмет і цілі.

30. В чому полягає суть методу опорних векторів?

31. Які сильні та слабкі сторони методу опорних векторів?

32. В чому полягає суть методу «найближчого сусіда»?

33. Шо означає термін "k-найближчий сусід"?

34. Що таке прецедент?

35. Що таке Байєсівська класифікація?

36. В чому полягає метод наївної Байєсівської класифікації?

37. В чому полягає метод дерев рішень?

38. Які переваги методу дерев рішень ви можете перерахувати?

39. Що таке критерій розщеплення при створенні дерева рішень?

40. Що таке алгоритм CART , який називається індексом Gini?

41. Які алгоритми ви знаєте, що використовуються для реалізації дерев рішень?

42. В чому полягає суть задачі Data Mining- асоціація?

43. Що таке асоціативні правила?

44. Які характеристики асоціативних правил вам відомі?

45. Що таке візуалізація?

 

 

Tecтові завдання до модульного контролю з дисципліни «Інтеллектуальний аналіз данних»

 

1.Область использования Data Mining ...

a) ничем не ограничена — она везде, где имеются какие-либо данные

b) ничем не ограничена — она везде, не имеет значения, есть ли какие-либо данные

c) достаточно ограничена, в большинстве случаев - это научные исследования

 

2.Из каких смежных наук сформировалась Data Mining?

a) Data Mining - мультидисциплинарная область, возникшая и развивающаяся на базе компьютерных наук и информационных технологий

b) Data Mining развивалась исключительно, как самостоятельная наука используя свои оригинальные методы и алгоритмы

c) Data Mining возникла как ответвление науки статистика и математический анализ

3. Как сформировалось понятиеData Mining?

a) Data Mining – это интеллектуальный анализ данных

b) Data Mining- это наука о методах логического вывода на базе использования интеллектуальных систем знания (управляемый словарь, таксономия, классификация, тезаурус, онтология)

c)Data Mining- это наука об извлечении знаний на основе семантики предметной области

 

4. Предметная ориентация хранилища данных означает, что ...

a) данные объединены в категории и сохраняются соответственно областям, которые они описывают, а не применениям, их использующим

b) данные удовлетворяют требованиям всего предприятия, а не одной функции бизнеса

c) хранилище можно рассматривать как совокупность "исторических" данных: возможно восстановление данных в любой момент времени

 

5. Data Mining — это процесс обнаружения в сырых данных

a) ранее сформулированных гипотез

b) неочевидных закономерностей

c) практических закономерностей

d) объективных закономерностей

e) большого количества закономерностей

 

6. Оцените правильность утверждения: "Извлечение полезных сведений невозможно без хорошего понимания сути данных

a) утверждение верно

b) утверждение неверно. Технологии Data Mining не нужен аналитик, поэтому понимание кем-либо данных - излишне

c) утверждение неверно. Технологии не нужно понимание данных

 

7. Основные тенденции в области визуализации:

a) разработка более компактных видов диаграмм

b) повышение уровня взаимодействия с визуализацией пользователя

c) увеличение размеров и сложности структур данных, представляемых визуализацией

d) все ответы верны

8. Специалист, имеющий знания об окружении бизнеса, процессах, заказчиках, клиентах, потребителях, а также конкуренте это...

a) специалист по добыче данных

b) специалист предметной области

c) администратор баз данных

d) менеджер проекта

e) все ответы неверны

 

9. Специалист, имеющий знания о том, где и каким образом хранятся данные, как получить к ним доступ, и как связать между собой эти данные - это...

a) специалист по добыче данных

b) специалист по предметной области

c) администратор баз данных

d) программист

e) все ответы неверны

 

10. Какое из перечисленных ниже направлений подразумевает автоматический поиск и извлечение качественной информации из разнообразных источников Интернета, перегруженных «информационным шумом»:

a) Web Content Mining

b) Web Usage Mining

c) Web Text Mining

 

11. Назовите характеристики кластерного анализа: