Уровни информационных технологий. Data mining в медицине.

Этапы операций с медико-биологическими данными.

В информационной технологии работы с данными, в том числе медицинского характера, существует несколько основных этапов операции с данными:

1. Сбор и первичная обработка данных – это накопление результатов исследований в том объеме, который задан условиями поставленной задачи или необходимостью принять адекватное решение. Существуют специальные правила, определяющие объем требуемых данных для каждого класса задач. Собранные данные подлежат первичной обработке, которая включает в себя отсечение «лишних», некорректно зарегистрированных сигналов. Первичная группировка реализуется по типу данных и классам изучаемых явлений.

2. Оценка эффективности измерения данных – это определение степени точности и величины погрешности зарегистрированных сигналов и полученных данных.

3. Cохранение данных – это регистрация данных в виде твердых копий или на магнитных носителях.

4. Формализация и стандартизация данных – это сведение всех полученных данных к единой форме, которая должна соответствовать требованиям компьютерной обработки и обеспечивать сопоставимость всех данных между собою, а также доступность их для всех заинтересованных пользователей.

5. Фильтрация и очищение данных – это отсеивание лишних сигналов, обусловленных неточностью работы регистрирующих приборов, некорректно собранной информацией о состоянии изучаемого явления. Этот способ используется также при объективно существующей неоднородности структуры и функционирования отдельных систем человеческого организма.

6. Кодировка данных – это унификация формы представления данных на бумажных или магнитных носителях.

7. Сортировка данных – это упорядочение данных по заданному признаку или совокупности их характеристик .

8. Преобразование данных – это изменение формы данных по заданному алгоритму или между различными типами носителей.

9. Сжатие и архивация данных– это уплотнение данных на носителях и организация их хранения, нередко связана с изменением их формы.

10. Защита данных – это приведение данных по специальному алгоритму к форме, которая недоступна для несанкционированного их использования (шифрование, или криптографическая обработка данных).

11. Транспортировка данных – это передача данных на расстояния с помощью механических или телекоммуникационных каналов связи.

Уровни информационных технологий. Data mining в медицине.

Информационная технология, таким образом, – это процесс, использующий совокупность средств обработки первичной информации, в результате которых образуется информационный продукт, или информационный ресурс.

В качестве ресурсов в информационном обществе выступают документы, находящиеся информационных системах. Информационный продукт – это совокупность данных, являющихся следствием информационных технологий.

Уровни информационных технологий могут быть представлены в следующей возрастающей последовательности:

 
 

 


В вышеприведенной последовательности уровней обработки информации новым направлением развития медицинских информационных технологий является уровень Data mining. В буквальном переводе он означает «вычерпывание знаний». Занимается этим направлением тоже молодая наука – «инженерия знаний». В отличие от традиционной медицинской статистики, предназначенной проверки заранее сформулированных гипотез или грубого разведочного исследования, система Data mining позволяет ответить на нетривиальные, но практически значимые для принятия решений ответы. Она оперирует, в основном, с ранее неизвестными данными. Примерами вопросов, на которые может ответить информационная технология Data mining, могут быть такие: встречаются ли точные шаблоны людей, подверженных остеопорозу или алкоголизму, какие биографические черты портрета людей имеют влияние на продолжительность ремиссии при алкоголизме?