Подготовка данных к анализу

 

Любое статистическое наблюдение требует тщательной, продуманной подготовки. От нее во многом будут зависеть надежность и достоверность информации, своевременность ее получения. Подготовка статистического наблюдения – процесс, включающий разные виды работ. Сначала необходимо решить методологические вопросы, важнейшими из которых являются определение цели и объекта наблюдения, состава признаков, подлежащих регистрации; разработка документов для сбора данных; выбор отчетной единицы и единицы, относительно которой будет проводиться наблюдение, а также методов и средств получения данных. Кроме методологических вопросов необходимо решить проблемы организационного характера, например, определить состав органов, проводящих наблюдение; подобрать и подготовить кадры для проведения наблюдения; составить календарный план работ по подготовке, проведению и обработке материалов наблюдения; провести тиражирование документов для сбора данных.

Проведение массового сбора данных включает работы, связанные непосредственно с заполнением статистических формуляров. Он начинается с рассылки переписных листов, анкет, бланков, форм статистической отчетности и заканчивается их сдачей после заполнения в органы, проводящие наблюдение.

Собранные данные на этапе их подготовки к автоматизированной обработке подвергаются арифметическому и логическому контролю. Оба эти контроля основываются на знании взаимосвязей между показателями и качественными признаками. На заключительном этапе проведения наблюдения анализируются причины, которые привели к неверному заполнению статистических бланков, и разрабатываются предложения по совершенствованию наблюдения. Это очень важно для организации будущих обследований.

Получение сведений в ходе статистического наблюдения требует немало затрат финансовых и трудовых ресурсов, а также времени.

Статистические наблюдения чаще всего преследуют практическую цель – получение достоверной информации для выявления закономерностей развития явлений и процессов. Задача наблюдения предопределяет его программу и формы организации. Неясно поставленная цель может привести к тому, что в процессе, наблюдения будут собраны ненужные данные или, наоборот, не будут получены сведения, необходимые для анализа.

При подготовке наблюдения кроме цели следует точно определить, что именно подлежит обследованию, т. е. установить объект наблюдения.

Под объектом наблюдения понимается некоторая статистическая совокупность, в которой проистекают исследуемые социально-экономические явления и процессы.

Чтобы определить объект статистического наблюдения, необходимо установить границы изучаемой совокупности. Для этого следует указать важнейшие признаки, отличающие его от других сходных объектов. Например, прежде чем проводить обследование рентабельности промышленных предприятий, следует определить формы собственности, организационно-правовые формы предприятий, отрасли промышленности и регионы, подлежащие наблюдению.

Всякий объект статистического наблюдения состоит из отдельных элементов- единиц наблюдения. В статистике единицей наблюдения называют составной элемент объекта, являющийся носителем признаков, подлежащих регистрации. Единицу наблюдения следует отличать от отчетной единицы. Отчетной единицей выступает субъект, от которого поступают данные о единице наблюдения. Всякое явление обладает множеством различных признаков. Собирать информацию по всем признакам нецелесообразно, а часто и невозможно. Поэтому необходимо отобрать те признаки, которые являются существенными, основными для характеристики объекта, исходя из цели исследования. Для определения состава регистрируемых признаков разрабатывают программу наблюдения. Программа наблюдения – то перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения. От того, насколько хорошо разработана программа статистического наблюдения, о многом зависит качество собранной информации.

Чтобы составить правильно программу наблюдения, исследователь должен ясно представлять задачи обследования конкретного явления или процесса, определить состав используемых в анализе методов, необходимые группировки и уже на основе этого выявить те признаки, которые можно определить при проведении работы. Обычно программа выражается в форме вопросов переписного (опросного) листа.

К программе статистического наблюдения предъявляются следующие требования. Программа должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, его тип, основные черты, свойства. Не следует включать в программу признаки, имеющие второстепенное значение по отношению к цели обследования или значения которых заведомо будут недостоверны или отсутствовать, например, в первичном учете или при незаинтересованности отчетных единиц в представлении такой информации, так как она является предметом коммерческой тайны.

Вопросы программы должны быть точными и не двусмысленными, иначе полученный ответ может содержать не верную информацию, а также легкими для понимания во избежание лишних трудностей при получении ответов.

При разработке программы следует не только определить состав вопросов, но и их последовательность. Логичный порядок в последовательности вопросов (признаков) поможет получить достоверные сведения о явлениях и процессах. Выбор времени наблюдения заключается в решении двух вопросов:

- установление критического момента (даты) или интервала времени;

- определение срока (периода) наблюдения.

Под критическим моментом (датой) понимаются конкретный день года, час дня, по состоянию на который должна быть проведена регистрация признаков по каждой единице исследуемой совокупности. Критический момент устанавливается с целью получения сопоставимых статистических данных.

Срок (период) наблюдения – это время, в течение которого происходит заполнение статистических формуляров, т.е. время, необходимое для проведения массового сбора данных. Этот срок определяется исходя из объема работы (числа регистрируемых признаков и единиц в обследуемой совокупности), численности персонала, занятого сбором информации. Следует учитывать, что отдаление периода наблюдения от критического момента или интервала времени может привести к снижению достоверности получаемых сведений.

Логические методы анализа информации. Традиционная логика при получении новых (выводных) знаний использует следующие логические методы.

Анализ — логический метод расчленения целого на отдельные элементы с рассмотрением каждого из них в отдельности.

Логика выработала ряд правил аналитического исследования, к числу которых относятся следующие.

1. Перед анализом исследуемого предмета (явления) необходимо четко выделить его из другой системы, в которую он входит как составной элемент. Это тоже осуществляется с помощью анализа (предшествующего).

2. Далее устанавливается основание, по которому будет производиться анализ. Основанием называется тот признак анализируемого предмета, который отличает одни компоненты от других. На каждой ступени анализа должно выбираться одно основание расчленения, а не несколько сразу.

3. Выделяемые в результате анализа элементы должны исключать друг друга, а не входить один в другой.

4. После этого осуществляется анализ, причем аналитические знания приобретаются в основном выводным путем, т.е. на основе действий, совершаемых по правилам формальной логики

Синтез — объединение всех данных, полученных в результате анализа. Синтез не простое суммирование результатов анализа. Его задача состоит в мысленном воспроизведении основных связей между элементами анализируемого целого.

1. На основе синтеза в исследовании решаются следующие важные теоретические вопросы:

2. Изучаемый предмет представляется как система связей и взаимодействий с выделением наиболее существенных сторон и связей.

3. Выясняется, существует ли единая природа, общие существенные элементы у явлений, которые изучаются как различные, но у которых замечено нечто общее.

4. Устанавливается, существует ли связь между законами и зависимостями, относящимися к одному объекту.

Абстрагирование — способность отвлечься от всей совокупности факторов и сосредоточить внимание на каком-либо одном вопросе. Процесс абстрагирования возможен, потому что свойства, признаки, стороны предмета и явления, находясь в связи с целым, имеют относительную независимость от целого. В процессе абстрагирования исследователь как бы очищает предмет изучения от побочных признаков, свойств, связей и отношений, знание которых не только не способствует ходу исследования, а часто и затрудняет последнее. Процесс абстрагирования проходит несколько этапов. На первом этапе происходит как бы группировка различных предметов, вызывающих у исследователя сходные ощущения и чувственные образы (например, объекты, имеющие красный цвет). На втором этапе исследователь как бы приравнивает, отождествляет различные оттенки или варианты одного и того же признака (обобщает объекты, имеющие различные оттенки красного цвета). На следующем этапе исследователь как бы закрепляет выделенные свойства и отношения в идеальном виде, в каком они в самой природе или обществе не встречаются. Поэтому этот этап иногда называют процессом идеализации. Наконец, на четвертом этапе выделенные свойства закрепляются (оформляются) в удобной для исследователя форме.

Конкретизация — увязка того или иного явления с конкретными условиями обстановки. Объекты в реальном материальном мире обладают бесконечным множеством свойств, сторон и связей. Каждая отдельно взятая абстракция отражает какую-то одну связь или одно свойство, например, цвет, форму, причинно-следственную связь. Зато эти отдельно взятые свойства или связи отражаются с максимальной полнотой и точностью. Для того чтобы глубже познать реальные, конкретные объекты, имеющие неограниченное множество связей и свойств, необходимо соединить, связать определенным образом отдельные абстракции в новое, конкретное понятие, дающее наиболее полное для данного времени знание о конкретном объекте. Конкретное понятие, следовательно, есть своего рода сумма, совокупность различных абстракций, или абстрактных понятий, отражающих определенные свойства, стороны и связи данного предмета. Конкретные понятия возникают в результате последовательного дополнения и уточнения, расширения и синтеза отдельных абстракций, отражающих различные стороны и связи, конкретных вещей. Переход от отдельных абстракций к конкретным понятиям называется методом восхождения от абстрактного к конкретному.

Аналогия (традукция) — прием, в котором из сходства двух явлений в одних условиях делается вывод о сходстве этих явлений в других условиях. В логике аналогия рассматривается как форма получения выводного знания, как умозаключение, в котором на основании сходства предметов в одних признаках делается вывод о сходстве этих предметов в других признаках.

Смысл аналогии заключается в том, чтобы находить неизвестные признаки предмета, опираясь на ранее приобретенные знания о другом, сходном с ним предмете, переносить информацию от одного предмета на другой на основе некоторого отношения между ними.

Но как бы, ни было значительно найденное исследователем сходство признаков двух объектов, выводы в умозаключениях по аналогии всегда бывают только вероятны. Выводы по аналогии использовать можно и нужно, но они не должны являться единственным источником сведений об изучаемом объекте. При этом данные любой, самой верной аналогии должны проверяться на практике.

При оценке степени вероятности умозаключения по аналогии надо принимать в расчет следующие условия:

1. Чем больше известно общих свойств у сравниваемых предметов, тем выше степень вероятности вывода по аналогии.

2. Чем существеннее найденные общие свойства у сравниваемых предметов, тем выше степень вероятности.

3. Чем глубже изучена взаимная закономерная связь сходных характеристик, тем вернее вывод, тем он ближе к достоверности.

4. Если предмет, в отношении которого исследователь делает умозаключение по аналогии, обладает каким-нибудь свойством, не совместимым с тем свойством, о существовании которого делается вывод по аналогии, то общее сходство не имеет никакого значения.

Метод аналогии широко используется в моделировании, так как модель — аналог объекта, изучаемого посредством моделирования.

Сравнение — установление сходства или различия явлений, процессов и объектов в целом или в каких-либо признаках. В отличие от аналогии сравнение направлено на обнаружение не только аналогичных существенных признаков, но и существенных признаков различия. Сравнение — метод, позволяющий обнаружить тенденции общего хода процесса развития, вскрыть изменения, происходящие в развитии явления.

Объективной основой метода сравнения являются: одинаковая сущность, общие законы, структуры функционирования и развития объектов и процессов. Сравнения позволяют выяснить, по каким признакам сравниваемые понятия сходны и по каким различны. Сравнение различных этапов развития системы позволяет выявить качественные изменения, новые существенные признаки. Сравнение — один из способов установления необоснованности гипотез и теорий, адекватности явлений, объектов и процессов. Сравнение как метод познания лежит в основе сравнительного логического анализа развития социально-экономических систем.

Более подробного рассмотрения требуют такие логические методы исследования, как индукция и дедукция.

Как метод исследования индукция состоит в получении общего знания на основе знания частного (единичного), менее общего. Тем самым она выступает определенным способом обобщения. Термин «индукция» используется в трех значениях:

1. Индуктивная форма умозаключения (от знания об отдельных предметах к знанию о всех предметах данного класса).

2. Индуктивная форма изложения — от описания единичных фактов к общему знанию.

3. Индуктивный метод исследования — от исследования единичных признаков, единичных предметов к нахождению общих существенных признаков, к выводному знанию обо всем классе предметов.

В логике выделяются три индуктивные формы умозаключения: полная индукция; популярная индукция; научная индукция.

Полная индукция — это такая форма, при которой класс предмета, связей, явлений, процессов количественно ограничен и, когда система простая, поддается исчерпывающему исследованию. В этом случае объект исследования количественно ограничен и рассматривается во всех его противоречиях.

Выводы из такого исследования являются доказательными. Ограниченность этой формы в том, что она требует знания о всех предметах класса, что нередко вообще невозможно или связано с большими затратами.

Популярная индукция — такая форма умозаключения от частного к общему, которая основана на простом перечислении признаков. На основе повторяемости одного и того же признака у всех наблюдаемых предметов и отсутствия противоречащего признака делается вывод о принадлежности рассматриваемого признака всем предметам данного класса. Но из того, что противоречащие признаки не встретились, не следует, что они невозможны или не существуют. Поэтому выводы здесь только вероятны. Это способ получения догадки, предположения («возможно», «может быть»).

Научная индукция — это индукция через отбор, исключающий случайные обобщения. Она основана на знании законов развития, действующих в исследуемой области знаний. Опираясь на эти знания, формируют выборочную совокупность. Это наиболее распространенная форма индукции.

Индуктивные умозаключения имеют две особенности:

1. Поскольку истинность частного не определяет однозначно истинности общего, постольку выводы получаются только вероятными.

2. Вывод по индуктивному умозаключению строится всегда на основе единичных или частных суждений. Вывод возможен при всех отрицательных посылках.

Индукция как метод исследования наиболее полно реализуется системой статистических методов. Статистика как общественная наука изучает закономерности количественных отношений в непрерывной их связи с качественным содержанием применительно к общественным явлениям. Основная задача статистической науки: а) познание количественных отношений причинной связи явлений; б) описание и измерение закономерностей общественного развития.

Дедукция как метод исследования, противоположный индукции, употребляется там, где исследователь распространяет общее знание (правило, закон) на отдельный, частный конкретный случай, на единичное явление. Это такая форма знания, при которой осуществляется переход от знания большей общности к новому знанию, меньшей общности. Переход от общего знания к частному, следовательно, осуществляется через особенное знание (знание законов, теорий, гипотез).

Дедукция — это частный случай умозаключений. В широком смысле умозаключение — логическая операция, в результате которой из одного или нескольких принятых утверждений (посылок) получается новое утверждение — заключение (вывод, следствие).

В дедуктивном умозаключении заключение с логической необходимостью вытекает из принятых посылок. Отличительная особенность такого умозаключения в том, что от истинных посылок оно всегда ведет к истинному заключению.

Во всех дедуктивных умозаключениях истинность посылок гарантирует истинность заключения. Они позволяют из уже имеющегося знания получать новые истины, и притом с помощью чистого рассуждения, без обращения к опыту, интуиции и т. п. Дедукция дает стопроцентную гарантию успеха, а не просто обеспечивает ту или иную — быть может, и высокую — вероятность истинного заключения.

Общая схема дедуктивного умозаключения:

а) если А, то В; А; следовательно В, где А и В — высказывания.

б) если А, то В; неверно В; значит неверно А.

Дедуктивный метод познания позволяет путем различных логических и математических преобразований получать большое множество следствий из относительно небольшого числа основных положений и законов данной теории.

Ценность дедукции состоит, во-первых, в том, что она дает во всех своих формах всегда достоверные, необходимые выводы. Во-вторых, дедуктивным способом можно оперировать информацией любого рода, выражать все богатство содержания нашего мышления. К дедукции можно свести все другие способы логического рассуждения. Умение рассуждать дедуктивным способом является фундаментальным свойством логического мышления. В-третьих, дедукция является основным способом построения доказательств, ведения споров, дискуссий.

Экспертный анализ. Все виды задач, связанных с принятием решений, в зависимости от возможностей математического описания (формализации) можно разделить на следующие виды:

- хорошо структуризованные задачи могут быть выражены формально (т.е. в виде уравнений, неравенств и т.д.);

- неструктуризованные задачи описываются только на содержательном уровне (в словесной форме);

- слабоструктуризованные задачи содержат как количественные, так и качественные элементы

Методы экспертного анализа (экспертных оценок) предназначены в основном для решения неструктуризованных задач. Эти методы могут применяться и для решения задач других видов, если математическое описание (формализация) задачи невозможно или очень сложно.

Методы экспертного анализа представляют собой совокупность процедур, направленных на получение от специалиста (эксперта) информации, необходимой для принятия решения. Эти методы основаны на опыте, знаниях и интуиции специалистов экспертов. Процесс принятия решения на основе этих методов не является строго формализованным и упорядоченным. Сам эксперт не всегда может четко объяснить процесс решения проблемы. Информация, полученная от экспертов, подвергается обработке на основе математических (статистических) методов.

Процесс принятия решения на основе методов экспертного анализа включает следующие основные этапы:

1) определение цели экспертизы;

2) формирование группы экспертов;

3) разработка сценария и процедур экспертизы;

4) сбор и анализ экспертной информации;

5) обработка экспертной информации;

6) анализ результатов экспертизы и принятие решения.

Методы экспертного анализа применяются для решения следующих задач:

• разработка и оценка экономических и технических проектов и программ (включая оценку их эффективности, стоимости, трудоемкости, сроков реализации и т.д.) и выбор лучших вариантов;

• оценка качества продукции и новой техники;

• научно-техническое и экономическое прогнозирование;

• перспективное и текущее планирование;

• классификация объектов по определенным признакам;

• выбор критериев в задачах многокритериального выбора решений и оценка важности этих критериев.

Контент-анализ. Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет. Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта — окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы — язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа — наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий — знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа — лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа — контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица — «предложение». Наконец, необходимо установить единицу счета — количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых Контент-анализ. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации — 12—16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200—600 текстов.

Необходимым условием является разработка таблицы контент-анализа — основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например, разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица — кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику — системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

 

где f — число положительных оценок; n — число отрицательных оценок; r — объем содержания текста, имеющего прямое отношение к изучаемой проблеме; t — общий объем анализируемого текста. В случае, когда число положительных оценок меньше, чем отрицательных,

 

Есть и более простые способы измерения. Удельный вес той или иной категории можно вычислить с помощью формулы К = число единиц анализа, фиксирующих данную категорию/общее число единиц анализа.