Требования, предъявляемые к выборке

К генеральной совокупности обычно применимо требование правильного определения ее КОНТУРА. Это означает, что исследователь обязан ответить на два вопроса: охватывает ли он в своих предположениях все возможные элементы генеральной совокупности, и нет ли элементов избыточных, лишних.

Приведем пример. Пусть перед нами стоит исследовательская задача определить, велик ли в некоем городе процент женщин, считающих свою семейную жизнь удовлетворительной? Не касаясь способов, как именно оценивать степень удовлетворенности, займемся определением характера самой генеральной совокупности. Очевидно, что мы получим искаженную картину, если примем за генеральную совокупность всех лиц женского пола, включая младенцев, детей и незамужних девушек. (Речь идет об удовлетворенности собственной семьей.) Однако мы так же ошиблись бы, если бы исключили вдов, престарелых женщин или женщин, состоящих в разводе, ведь мы помним, что по условию «задачи» нас интересует удовлетворенность семейной жизнью, а не только супружеством. Стало быть, не следует исключать из рассмотрения неполные семьи.

К выборке обычно предъявляются требования ВАЛИДНОСТИ и РЕПРЕЗЕНТАТИВНОСТИ.

Под ВАЛИДНОСТЬЮ понимается следующее. Буквально: выборка должна работать, то есть отражать все характеристики генеральной совокупности. Она не может быть «с живой картины списком бледным», в выборке не должны пропадать какие-то свойства, присущие генеральной совокупности в целом. Выборка – это модель того, что она представляет. (Нельзя выносить суждение о том, что все дно мирового океана покрыто галькой – на том основании, что вы сидите на пляже и перебираете в руках камешки.)

Пример. Вспомним нашего гипотетического наблюдателя, стоящего на улице и подсчитывающего процент проходящих мимо него мужчин и женщин. Если его задача в том, чтобы узнать: лица какого пола чаще ходят по этой улице, то он действует правильно. Но если задача в другом: определить больше ли ходит вообще по городу мужчин или женщин, то нашему экспериментатору надо бы пригласить помощников, которых он должен расставить и на центральных улицах и в «спальных районах» города, и на темных переулках. После подсчета ему придется объединить данные, причем в тех пропорциях, в каких описанные категории улиц представлены в его городе. Если же задача нашего любознательного исследователя состоит в том, чтобы узнать, кого вообще в городе больше – мужчин или женщин, то ему придется покинуть свой пост и лучше вместе с помощниками отправиться по разным домоуправлениям или паспортным столам. Это справедливо вот почему: если на дворе белый день, причем, рабочий, то вряд ли мимо наблюдателя будет ходить много служащих, матерей с грудными младенцами, дряхлых стариков и т.п. Иными словами, сформированная им выборка не будет отражать характеристик всей генеральной совокупности.

Требование РЕПРЕЗЕНТАТИВНОСТИ состоит в том, чтобы любой исследователь, желающий повторить этот эксперимент, имел возможность при сходных условиях сформировать подобную выборку (то есть выборку с теми же свойствами) и получить результат. Будет ли результат почти таким же или отличным – дело другое. Важно то, что условия эксперимента должны иметь возможность быть воспроизведенными.

Существует также требование НАДЕЖНОСТИ, но оно имеет отношение скорее к эксперименту в целом, нежели к формированию выборки. Состоит оно, во-первых, в возможности повторения эксперимента с получением близких (тех же) результатов, и, во-вторых, - в степени доверия к полученным результатам – точность, с какой эксперимент описал действительное положение вещей. Этот момент тесно связан с таким понятием, как «уровень статистической значимости».