Оценка разности генеральных средних
В биологических исследованиях особое значение имеет разность двух величин. По разности ведется сравнение разных популяций, рас, пород, сортов, линий, семейств, опытных и контрольных групп (метод групп). По разности ведется сравнение одной группы особей в разном возрасте, в разных сезонах года, в разных условиях (метод периодов). По разности выявляются результаты различных воздействий на биологические объекты. И во всех этих случаях возникает основной вопрос: насколько правильно выборочные данные отражают генеральные соотношения.
Если проведено сплошное исследование двух генеральных совокупностей, то разность между соответствующими средними определяется без какой бы то ни было ошибки репрезентативности: всякая генеральная разность полностью достоверна. Все другие категории ошибок такая разность может иметь.
Например, если в одном совхозе средний суточный привес каждого из откормочников за год был 810 г, а в другом – 800 г, то не может быть никакого сомнения в том, что в первом совхозе привес за данный год больше, чем во втором, и при том на полную величину полученной разности: 810 – 800 = + 10 г.
Совершенно по-другому оценивается разность между двумя выборочными средними. При анализе такой разности всегда возникает вопрос о ее достоверности, т. е. о том, правильно ли разность между двумя выборочными средними характеризует ту генеральную разность средних, которая имеется между двумя соответствующими генеральными совокупностями.
Например, в совхозе, разводящем одну породу свиней, при оптимальных условиях средний суточный привес за, год составляет 810 г. В соседнем совхозе, разводящем другую породу, при таких же оптимальных условиях средний суточный привес за год составляет 800 г. Можно ли на основании полученной разности (810 – 800= +10 г) заключить, что все откормочники первой породы при данных условиях будут давать привесы, большие на 10 г в сутки по сравнению с откормочниками второй породы? Такого заключения сделать пока нельзя.
В данном случае каждая из сравниваемых групп – это серийные выборки: первая из первой породы, вторая из второй породы.
Каждая из полученных средних (μ1 = 810 г и μ2 = 800 г) есть выборочная средняя и имеет свою ошибку репрезентативности. Поэтому и разность между ними также имеет ошибку репрезентативности. Выборочная разность характеризует различие между обеими генеральными совокупностями по изучаемому признаку всегда с ошибкой репрезентативности.
Предположим, в выборочном исследовании получилось, что выборочная средняя в опытной группе больше выборочной средней в контроле. Если при этом проверялось действие какого-нибудь агента, повышающего хозяйственную продуктивность особей, превышение опыта над контролем имеет большое производственное значение.
Но тут же возникает сомнение: а можно ли считать, что и во всей генеральной совокупности таких особей изученный агент будет оказывать такое же благоприятное действие. Как показала практика, положительные результаты при выборочном испытании любых воздействий далеко не всегда повторяются и при массовом их применении.
Многочисленные удовлетворения и разочарования при массовой проверке результатов выборочных исследований выявили особое свойство разности выборочных показателей. Свойство это заключается в том, что разность между двумя любыми выборочными показателями в некоторых случаях может совершенно правильно отражать по знаку генеральную разность, (разность между двумя соответствующими генеральными параметрами), что можно выразить следующей формулой:
(10.18)
Формула иллюстрирует соответствие того, что получилось в выборках (первая выборочная средняя оказалась больше второй), тому, что имеется в соответствующих генеральных совокупностях (в них тоже первая средняя больше второй).
Свойство выборочной разности правильно, с заданной надежностью оценивать генеральную разность можно обозначить термином достоверность выборочной разности.
В указанном смысле выборочная разность может быть достоверна или недостоверна.
Легко понять, что значит «разность достоверна». Если в выборочном исследовании оказалась разница между выборочными показателями, то такая же разница по знаку будет и между соответствующими генеральными параметрами. В таких случаях основной вывод выборочного исследования имеет не только частное значение для изученной группы объектов, но может быть обобщен и перенесен на соответствующие генеральные совокупности.
Труднее понять, что значит «разность недостоверна». Очень распространено ошибочное мнение, что наличие в выборках недостоверной разности свидетельствует об отсутствии разницы между генеральными параметрами. Такое правило не имеет никаких ни теоретических, ни практических оснований.
Если получена недостоверная разность между выборочными показателями, то это значит, что не получено никакого определенного ответа о разности между соответствующими генеральными параметрами. Это можно показать следующей формулой:
или или (10.19)
Если получена благоприятная по смыслу исследования разность между, например, двумя выборочными средними, но эта разность оказалась (на основе специального анализа) недостоверной, то это значит, что между соответствующими генеральными средними могут быть любые соотношения, а какие именно – неизвестно, но это не может служить доказательством отсутствия разницы между генеральными средними.
Имеется и другое неправильное толкование понятий достоверная и недостоверная разность. Некоторые авторы считают, что достоверная разность между выборочными показателями свидетельствует якобы о том, что выборки взяты из разных генеральных совокупностей, а недостоверная разность – о том, что выборки взяты из одной генеральной совокупности. Легко понять неприемлемость таких указаний для биологов.
Биолог всегда сравнивает различные, неодинаковые для него генеральные совокупности: разные виды, сорта, породы, разные совокупности по полу, возрасту, разные совокупности, подвергавшиеся и не подвергавшиеся воздействиям, разные совокупности по времени их исследования.
То, что это разные совокупности, определено еще до исследования и уже не требует выяснения. Что бы ни получилось в результате выборочного исследования, генеральные совокупности всегда останутся разными, только в одних случаях будет установлено их достоверное различие по изучаемому параметру, а в других случаях ничего не будет установлено: ни того, что эти разные генеральные совокупности имеют различные параметры (например, средние), ни того, что эти разные генеральные совокупности по данному параметру не различаются.