Воспроизводимость результатов анализа и ее статистическая оценка

Результат анализа как случайная величина. Результат анализа, как и результат любого другого измерения, следует считать случайной величиной. Для этого есть две причины:

1) при каждом измерении на процесс неконтролируемо влияет множество непостоянно действующих факторов. Это приводит к случайным погрешностям, из-за которых результаты повторных измерений одной и той же величины не совпадают ни между собой, ни с истинным значением этой величины;

2) сам исследуемый объект может иметь индивидуальные особенности (внутреннюю неоднородность или нестабильность свойств во времени), из-за которых те его части, которые мы отбираем для проведения каждого анализа, случайным образом отличаются по своему составу от других частей и от усредненного состава объекта в целом.

Поскольку результаты единичных измерений и даже их среднее арифметическое являются случайными величинами, в аналитической химии пользуются статистическими методами, основанными на теории вероятностей.

Случайный характер результатов анализа вовсе не означает их хаотичности, произвольности. Анализ не может с одинаковой вероятностью дать любое значение х, от –∞ до +∞. Как и другие случайные величины, результат анализа имеет определенную область возможных значений. Так, при определении SiO2 в горной породе результат в любом случае попадет в интервал от 0 до 100 %. Вероятности получения разных результатов анализа (вариант) внутри области возможных значений также неодинаковы. Их можно установить опытным путем, для чего проводят большую серию повторных измерений и сопоставляют полученные результаты. Определяют, какие варианты появляются часто, а какие – очень редко. По этим данным рассчитывают, какова будет вероятность (у) получения той или иной варианты, если применять данную методику измерений. Нельзя лишь заранее указать, какой результат появится именно в данном измерении (первом, втором, третьем и т. п.).

Вероятности представляют в табличной форме, или с помощью графика, или с помощью математических формул – функций распределения. В этих формулах аргументом является х – значение случайной величины, а функцией у – вероятность получить при измерении именно это значение х.

Распределение результатов анализа при наличии случайных погрешностей. Несмотря на то, что существует множество методик измерений, они приводят лишь к нескольким функциям распределения результатов, т. е. в природе наблюдается лишь несколько видов зависимости у от х. От вида этой зависимости зависит способ статистической обработки результатов, получаемых с применением данной методики. Известны нормальное распределение (оно встречается чаще всего), логнормальное, равномерное, биноминальное, экспоненциальное, распределение Пуассона и некоторые другие, которые на практике встречаются редко. Нормальное распределение описывается функцией Гаусса:

у = f (х) = , (2.5)

где у – вероятность попадания варианты (единичного результата измерения) в бесконечно малый интервал от х до х + dх; s – стандартное отклонение, характеризующее воспроизводимость измерений по данной методике (см. формулу 2.4); m – математическое ожидание измеряемой случайной величины.

При отсутствии систематических ошибок математическое ожидание равно истинному значению измеряемой величины. Поскольку истинное значение, как правило, неизвестно, то в качестве оценки математического ожидания берут среднее арифметическое из всех вариант, полученных при многократном измерении этой величины ( ≈ μ). Точное совпадение и μнаблюдается только в отсутствие систематических погрешностей и только при бесконечно большом числе повторных измерений (т. е. в генеральной совокупности). Функцию (2.5) графически представляют гауссианой – симметричной кривой с единственным максимумом при х = m ≈ . Высота и полуширина некоторой гауссианы определяются величиной s; чем больше s, тем ниже и шире гауссиана. Таким образом, разные методики анализа приводят к однотипным, но не совпадающим между собой кривым (рис. 2.1).

 

Рис. 2.1. Распределение результатов анализа одного материала
по трем разным методикам

Во всех случаях наблюдается нормальное распределение.

При нормальном распределении любой измеряемой величины и в отсутствие систематических погрешностей получение заниженных или завышенных результатов равновероятно. Этому эксперимен-
тально установленному факту соответствует симметричность кривой Гаусса. Из формулы (2.5) следует, что при нормальном распределении малые отклонения х от истинного значения измеряемой величины более вероятны, чем большие, что также соответствует экспериментальным данным. По мере отдаления х от m расчетные значения вероятности (у) стремятся к 0, обе ветви гауссианы постепенно приближаются к оси. Даже при многократном повторении анализа значения х, сильно отличные от m, появляются очень редко.

Нормальное распределение результатов измерения (анализа) обычно наблюдается, когда на процесс измерения случайным образом влияет множество разных факторов близкой значимости, действующих непостоянно и несогласованно, причем воздействие одних факторов приводит к заниженным, а других – к завышенным результатам. В ходе каждого измерения действует своя комбинация факторов, их суммарный эффект приводит к случайным отклонениям х от m, имеющим разный знак и разную величину, но в целом подчиняющимся нормальному распределению. Если же случайные отклонения х от истинного значения в основном связаны с действием какого-то одного фактора, то характер распределения результатов измерения может и не оказаться нормальным. Чтобы предвидеть характер распределения в подобных случаях, нужно знать, какой фактор является основным и как именно он влияет на процесс измерения.

Другие функции распределения несимметричны, т. е. при проведении соответствующих измерений вероятности случайного получения завышенного или заниженного результата не одинаковы (например, так бывает при распределении Пуассона). При равномерном распределении все варианты внутри некоторого интервала равновероятны независимо от того, насколько они отличаются от истинного значения измеряемой величины.

Часто химик-аналитик может заранее предполагать, каким будет распределение результатов, полученных по некоторой методике. Так, на процесс титрования несогласованно влияет такое множество факторов, что результаты, полученные при многократном повторении титрования, обычно распределяются по нормальному закону. При определении микропримесей результаты повторных анализов иногда отличаются очень сильно (не на несколько процентов, а в несколько раз или даже на несколько порядков). В этих случаях обычно наблюдается логнормальное распределение: нормально распределены не сами значения х, а значения lg х. Результаты определения концентрации радиоактивных веществ с помощью счетчика Гейгера обычно распределены по закону Пуассона.

Если заранее не известно, к какому распределению вариант приводит выбранная методика анализа, характер распределения приходится устанавливать опытным путем. Для этого многократно повторяют процесс измерения («набирают статистику»). Получив выборку из 30–50 однотипных вариант, рассчитывают некоторые выборочные параметры, а затем сопоставляют их с теоретическими характеристиками разных распределений, прежде всего с характеристиками нормального распределения.

Выборочные параметры. Выборочные параметры вычисляют без априорных допущений о характере распределения вариант; это эмпирические характеристики. Самыми важными из них являются среднее арифметическое и стандартное отклонение.

Среднее арифметическое: . В отсутствие систематических погрешностей среднее арифметическое используют как оценку истинного значения измеряемой величины. При малых n не следует пренебрегать возможностью случайного отличия от μ, однако при увеличении числа повторных анализов среднее арифметическое постепенно приближается к истинному содержанию компонента (если распределение результатов анализа является нормальным). Влияние случайных погрешностей при повторении анализов и усреднении их результатов уменьшается, так как погрешности разного знака компенсируют друг друга. Именно поэтому анализы и другие измерения обязательно повторяют несколько раз (как правило, от 2 до 5), а в качестве конечного результата используют среднее арифметическое. Увеличение объема выборки после n = 20 практически не влияет на величину , поэтому дальнейших измерений можно не проводить.

Другие выборочные параметры характеризуют разброс вариант относительно некоторого центра рассеяния (почти всегда – относительно ). Эти параметры – дисперсия, стандартное отклонение, относительное стандартное отклонение, коэффициент вариации, размах и некоторые другие величины.

· Дисперсия, S 2 – характеристика воспроизводимости результатов измерений (анализов), рассчитываемая по формуле:

S 2 = . (2.6)

Формулу (2.6) применяют при n ≤ 30. Дисперсии используют при сравнении выборок.

· Стандартное отклонение, s – квадратный корень из дисперсии (см. формулу 2.3). Как уже отмечалось, параметр s характеризует разброс вариант в данной выборке, а тем самым – случайную погрешность результата анализа. Стандартное отклонение всегда положительно, его размерность та же, что и у самой измеряемой величины. Параметр s используют при расчете доверительных интервалов (см. раздел 2.5). Иногда стандартное отклонение называют средней квадратической ошибкой или средним квадратическим отклонением отдельного измерения.

· Относительное стандартное отклонение, sr – безразмерная величина. Ее находят делением s на . Этот важный показатель характеризует воспроизводимость (сходимость) результатов в данной серии измерений (анализов).

· Коэффициент вариации, W – относительное стандартное отклонение, выраженное в процентах. W = 100 sr = 100 s / . Чем больше sr и W, тем хуже воспроизводимость, тем больше разброс результатов повторных измерений (анализов).

Параметры, аналогичные выборочным, вычисляют и для генеральных совокупностей.

Используя этот термин, аналитики обычно имеют в виду совокупность всех результатов анализа, которые можно было бы получить при повторных определениях данного компонента в данном материале с применением данной методики. Характеристики генеральной совокупности – это пределы, к которым стремятся соответствующие выборочные параметры при увеличении n. Они характеризуют уже не отдельную выборку, а воспроизводимость (сходимость) любых данных, полученных с применением данной методики. А именно:

· дисперсия генеральной совокупности, s2 = lim S 2 при n ® ∞. Величину s2 находят по формуле (2.6), но единицей в знаменателе пренебрегают. Дисперсии используют при выявлении относительного вклада разных факторов в общую погрешность измерений.

· cтандартное отклонение генеральной совокупности, s = lim s при n ® ∞. Эту величину вычисляют по формуле (2.4). Если значение s известно, статистическая обработка всех дальнейших результатов анализа становится более простой и надежной;

· относительное стандартное отклонение генеральной совокупности, sr = lim sr при n ® ∞. Величину sr = s / или соответствующий ей коэффициент вариации указывают в описаниях методик измерений (анализов), а также в описаниях измерительных приборов. Если такие сведения в технической документации отсутствуют, то перед началом использования новой методики или нового прибора эти величины находят опытным путем, обрабатывая результаты большого числа повторных измерений.

 

Промахи.Расчет выборочных параметров нельзя проводить при наличии грубых промахов. Так называютрезультаты измерений, резко отличающиеся от всех других вариант той же выборки. Промахи отличаются от других вариант выборки гораздо сильнее, чем те различаются между собой. Промахи отягощены большими случайными погрешностями, причем факторы, вызывающие эти погрешности, отличны от факторов, вызывающих случайные погрешности других измерений той же серии. Обычно промах – следствие грубой ошибки исполнителя. Например, при проведении химического анализа исполнитель мог рассыпать одну из проб, ввести не тот реагент, неправильно записать показание прибора, допустить грубую арифметическую ошибку в ходе расчетов. Статистически обрабатывать выборку при наличии в ней промахов нельзя, их надо исключить, а потом рассчитывать выборочные параметры по оставшимся данным.

 

Пример 2.2. Объемы раствора кислоты, пошедшего на титрование одинаковых аликвот одного и того же раствора щелочи, равны (в мл): 19,9; 19,7; 0,2; 19,7; 19,6; 19,3; 19,8; 19,9. Третий результат объясняется тем, что перед титрованием аналитик ввел в соответствующую колбу индикатор и воду, но забыл внести туда анализируемый раствор. После исключения этого результата рассчитывают выборочные параметры: = 19,7; s = 0,21. В данном примере грубый промах был очевиден, но в других случаях для выявления промахов приходится использовать специальные приемы (см. 2.5).

 

С помощью выборочных параметров проверяют, подчиняется ли реальное распределение результатов анализа закону нормального распределения. Самый простой способ проверки– вычисление так называемых коэффициентов асимметрии и эксцесса. Этот способ детально описан в специальной литературе, в программу базового курса аналитической химии соответствующий материал не входит. Более надежным, но еще более сложным способом является определение близости эмпирического распределения вариант к теоретической кривой нормального распределения. Проверку выполняют по критерию Пирсона, используя компьютеры и стандартное программное обеспечение.

Оценка воспроизводимости. Естественно, разные методики химического анализа имеют разную воспроизводимость. Судить о воспроизводимости (сходимости) результатов, составляющих небольшую выборку, можно по величине относительного стандартного отклонения (sr) или по коэффициенту вариации (W). О воспроизводимости (сходимости) методики в целом судят по соответствующим показателям генеральной совокупности (например, по sr). Чем они меньше, тем лучше воспроизводимость и тем точнее анализ. Для экспресс-анализов характерны значения W порядка 10–30 %, рутинные анализы в заводских лабораториях, как правило, проводятся по методикам, для которых W = 1–5 %, а арбитражные анализы обычно характеризуются величиной W порядка 0,1 % и менее.

Независимо от вида и метода анализа, наблюдаются следующие закономерности.

1. Для данной методики величина sr довольно сложным образом зависит от концентрации определяемого компонента в исследуемом материале (рис. 2.2). Обычно в некотором диапазоне концентраций величина sr почти не меняется, но при выходе за эти границы в сторону меньших, а иногда и в сторону больших концентраций наблюдается резкое ухудшение воспроизводимости (рост sr). Причины этого явления для разных методов анализа различны и будут рассмотрены в соответствующих главах учебника. Наименьшее содержание определяемого компонента, допускающее проведение анализа с требуемой воспроизводимостью, называют нижней границей определяемых содержаний (НГОС). Аналогичным образом находят верхнюю границу (ВГОС). На рис. 2.2 показан графический способ их оценки. Существуют и другие способы.

 

Рис. 2.2. Связь воспроизводимости анализа с концентрацией определяемого компонента

Методику можно применять в количественном анализе в том случае, когда ожидаемое содержание компонента в анализируемом объекте попадает в «рабочую область» между нижней и верхней границами определяемых концентраций. Заметим, что обнаружить компонент можно и при его содержании, меньшем НГОС, но точное количественное определение его в этом случае невозможно. Кроме НГОС, существует понятие предел обнаружения (Сmin). Эти характеристики у одной и той же методики не совпадают, обычно НГОС в несколько раз выше предела обнаружения.

Естественно, каждая методика анализа имеет свои границы определяемых содержаний.

2. Сходимость результатов анализа (одна и та же проба, один прибор, одна методика, один и тот же исполнитель) всегда лучше, чем межлабораторная воспроизводимость (разные исполнители, разные приборы и разные методики). Стандартное отклонение в первом случае меньше. Если же результаты были получены не только по разным методикам, но и для разных проб одного материала, то разброс результатов станет еще большим, так как начнут сказываться случайные погрешности пробоотбора. Общая дисперсия результатов анализа равна сумме дисперсий, характеризующих каждую из стадий:

s2 = s21 + s22 + s23 + …. + s2n .

Вклад каждой стадии анализа (пробоотбора, пробообработки, измерения сигнала и т. п.) в общий разброс результатов можно выявить методами дисперсионного анализа (онине входят в программу данного курса).

3. Если взять несколько выборок, относящихся к одной и той же измеряемой величине и рассчитать средние арифметические по каждой выборке, то мы заметим, что значения также меняются от выборки к выборке (варьируют), но не так сильно, как значения x внутри каждой выборки. Можно рассчитать стандартное отклонение среднего результата, обозначая его символом . Для данной методики измерений величина в раз меньше, чем s – выборочное стандартное отклонение единичного результата. Именно поэтому рекомендуют анализировать несколько параллельных проб исследуемого материала и проводить несколько повторных измерений аналитического сигнала, а затем усреднять полученные результаты. Однако таким способом нельзя устранить или хотя бы уменьшить влияние систематических погрешностей.