Статистика в аналитической химии

Март 8, 2021

Главная
Химия
Статистика в аналитической химии

Содержание

2. Определение понятия процесса измерения. Статистика в аналитической химии Химия, и в частности аналитическая химия, как и
3. Статистика в аналитической химии Использование статистики в химических, клинических и фармацевтических лабораториях является обычным делом. Поскольку
4. Если мы проводим эксперимент, то мы почти всегда получаем результат с погрешностью. Почему мы не получаем
5. Статистика в аналитической химии При оценивании величины систематической погрешности предполагается проводить эксперимент большое количество раз. Это
6. Иллюстрация систематической погрешности Статистика в аналитической химии 1. Производитель пипетки утверждает тот факт, что произведенная им
7. Статистика в аналитической химии Случайные и систематические ошибки в аналитической химии вызываются множеством различных причин. Вот
8. Статистика в аналитической химии Если отбросить ошибку пробоотбора, как непосредственно не относящуюся к методу анализа, то
9. Статистика в аналитической химии
10. Статистика в аналитической химии
11. Статистика в аналитической химии Основные статистические понятия в аналитическом измерении (генеральная совокупность и выборка, среднее, дисперсия
12. Статистика в аналитической химии Мера центральной тенденции любой выборки - это число, характеризующее выборку по уровню
13. Статистика в аналитической химии Медиана представляет собой срединное значение данных, расположенных в восходящем порядке. Если имеется
14. Статистика в аналитической химии Среднее Выборочное среднее (арифметическое среднее) это результат суммирования всех результатов и деления
15. Статистика в аналитической химии Среднее из n данных выбранных случайно из нормально распределенной популяции с μ
16. Статистика в аналитической химии Реальные данные могут быть нормально распределены, но часто распределение содержит данные, которые
17. Статистика в аналитической химии Стандартное отклонение и дисперсия Разброс генеральной совокупности, демонстрируемый «тучностью» колоколообразной кривой измеряется
18. Статистика в аналитической химии Относительное стандартное отклонение Относительное стандартное отклонение (RSD), известное также как коэффициент вариации
19. Статистика в аналитической химии В математической статистике есть так называемая центральная предельная теорема, которая гласит о
20. Статистика в аналитической химии
21. Статистика в аналитической химии Несколько огорчает наличие корня квадратного от n в уравнениях . Этот корень
22. Статистика в аналитической химии Доверительные интервалы и доверительные пределы Стандартное отклонение среднего говорит нам однозначно о
23. Статистика в аналитической химии Строгий расчет границ доверительного интервала случайной величины возможен лишь в предположении, что
24. Статистика в аналитической химии Параметры этой функции μ и σ характеризуют: μ - положение максимума кривой,
25. Статистика в аналитической химии Численные значения коэффициентов пропорциональности t были впервые рассчитаны английским математиком В.Госсетом, подписывавшим
26. Статистика в аналитической химии Величина меньше, чем s(x) (среднее точнее единичного). Для серии из n значений
27. Зачем нужно проводить испытание гипотез? Статистика в аналитической химии Неизменно помни, что природа - не бог,
28. Одним из применений анализа полученных данных является возможность дать ответы на вопросы о качестве данных или
29. Статистическая значимость, или так называемый Р - уровень значимости - это основной результат проверки статистической гипотезы.
30. Статистика в аналитической химии
31. Статистика в аналитической химии Проверка гипотез обычно проходит следующие этапы: 1. Определение используемой статистической модели. Здесь
32. Статистика в аналитической химии Односторонние и двусторонние критерии проверки значимости Если цель исследования состоит том, чтобы
33. Статистика в аналитической химии Статистические критерии - это инструмент, для того чтобы иметь возможность ответить на
34. Статистика в аналитической химии Если же есть дополнительная информация, например, из предшествующих экспериментов, на основании которой
35. Статистика в аналитической химии Выбор подходящего статистического метода для проверки гипотезы Критерий t-Стьюдента для одной выборки
36. Статистика в аналитической химии Критерий t-Стьюдента для зависимых выборок Этот метод позволяет проверить гипотезу о том,
38. Статистика в аналитической химии Что такое метод ANOVA ? ANOVA (Analysis of Variance) – это дисперсионный
39. Статистика в аналитической химии Однофакторный ANOVA В однофакторном ANOVA имеются уровни исследуемого фактора с повторными результатами
40. Статистика в аналитической химии Конкретная планировка представления данных ANOVA в межлабораторных сличительных испытаниях
41. Статистика в аналитической химии Этапы в вычислении ANOVA таковы:
42. Статистика в аналитической химии
43. Статистика в аналитической химии Таким образом, результат расчетов представляют в виде следующей таблицы где N- общее
44. Статистика в аналитической химии Остаточный средний квадрат является оценкой средней дисперсии результатов в пределах каждого уровня
45. Статистика в аналитической химии Матрица данных в этом случае будет иметь пять колонок (каждая пипетка) и
46. Статистика в аналитической химии Проверка на нормальность распределения данных Многие статистические параметры, используемые химиками – аналитиками,
47. Статистика в аналитической химии Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения
48. Статистика в аналитической химии Далее определяют вспомогательные данные для расчета наблюдаемого критерия согласия Пирсона χ2 .
49. Статистика в аналитической химии
50. Статистика в аналитической химии Критерий Шапиро-Уилка. Этот критерий является одним из наиболее мощных в большинстве случаев.
51. Статистика в аналитической химии Этот критерий применяется, когда выборка содержит малое количество наблюдений (n≤30). Рассмотрим алгоритм
52. Статистика в аналитической химии
53. Статистика в аналитической химии Имеется и полезная графическая процедура для испытания нормальности набора данных, которая может
54. Статистика в аналитической химии Если данные распределены нормально, то график должен быть линеен. Очевидно, что выпавшие
55. Статистика в аналитической химии Ранкит-график первичной обработки данных Очевидно, что точка 0.9083 М не является частью
56. Статистика в аналитической химии Повтор ранкит-теста для данных с первым удаленным выпавшим значением
57. Статистика в аналитической химии Завершающий ранкит-тест
58. Статистика в аналитической химии Очевидно, что точки-данные 0.092, 0.0936, 0.1177, 0.1219, 0.1222, и 0.1556 являются выпавшими
59. Статистика в аналитической химии Тесты на выпавшие значения Выпавшее значение, есть значение, которое не принадлежит распределению,
60. Статистика в аналитической химии Результат применения Excell для выполнения теста Грубба рассмотрим на следующем примере: Было
61. Статистика в аналитической химии
62. Статистика в аналитической химии Так как Gsuspect > Gcritical значение 16.65 мг/г является выпавшим и может
63. Статистика в аналитической химии Односторонний t - тест Систематическая погрешность в аналитической методике должна быть определена
64. ПРИМЕР : Содержание фтора в зубной пасте согласно метода измеряется с использованием ионселективного электрода. Выполнение измерения
65. Статистика в аналитической химии
66. Приписанное значение лежит непосредственно за 95% доверительного интервала, что дает нам возможность предположить, что имеется значимая
67. Статистика в аналитической химии Парный t - тест В некоторых случаях у нас нет такой роскоши,
68. Статистика в аналитической химии a атомно-абсорбционная спектрофотометрия. bКомплексонометрическое титрование.
69. Статистика в аналитической химии Вероятность того, что между методиками нет разницы, рассчитанная по представленным данным, составляет
70. Статистика в аналитической химии Наиболее часто используемые тесты однородности дисперсий двух и более выборок данных При
71. Статистика в аналитической химии
72. Статистика в аналитической химии
73. Статистика в аналитической химии Анализ однородности дисперсий по Бартлетту Назначение. Проверка гипотезы о принадлежности нескольких дисперсий
74. Статистика в аналитической химии Если рассчитанное значение χ2 больше или равно критическому значению, взятому с уровнем
75. Статистика в аналитической химии
76. Статистика в аналитической химии ANOVA в Excel Excel предлагает три варианта применения ANOVA посредством его надстройки
77. Статистика в аналитической химии
78. Статистика в аналитической химии
79. Статистика в аналитической химии C применением надстройки «Анализ данных» все значительно упрощается
80. Статистика в аналитической химии
81. Статистика в аналитической химии Результат с применением надстройки «Анализ данных»
82. Статистика в аналитической химии Таким образом значение F составляет 10.39062 с ассоциированной вероятностью 0.001473. Так как
83. Статистика в аналитической химии Реализация метода ANOVA с использованием статистических программых продуктов Minitab16 и Statistica 6.0
84. Статистика в аналитической химии
85. Статистика в аналитической химии После выбора вида статистических расчетов Stat -> ANOVA -> One-Way… В окне
86. Статистика в аналитической химии Результат работы модуля ANOVA будет выведен в окно отчетов «Session».
87. Статистика в аналитической химии Рассмотрим реализацию ANOVA с помощью Minitab 16 с набором даннных Unstacked (расположенных
88. Статистика в аналитической химии
89. Статистика в аналитической химии Результат работы модуля ANOVA будет выведен в окно отчетов «Session». После выбора
90. Статистика в аналитической химии Рассмотрим реализацию ANOVA с помощью Statistica 6.0 . Эта программа работает с
91. Статистика в аналитической химии
92. Статистика в аналитической химии
93. Статистика в аналитической химии
94. Статистика в аналитической химии
95. Статистика в аналитической химии * это непараметрический аналог парного критерия Стьюдента (t-критерий для зависимых выборок)
96. Статистика в аналитической химии Чтобы автоматизировать вычисление критических значений статистики W, необходимо определить свою пользовательскую функцию,
97. Статистика в аналитической химии Двухвыборочный критерий Вилкоксона Назначение. Проверка гипотезы о равенстве средних двух независимых выборок.
98. Статистика в аналитической химии
99. Статистика в аналитической химии Критерий T- Вилкоксона для парных наблюдений (одновыборочный критерий Вилкоксона, критерий знаковых рангов)
100. Статистика в аналитической химии Примечание. Данный критерий устойчив к умеренным отклонениям от принятых предпосылок. Критерий Вилкоксона
101. Статистика в аналитической химии
102. Статистика в аналитической химии Калибровка является сердцем химического анализа и процесса посредством которого отклик прибора (в
103. Статистика в аналитической химии Любое конкретное измерение (уi) будет подвержено погрешностям измерения, таким образом: Уі =
104. Статистика в аналитической химии Эти коэффициенты оценивают действительную функцию, ограниченную неминуемым разбросом, который возникает во время
105. Статистика в аналитической химии Стандартные отклонения могут быть вычислены и для коэффициентов : Стандартное отклонение определяемой
106. Статистика в аналитической химии Рассмотрим возможность реализации вышеприведенных расчетов в Excell на примере определения содержания нитрит-иона
107. Статистика в аналитической химии Для реализации вышеприведенных расчетов в Excell необходимо воспользоваться функцией-массивом – «ЛИНЕЙН» из
108. Статистика в аналитической химии После вызова функции «ЛИНЕЙН» появится окно задания необходимых входных диапазонов данных
109. Статистика в аналитической химии После вызова функции «ЛИНЕЙН» и задания необходимых данных, для корректного вывода расчетных
110. Статистика в аналитической химии Соответствие полученных данных функции «ЛИНЕЙН» параметрам линейной регрессии
111. Статистика в аналитической химии Получение расширенных параметров линейной регрессии, согласно ISO 11095:1996 «Linear calibration using reference
112. Статистика в аналитической химии
113. Статистика в аналитической химии
114. Статистика в аналитической химии Метод контроля стабильности калибровки, согласно ГОСТ Р ИСО 11095-2007 Если функция калибровки
115. Отбирают m RM так, чтобы соответствующие им принятые значения заполняли диапазон значений, характерных для нормальных режимов
116. Карты Шухарта Контрольные карты — график изменения параметров выборки, обычно средних и среднеквадратичного отклонения. Различают контрольные
117. Карты Шухарта Контрольные карты используются для оценки "контролируемости" или "неконтролируемости" процесса. Эту оценку можно получить: •
118. Карты Шухарта КОНТРОЛЬНАЯ КАРТА СРЕДНИХ АРИФМЕТИЧЕСКИХ Если генеральная совокупность имеет нормальное (или близкое к нормальному) распределение
119. Карты Шухарта Для построения графика, приведенного на рис., необходимо, чтобы значения μ и σ были известны.
120. Карты Шухарта 1. Через равные промежутки времени проводится выборка объемом n и рассчитывается выборочное среднее. 2.
121. Карты Шухарта Процедура ведения КК в сущности представляет собой не что иное, как проверку гипотез. Нулевая
122. Карты Шухарта Формулы расчета средней линии и границ для карт средних
123. Карты Шухарта Контрольные карты для индивидуальных значений (X) В некоторых ситуациях для управления процессами невозможно или
124. Карты Шухарта На основе скользящих размахов вычисляют средний скользящий размах R, который используют для построения контрольных
125. Карты Шухарта Во время использования карт индивидуальных значений необходимо учитывать тот факт, что : a) карты
126. Карты Шухарта
127. Карты Шухарта МЕТОД УПРАВЛЕНИЯ И ИНТЕРПРЕТАЦИЯ КОНТРОЛЬНЫХ КАРТ ДЛЯ КОЛИЧЕСТВЕННЫХ ДАННЫХ Система карт Шухарта опирается на
128. Статистика в аналитической химии Что такое – «Неопределенность» ? Понятие «неопределенность» (англ. «Uncertainty»), появилось более 30
129. Статистика в аналитической химии Рассмотрим теперь, как определяется неопределенность. Согласно EUROCHEM/CITAC Guide “Quantifying Uncertainty in Analytical
130. Статистика в аналитической химии Обсуждение погрешностей данное выше известно как "классический подход" к измерению. Он хорошо
131. Статистика в аналитической химии Использование «неопределённости» позволяет наглядно решать вопрос о соответствии (или несоответствии) измеренной характеристики
132. Графические методы выяснения источников неопределенности Диаграмма Исикавы
133. "Причинно-следственная диаграмма" («рыбий скелет») Автор метода: К. Исикава (Япония), 1952 г. Назначение метода Применяется при разработке
134. Общие правила построения Прежде чем приступать к построению диаграммы, все участники должны прийти к единому мнению
135. Достоинства метода Диаграмма Исикавы позволяет: стимулировать творческое мышление; представить взаимосвязь между причинами и сопоставить их относительную
136. Графические методы выяснения источников неопределенности
137. Авторы метода: В. Парето (Италия), 1897 г, М. Лоренц (США), 1979 г. Назначение метода Применяется практически
138. Общие правила построения диаграммы Парето Решить, какие проблемы (причины проблем) надлежит исследовать, какие данные собирать и
139. Достоинства метода Простота и наглядность делают возможным использование диаграммы Парето специалистами, не имеющими особой подготовки. Сравнение
140. Процесс оценки неопределенности согласно руководства EURACHEM /CITAC
141. Процесс оценки неопределенности согласно руководства EURACHEM /CITAC
142. Альтернативный процесс оценки неопределенности согласно руководства NORDTEST TR 537 В руководстве NORDTEST TR 537 «Handbook for
143. Современные методы оценки неопределенности Стандарт ISO/IEC 17025:2006 определяет международное признание результатов испытаний и калибровок лабораториями, получивших
144. Современные методы оценки неопределенности Основные термины и положения по оцениванию неопределенности измерений, согласно GUM «Guide to
145. Современные методы оценки неопределенности Стандартная неопределенность — неопределенность результата измерений, выраженная как стандартное отклонение. Суммарная стандартная
146. Современные методы оценки неопределенности Основные положения концепции неопределенности : 1. Все составляющие неопределенности в результате измерения
147. Современные методы оценки неопределенности 5. Интервальной оценкой неопределенности является расширенная неопределенность U, которую получают путем умножения
148. Современные методы оценки неопределенности 3. Коэффициенты чувствительности. Расчет их необходим для определения вклада неопределенности каждой входной
149. Современные методы оценки неопределенности
150. Современные методы оценки неопределенности Важным фактором корректной оценки неопределенности является составление модельного уравнения. Модельным уравнением является
151. Современные методы оценки неопределенности
152. Современные методы оценки неопределенности
153. Современные методы оценки неопределенности Недостатки подхода GUM к оценке неопределенности В основе общего подхода лежит т.н.
154. Современные методы оценки неопределенности Основываясь на указанных недостатках, было предложено применить метод статистического моделирования (метод Монте-Карло)
155. Современные методы оценки неопределенности 2. Расчет параметров бюджета неопределенности (расширенной и стандартной суммарной неопределенности, коэффициента охвата)
156. Современные методы оценки неопределенности - расширенную неопределенность для заданного уровня доверия. Для получения оценки расширенной неопределенности
157. Современные методы оценки неопределенности Схема реализации алгоритма Монте-Карло
158. Современные методы оценки неопределенности При реализации метода Монте-Карло в среде Excell устанавливают надстройку «Анализ данных», в
159. Современные методы оценки неопределенности 1. Генерируют массив из 10000 данных входной величины, оцениваемой по типу А.
160. Современные методы оценки неопределенности 2. Генерируют массив из 10000 данных входной величины, оцениваемой по типу В.
161. Современные методы оценки неопределенности 3. Продолжают генерирование массивов из 10000 данных входных величин, оцениваемых по типу
162. Современные методы оценки неопределенности 4. После того как будут сгенерированы все массивы входных величин, в колонке
163. Современные методы оценки неопределенности 5. Для получения результата по расчету расширенной неопределенности, скопированные данные в колонке
165. Современные методы оценки неопределенности Сколько значимых цифр? Для измерений, проводимых посредством современных приборов, цифры обычно выводятся
166. Чтобы дать ответ на этот вопрос следует воспользоваться руководством EURACHEM / CITAC Guide «Use of uncertainty
167. Вертикальные линии показывают ±U расширенную неопределенность для каждого результата и связанные кривой указывают на выведенную плотность
168. Начало зоны исключения находится в пределах спецификации L плюс значение g, (так называемой предохранительной полосы). Значение
169. В некоторых случаях спецификация устанавливает верхний и нижний пределы, например контроля состава. Рис 3 показывает зоны
170. Как согласуется погрешность с неопределенностью? Формулы пересчета параметров неопределенности в параметры погрешности :
171. Как согласуется погрешность с неопределенностью? Формулы пересчета параметров неопределенности в параметры погрешности :
172. Поэтапная валидация метода Валидация - процесс установления характеристик и ограничений метода, идентификации влияний, которые могут изменять
173. Поэтапная валидация метода Основополагающим документом по проведению валидации аналитических методов является руководство ЕВРАХЕМ.
174. Поэтапная валидация метода Важные характеристики валидации для различных типов испытания обычно не измеряется + обычно измеряется
175. Поэтапная валидация метода Специфичность (Specificity) (Селективность) Руководство ICH Q2A использует термин «специфичность», несмотря на то что,
176. Поэтапная валидация метода Например, в случае лекарственного препарата изготовленного из стандартизированого растительного экстракта специфичность аналитической методики
177. Поэтапная валидация метода
178. Поэтапная валидация метода
179. Поэтапная валидация метода В случае лекарственного препарата изготовленного из субстанции, полученной химическим синтезом специфичность аналитической методики
180. Поэтапная валидация метода
181. Поэтапная валидация метода
182. Поэтапная валидация метода Селективность в анализе может принимать две ступени : Качественная — ступень, в которой
183. Поэтапная валидация метода Диапазон (Range). Разработка метода измерения предполагает предварительный выбор рабочего диапазона Рабочий диапазон зависит
184. Поэтапная валидация метода С целью проверки однородности дисперсий десять раз параллельно измеряют для концентраций на нижнем
185. Поэтапная валидация метода Точность (Accuracy) и правильность (Trueness) Точность — близость соглашения между результатом испытания и
186. Поэтапная валидация метода 1. Метод с плацебо с нулевым содержанием определяемого компонента. В методе с плацебо
187. Поэтапная валидация метода 3. Метод сравнения Сравнение результатов аналитической методики с результатами второй, независимой и провалидированной
188. Поэтапная валидация метода
189. Поэтапная валидация метода Прецизионность (precision). Прецизионность аналитической методики выражает степень близости (степень дисперсии) между сериями измерений,
190. Поэтапная валидация метода Во избежание недоразумений, слово “точность”, которое иногда используется для перевода «precision», должно относиться
191. Поэтапная валидация метода Оценка и расчет результатов проводится путем вычисления среднего значения, стандартного отклонения, коэффициента вариации
192. Поэтапная валидация метода Пример: Если нормы количественного содержания действующего вещества в фармацевтической субстанции составляют 100 ±
193. Поэтапная валидация метода Принятые критерии для точности во многом зависят от типа анализа. Американской ассоциацией аналитической
194. Поэтапная валидация метода Для оценивания допустимых пределов сходимости и воспроизводимости иногда прибегают к так называемым критериям
195. Поэтапная валидация метода Воспроизводимость Воспроизводимость - это прецизионность в условиях, когда результаты испытания получены одним и
196. Поэтапная валидация метода Линейность Линейность аналитической методики доказана, если в выбранном диапазоне применения можно показать прямо
197. Поэтапная валидация метода Основные и статистически обоснованные принципы построения и оценивания калибровочных регрессионных зависимостей изложено в
198. Поэтапная валидация метода Тест Манделя. Во время статистической проверки на линейность, градуировочные данные используют для расчета
199. Поэтапная валидация метода Предел обнаружения (detection limit) Предел обнаружения отдельной аналитической методики представляет собой наименьшее количество
200. Поэтапная валидация метода Предел обнаружения (детектирования) для аналитического прибора LOD Предел обнаружения (детектирования) прибора — самое
201. Поэтапная валидация метода Для нехроматографических методов предел детектирования, выраженный как концентрация или количество , получают из
202. Поэтапная валидация метода Здесь калибровка выполняется с I независимыми калибровочными растворами (включая холостую пробу, если возможно
203. Поэтапная валидация метода Возврат (Recovery) Возврат (также употребляются термины «процентная мера правильности», «открываемость», «извлечение», «экстрагируемость».): частное
204. Поэтапная валидация метода Определение возврата добавкой активного ингредиента к плацебо (холостой пробе) Прибавьте точно установленное количество
205. Поэтапная валидация метода Определение возврата со стандартной добавкой Сделайте гомогенный образец плацебо (холостой пробы). Определите содержание
206. Поэтапная валидация метода Робасность Испытание на стабильность: внутрилабораторное исследование для изучения поведения аналитического процесса, когда производятся
207. Поэтапная валидация метода
208. Поэтапная валидация метода
209. Поэтапная валидация метода
210. Поэтапная валидация метода
211. Поэтапная валидация метода Итак, как же спланировать серии экспериментов для получения исчерпывающего отчета по валидации метода
212. Поэтапная валидация метода
214. Скачать презентацию

Слайд 2

Определение понятия процесса измерения.
Статистика в аналитической химии
Химия, и в частности

аналитическая химия, как и все точные науки опирается на измерение каких-либо величин. Процесс измерения, из-за своей распространенности представляется совершенно понятным действием. НО !

Всякое измерение невозможно без применения законов, относящихся к измерениям величин, и опирается на определенные теоретические предпосылки. Процесс получения количественной оценки измеряемых свойств объекта измерений опирается на несколько аксиом:
Аксиома 1. Измерение возможно при условии установления качественной определенности свойства, дающей возможность отличать его от других свойств, т.е. при условии выделения величины.
Аксиома 2. Измерение возможно при условии установления единицы, необходимой для измерения величины.
Аксиома 3. Измерение возможно при условии материализации (воспроизведения или хранения) единицы техническим средством.
Аксиома 4. Измерение возможно при условии сохранения неизменным размера единицы (в пределах установленной точности как минимум на срок, необходимый для измерений).
При несоблюдении хотя бы одного из этих условий, измерение не может быть выполнено. Аксиомы могут служить основой, на которую следует опираться, во–первых, при рассмотрении содержания понятия «измерение» и, во–вторых, при проведении четкой границы между измерением и другими видами количественного оценивания.

Слайд 3

Статистика в аналитической химии
Использование статистики в химических, клинических и фармацевтических лабораториях является

обычным делом.
Поскольку измеряемые данные получают в экспериментальных условиях, содержащих некоторую ошибку, статистические методы, хотя и не совершенны, являются наиболее эффективный путем осмысления данных.
Ситуация часто изображается, как :
T = t + e
Здесь, истинное, но неизвестное значение, полученное в процессе измерения, T, состоит из результата измерения образца , t, и случайной ошибки или вариации, e, возникающей при выполнении этого измерения.
Статистическая ошибка является проявлением случайной изменчивости, свойственной любой системе измерений, и не является промахом. Например, инкубационная температура для бактерий в инкубаторе, имеет нормальное случайное колебание ±1°C, которое рассматривается как статистическая ошибка. Статистическая ошибка – это не неправильное измерение или ошибочное измерение. Это, представление о неопределенности случайных колебаний.
Статистический анализ предоставляет возможность исследователю объяснить происхождение этой случайной ошибки.

Слайд 4

Если мы проводим эксперимент, то мы почти всегда получаем результат с погрешностью.

Почему мы не получаем истинное значение? Мы можем допустить погрешность при взвешивании, калибровке или даже при вычислениях. Повторный эксперимент может обнаружить эту погрешность. Первый тип погрешности, который можно назвать и ошибкой, называется грубая погрешность. А это действительно промах, и в случае такой погрешности ни какая книга по статистике или аналитической химии не в состоянии помочь её избежать (кроме простого совета - ☺- «тщательнее работать надо»).
С учетом того, что мы сами можем выполнить наш анализ не совсем правильно, второй возможностью внесения погрешности является и тот факт , что методика сама по себе может иметь «червоточинку» . В этом случае никакое количество повторов не может поправить ситуацию. Этот второй тип погрешностей называется систематической погрешностью и представляет собой постоянное отклонение от истинного значения. Систематическая погрешность может быть определена путем многократного измерения референсного материала (ОС). Разница между средним проведённых измерений и значением для референсного материала представляет собой систематическую погрешность. Всегда желательно знать источники систематической погрешности эксперимента и корректировать их при измерениях.

Статистика в аналитической химии

Три типа погрешностей (ошибок)

В мире термин «погрешность» указывает на некую неудачу, промах. В метрологии погрешность определяется как «результат измерения минус истинное значение измеряемой величины» и свободно от такого негативного подтекста. Погрешность в химическом анализе - это конкретная величина, которая может быть известна, только если известно истинное значение.

Слайд 5

Статистика в аналитической химии
При оценивании величины систематической погрешности предполагается проводить эксперимент большое

количество раз. Это необходимо еще и по причине вклада другого источника погрешности - случайной погрешности. Случайная погрешность это третий тип погрешности, который может быть ответственным за тот факт, что результат нашего эксперимента содержит погрешность даже после того как мы устранили грубые ошибки, повторяем эксперимент несколько раз, и все равно каждый раз имеем несколько иную величину. Подчас результат несколько больше ожидаемого, подчас несколько меньше.
Хорошей новостью в данном случае является то, что вычисляя среднее из большого числа результатов можно получить приемлемый ответ. Большие и меньшие значения взаимно нивелируются. Имеются мириады факторов, которые могут давать вклад в случайную погрешность: неспособность аналитика точно воспроизводить условия, флуктуации окружающей среды, округление при вычислениях, и, наконец, квантовая природа материи. Что не влияет на случайную погрешность так это изменения условий, вызывающих постоянный дрейф базовой линии прибора и старение хроматографической колонки (хотя если подумать, то и они могут опосредованно влиять на случайную погрешность).

Слайд 6

Иллюстрация систематической погрешности
Статистика в аналитической химии
1. Производитель пипетки утверждает тот факт, что

произведенная им пипетка, правильно заполненная до метки при 20 °С гарантирует объем примерно между значениями 9.98 и 10.02 мл. Отметим, что погрешность этого рода - систематическая погрешность.
2. Когда вы заполняете пипетку, то заполняете ли Вы ее каждый раз точно до одного и того же уровня? Серия из 10 экспериментов заполнения пипетки дистиллированной водой и взвешивание дает нам диапазон от 9.95 до 10.04 мл. Вклад аналитика в погрешность по определению случайный (если аналитик имеет верный глаз и необходимые знания, в противном случае он может, например, совмещать с меткой объема не нижний, а например верхний край мениска).
3. Вы знаете, что в процессе Вашего экспериментирования, температура в Вашей лаборатории может колебаться между 19.2 и 23.1°С а, соответственно , что объем 10 мл воды увеличится на 0.0021 мл при повышении температуры воды на каждый градус Цельсия. Если эксперимент занимает много времени для того, чтобы дать температуре меняться случайным образом вокруг некоторого среднего, то эти изменения дадут вклад в результаты весового измерения (пункт 2). Кроме того, кроме того случая, когда точная температура не составляет точно 20 °С, это также приведет к систематической погрешности.

Слайд 7

Статистика в аналитической химии
Случайные и систематические ошибки в аналитической химии вызываются множеством

различных причин. Вот основные источники ошибок:
Большинство исследуемых веществ надо рассматривать как неоднородные (негомогенные). Поэтому несколько небольших взятых из них частей — аналитических проб — могут не иметь одинакового состава. А значит, уже только по этой причине результаты анализа будут подвержены случайным колебаниям. Из-за неквалифицированного одностороннего отбора проб может отдаваться предпочтение отдельным компонентам, а в итоге — систематическое искажение состава пробы.
Все необходимые для анализа измеряемые величины, такие, например, как масса осадка или светопоглощение окрашенного раствора, можно определить лишь с ограниченной точностью. Эта точность задается применяемым методом измерения, характером измеряемой величины, а часто и субъективными причинами. Если исключить показания неправильно отрегулированных измерительных приборов и иные подобные отказы, то ошибки чаще всего проявляются в форме случайных отклонений. Их надо минимизировать выбором подходящих условий измерений .
В классических методах анализа часто исследуемые пробы подвергаются химическим реакциям, продукты которых характеризуются по виду, составу и массе. Обычно эти реакции рассматривают как равновесные, причем равновесие стремятся сдвинуть как можно дальше в сторону продуктов реакции. Несмотря на это, в ходе реакций возникают как случайные (например, колебания растворимости из-за различных концентраций растворяемых солей), так и систематические ошибки (например, из-за соосаждения). Задача аналитика состоит в том, чтобы подобрать для каждого конкретного случая наиболее подходящие реакции.

Слайд 8

Статистика в аналитической химии
Если отбросить ошибку пробоотбора, как непосредственно не относящуюся к

методу анализа, то общая ошибка складывается из ошибок измерений и ошибок, связанных с химическими реакциями. Как правило, ошибки измерений должны быть меньше, чем ошибки метода. В то время как ошибками измерений можно пренебречь, как это постоянно делается в физических исследованиях, для методических ошибок это не удается или удается лишь в исключительных случаях. Их описание, равно как и описание общей ошибки, возможно только с помощью методов математической статистики.
С понятиями систематической и случайной погрешности тесно связаны два важнейших метрологических понятия - правильность и воспроизводимость. Правильностью называется качество результатов измерения (или измерительной процедуры в целом), характеризующее величину систематической погрешности, воспроизводимостью - качество, характеризующее соответственно, значение случайной погрешности. Иными словами, правильность результатов - это их несмещенность, а воспроизводимость - их стабильность. Обобщающее понятие, характеризующее малость любой составляющей неопределенности - как систематической, так и случайной, - называется точностью. Мы называем результаты точными только в том случае, если для них мала как систематическая, так и случайная погрешность. Таким образом, правильность и воспроизводимость - это две составляющие точности, называемые поэтому точностными характеристиками.
В химической метрологии традиционно принято оценивать точностные характеристики по отдельности.

Слайд 9

Статистика в аналитической химии

Слайд 10

Статистика в аналитической химии

Слайд 11

Статистика в аналитической химии
Основные статистические понятия в аналитическом измерении (генеральная совокупность и

выборка, среднее, дисперсия , SD и RSD, степени свободы, доверительный интервал).

Генеральная совокупность и Выборка
Статистики называют бесконечное число результатов, которые могли бы быть получены , в отношении которых формулируется исследовательская гипотеза, и которые описываются функцией распределения вероятности -генеральной совокупностью.
Выборка - это ограниченная по численности группа объектов, специально отбираемая из генеральной совокупности для изучения ее свойств.
Целью многих методов анализа данных является оценка μ и σ из всего нескольких повторных измерений, которые и называются выборкой (sample).
Здесь имеется небольшая проблема в обозначениях, которая ощущается только англоязычными химиками. Они привыкли называть то что анализируют «sample», но и статистика называет выборку тоже «sample», поэтому возникает путаница. International Union of Pure and Applied Chemistry (IUPAC) рекомендует называть «то что анализируют» так, сначала слово «test» затем слово-характеристика материала, например, «test solutions» или «test extract», или «test tablets», слово «sample» зарезервировано за статистикой.

Слайд 12

Статистика в аналитической химии
Мера центральной тенденции любой выборки - это число, характеризующее

выборку по уровню выраженности измеренного значения. Существуют три способа определения «центральной тенденции», каждому из которых соответствует своя мера: мода, медиана и , собственно, - выборочное среднее.
Наиболее просто получаемой мерой центральной тенденции является мода.
Мода - это такое значение из множества измерений, которое встречается наиболее часто. Моде, или модальному интервалу признака, соответствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным.

Слайд 13

Статистика в аналитической химии
Медиана представляет собой срединное значение данных, расположенных в восходящем

порядке. Если имеется нечетное число данных, то это единственная срединная величина. Если имеется четное число данных, то медиана представляет собой среднее из двух срединных значений. Она робастна (устойчива), так как не важно насколько отвратительными являются одно или более экстремальных значений, так как они являются значениями в самом начале или самом конце списка. Их величина несущественна.
Медиана - это такое значение, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая - больше. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:
- если данные содержат нечетное число значений (8, 9, 10, 13, 15), то медиана есть центральное значение;
- если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посередине между двумя центральными значениями.

Xm – ранжированные данные
m - число измерений.
n - порядковый номер медианной варианты

Слайд 14

Статистика в аналитической химии
Среднее
Выборочное среднее (арифметическое среднее) это результат суммирования всех результатов

и деления на число данных (n):

Для нормально распределенных данных, по мере роста числа данных выборочное среднее
стремится к генеральному среднему μ. Генеральное среднее есть истинный результат при отсутствии систематической ошибки. Хотя единичный результат взятый из нормально распределенной генеральной совокупности вероятнее ближе к среднему.
Каждая мера центральной тенденции обладает характеристиками, которые делают ее ценной в определенных условиях.
Для номинальных данных, разумеется, единственной подходящей мерой центральной тенденции является мода, или модальная категория - та градация номинальной переменной,
которая встречается наиболее часто. Для порядковых и метрических переменных, распределение которых унимодальное и симметричное, мода, медиана и среднее совпадают. Чем больше отклонение от симметричности, тем больше расхождение между значениями этих мер центральной тенденции. По этому расхождению можно судить о том, насколько симметрично или асимметрично распределение. Однако использование среднего ограничивается тем, что на его величину влияет каждое отдельное значение. Таким образом, среднее значение весьма чувствительно к «выбросам» - экстремально малым или большим значениям переменной.

Слайд 15

Статистика в аналитической химии
Среднее из n данных выбранных случайно из нормально распределенной

популяции с
μ =10 а σ =1 как функция от n

Слайд 16

Статистика в аналитической химии
Реальные данные могут быть нормально распределены, но часто распределение

содержит данные, которые могут быть серьезно сдвинуты.
Если мы можем идентифицировать такие данные и удалить из последующего рассмотрения, то все хорошо. Иногда это возможно, иногда нет. Это может быть проблемой, потому что одно единственное негодное значение может серьезно расстроить вычисления среднего и стандартного отклонения. Оценки, которые могут сопротивляться определенному количеству плохих данных называются робастными и могут быть использованы в том случае, когда нет возможности обеспечить корректность характеристик обрабатываемых данных. Такими робастными оценками выступают - срединное значение упорядоченного набора данных (медиана) которая является робастной оценкой среднего и диапазон срединных 50 % данных (нормализованный интерквартильный диапазон) как робастная оценка стандартного отклонения. Робастные оценки имеют свою область применения, особенно тогда, когда необходимо сохранить все данные вместе, скажем в межлабораторных испытаниях, когда выпавший результат отдельной лаборатории нельзя просто так проигнорировать. Однако, робастные оценки не самые лучшие статистические характеристики и там, где можно, то следует использовать иные параметры распределения.
Интерквартильный диапазон (interquartile range (IQR)) это диапазон значений охватывающий 50% срединных данных. Три четверти IQR, называются нормализированным IQR и он служит для оценки стандартного отклонения.
Проблемой для IQR является то, что он не может быть вычислен для малых наборов данных, так как должно быть достаточно данных для определения квартилей (фрагментов упорядоченных данных, которые содержат одну четверть данных).
Интерквартильным размахом называется разность между третьей и первой квартилями, то есть x0.75 − x0.25.

Слайд 17

Статистика в аналитической химии
Стандартное отклонение и дисперсия
Разброс генеральной совокупности, демонстрируемый «тучностью» колоколообразной

кривой измеряется посредством стандартного отклонения SD или его квадрата дисперсии. Они определяются для выборки из (n) данных как:

СКО (SD (standard deviation))

Стандартное отклонение S , определенное в уравнении известно как выборочное стандартное отклонение так как оно указывает на выборку из n значений и является оценкой популяционного стандартного отклонения σ.

Дисперсия

Слайд 18

Статистика в аналитической химии
Относительное стандартное отклонение
Относительное стандартное отклонение (RSD), известное также как

коэффициент вариации (CV), это стандартное отклонение измерения выраженное в виде доли или процентной части от среднего:

Относительное стандартное отклонение аналитического результата представляется часто по причине того, что оно дает немедленное впечатление от точности измерения. Меньше чем 1% обычно рассматривается как очень хорошее для рутинных измерений, для которых оно чаще находится в диапазоне 1 - 5%.

Стандартное отклонение среднего
Выборочное среднее тем ближе к генеральному, чем больше число данных в выборке. А в качестве выражения этой уверенности можно определить «стандартное отклонение среднего» (standard deviation of the mean). Для объяснения этого, предположим, что мы усредняем четыре точки, затем еще четыре и т.д. Среднее из четырех точек образует группу (на жаргоне другую «популяцию») со своим собственным средним и стандартным отклонением, которое может быть связано со средним и стандартным отклонением исходного набора данных из которых эта выборка была взята.

Слайд 19

Статистика в аналитической химии
В математической статистике есть так называемая центральная предельная теорема,

которая гласит о том, что среднее из средних является генеральным средним и стандартное отклонение популяции средних из n данных (σn) связано с генеральным стандартным отклонением (σ) формулой:

Так называемое выборочное стандартное отклонение среднего определяется как :

Стандартное отклонение среднего таким образом также становится все меньше по мере того как число данных в выборке возрастает, что отражает рост нашей уверенности в среднем значении .

Слайд 20

Статистика в аналитической химии

Слайд 21

Статистика в аналитической химии
Несколько огорчает наличие корня квадратного от n в уравнениях

. Этот корень означает, что, если хочется уменьшить стандартное отклонение в два раза, то надо увеличить число измерений в четыре раза. Число повторов зависит от того, где и как будет использоваться результат, т.е.
Центральная предельная теорема также даeт аналитику еще один позитив. В большинстве случаев полученные химиком-аналитиком данные предположительно имеют нормальное распредление.
Но, к сожалению реальное распределение данных не так уж и нормально, но распределение средних по выборкам всегда стремится к нормальному распределению, даже если генеральная совокупность не является нормально распределенной. Таким образом нахождение средних по данным также помогает нам с анализом данных путем устранения озабоченности о том нормально или не нормально распределены данные в генеральной совокупности.

Слайд 22

Статистика в аналитической химии
Доверительные интервалы и доверительные пределы
Стандартное отклонение среднего говорит нам

однозначно о дисперсии (рассеивании) данных. Поэтому достаточно привести среднее значение и его стандартное отклонение (и число данных). Но более информативным является представление диапазона значений, которые охватывали бы некоторую часть данных (скажем 95 или 99%). Таким образом мы с некоторой долей скептицизма указываем конечный диапазон в котором с большой вероятностью находится истинное значение.
Число степеней свободы (degrees of freedom (df))
Число степеней свободы — одно из основных понятий в математической статистике. Это понятие трудно поддается строгому определению. В простых случаях число степеней свободы может быть интерпретировано как число переменных, которые могут быть произвольно присвоены при характеристике выборки. Другими словами, для выборки простейшей структуры (X1,X2,…….Xn) число степеней свободы равно разности между числом измерений и числом исследуемых параметров. В данном случае число измерений равно n, исследуемый параметр один (среднее значение), следовательно, число степеней свободы равно df= n -1.

Слайд 23

Статистика в аналитической химии
Строгий расчет границ доверительного интервала случайной величины возможен лишь

в предположении, что эта величина подчиняется некоторому известному закону распределения. Закон распределения случайной величины - одно из фундаментальных понятий теории вероятностей. Он характеризует относительную долю (частоту, вероятность появления) тех или иных значений случайной величины при ее многократном воспроизведении. Математическим выражением закона распределения случайной величины служит ее функция распределения (функция плотности вероятности) р(х).

Например, функция распределения, изображенная на рисунке означает, что для соответствующей ей случайной величины х наиболее часто встречаются значения находятся вблизи х = 10, а большие и меньшие значения встречаются тем реже, чем дальше они отстоят от 10.
В качестве примера не случайно приведена колоколообразная, симметричная функция распределения. Именно такой ее вид наиболее характерен для результатов химического анализа. В большинстве случаев закон распределения результатов химического анализа можно удовлетворительно аппроксимировать так называемой функцией нормального (или гауссова) распределения:

Слайд 24

Статистика в аналитической химии
Параметры этой функции μ и σ характеризуют: μ -

положение максимума кривой, т.е. собственно значение результата анализа, а σ - ширину "колокола", т.е. воспроизводимость результатов. Можно сказать, что среднее является приближенным значением μ, а стандартное отклонение s(x) - приближенным значением σ. Естественно, эти приближения тем точнее, чем больше объем экспериментальных данных, из которых они рассчитаны, т.е. чем больше число параллельных измерений n и, соответственно, число степеней свободы df. В предположении того факта, что, случайная величина х подчиняется нормальному закону распределения, то ее доверительный интервал рассчитывается как :
x ± t(P, df)·s(x)
Ширина доверительного интервала нормально распределенной случайной величины пропорциональна величине ее стандартного отклонения.

Площадь под кривой интерпретируется как вероятность или относительная частота.
Полезно знать, что если распределение является нормальным, то:
90% всех случаев располагается в диапазоне значений
М (среднее) ± 1,64 σ ;
95% всех случаев располагается в диапазоне значений
М (среднее) ± 1,96 σ ;
99% всех случаев располагается в диапазоне значений
М (среднее) ± 2,58 σ .

Слайд 25

Статистика в аналитической химии
Численные значения коэффициентов пропорциональности t были впервые рассчитаны английским

математиком В.Госсетом, подписывавшим свои труды псевдонимом Стьюдент, и потому называются коэффициентами Стьюдента. Они зависят от двух параметров: доверительной вероятности Р и числа степеней свободы df, соответствующего стандартному отклонению s(x).
Причина зависимости t от Р очевидна: чем выше доверительная вероятность, тем шире должен быть доверительный интервал с тем, чтобы можно было гарантировать попадание в него значения величины x. Поэтому с ростом Р значения t возрастают. Зависимость t от df объясняется следующим образом. Поскольку s(x) - величина случайная, то в силу случайных причин ее значение может оказаться заниженным. В этом случае и доверительный интервал окажется более узким, и попадание в него значения величины x уже не может быть гарантировано с заданной доверительной вероятностью. Чтобы "подстраховаться" от подобных неприятностей, следует расширить доверительный интервал, увеличить значение t - тем больше, чем менее надежно известно значение s, т.е. чем меньше число его степеней свободы. Поэтому с уменьшением df величины t возрастают.
Коэффициенты Стьюдента для различных значений Р и df являются табличной величиной.
Если единичные значения х имеют нормальное распределение, то и среднее тоже имеет нормальное распределение. Поэтому формулу Стьюдента для расчета доверительного интервала можно записать и для среднего:

Слайд 26

Статистика в аналитической химии
Величина меньше, чем s(x) (среднее точнее единичного). Для серии

из n значений :

Поэтому доверительный интервал для величины, расчитанной из серии n параллельных измерений, можно записать как :

При расчете доверительного интервала встает вопрос о выборе доверительной вероятности Р. При слишком малых значениях Р выводы становятся недостаточно надежными. Слишком большие (близкие к 1) значения брать тоже нецелесообразно, так как в этом случае доверительные интервалы оказываются слишком широкими, малоинформативными. Для большинства химико-аналитических задач оптимальным значением Р является 0.95. Именно эту величину доверительной вероятности (за исключением специально оговоренных случаев) мы и будем использовать в дальнейшем.

Слайд 27

Зачем нужно проводить испытание гипотез?
Статистика в аналитической химии
Неизменно помни, что природа -

не бог,
человек - не машина, гипотеза - не факт.
Дени Дидро

Слайд 28

Одним из применений анализа полученных данных является возможность дать ответы на вопросы

о качестве данных или о системе, которую эти данные описывают. В первую категорию попадают такие вопросы «распределены ли данные нормально?» и «имеются ли среди данных выпавшие значения?». Вопросы о системе могут быть такими: «Превышен ли уровень содержания примеси в лекарственном препарате?» или «дает ли новый метод такие же результаты как и традиционный метод?». Отвечая на эти вопросы мы определяем вероятность того, что представленные данные подтверждают правильность сформулированной гипотезы - следовательно «проверяем гипотезу».
Гипотеза, это утверждение, которое может быть истинным, а может быть ложным.
Обычно, гипотеза формулируется таким образом, чтобы имелась бы возможность вычислить вероятность (Р) (или протестировать статистический показатель, вычисленный из этих данных) и затем принять решение о том, - должна ли гипотеза быть принята (высокий уровень Р) или отвергнута (низкий уровень Р). Частный случай испытания гипотез - тест на значимость. Для этого случая реально выдвигается гипотеза о том, что значимой разницы нет, а имеющаяся разница возникает от случайных эффектов: это называется нуль-гипотеза (НО). Если вероятность, того что данные соответствуют выдвинутой нуль-гипотезе, попадает в заранее определенное значение (скажем 0.05 или 0.01), то гипотеза отвергается с этой вероятностью. Таким образом, р < 0.05 означает, что, если бы нуль-гипотеза была справедлива, то наблюдаемые значения статистического параметра, вычисленного из этих данных в неком диапазоне, составляли бы менее чем 5% экспериментов. При использовании этого утверждения для проверки значимости какого-нибудь статистического показателя заранее должно быть принято решение о том уровне вероятности ниже которого нуль-гипотеза отвергается и делается заключение о значимости разности.

Статистика в аналитической химии

Слайд 29

Статистическая значимость, или так называемый Р - уровень значимости - это основной

результат проверки статистической гипотезы. Говоря техническим языком, это вероятность получения данного результата выборочного исследования при условии, что на самом деле для генеральной совокупности верна нулевая статистическая гипотеза - то есть нет никакой связи. Иначе говоря, это вероятность того, что обнаруженная связь или зависимость носит случайный характер, а не является свойством совокупности. Именно статистическая значимость, Р - уровень значимости является количественной оценкой надежности связи: чем меньше эта вероятность, тем надежнее связь.
Для решения вопроса о том, что такое - разумный уровень вероятности принятия или отвержения гипотезы, т.е., насколько значимо «значимое», следует рассмотреть два сценария, в которых может быть принято неправильное решение. Первый - мы отвергаем гипотезу, когда она на самом деле верна (это т.н. ошибка Типа I). В биологических науках ошибка Типа I часто называется ложно отрицательным результатом. Здесь заключение о том, что проверяемая разница находится вне допустимых пределов уровня, который можно ожидать на основе нормального распределения, соответствует нуль-гипотезе, когда на самом деле Но истинна. Второй сценарий противоположен этому, он состоит в том, что тест значимости приводит аналитика к ошибочному принятию Но, в то время как она ложна (ошибка Типа II). Ошибка Типа II знакома биологам (врачам, фармацевтам и прочим) как ложно положительный результат.

Статистика в аналитической химии

Слайд 30

Статистика в аналитической химии

Слайд 31

Статистика в аналитической химии
Проверка гипотез обычно проходит следующие этапы:
1. Определение используемой

статистической модели. Здесь выдвигают некоторый набор предпосылок относительно закона распределения случайной величины и его параметров. Например, закон распределения нормальный, величины независимы и пр.
2. Формулируют Н0 и Н1.
3. Выбирают критерий (критериальную статистику), который подходит к выдвинутой статистической модели.
4. Выбирают уровень значимости α в зависимости от требуемой надежности выводов.
5. Определяют критическую область для проверки Н0. Если значение критерия попадает в эту область, то Н0 отклоняется. При условии, что Н0 верна, вероятность попадания в критическую область равна α. Вид этой области (односторонняя или двухсторонняя) зависит от принятой Н0.
6. Рассчитывают значение выбранного статистического критерия для имеющихся данных.
7. Рассчитанное значение критерия сравнивают с критическим (иногда называемым табличным) и затем решают принять или отклонить Н0.

Слайд 32

Статистика в аналитической химии
Односторонние и двусторонние критерии проверки значимости
Если цель исследования

состоит том, чтобы выявить различие параметров двух генеральных совокупностей, которые соответствуют различным ее естественным условиям , то часто неизвестно, какой из этих параметров будет больше, а какой меньше. Например, если интересуются вариативностью результатов в контрольной и экспериментальной выборках, то, как правило, нет уверенности в знаке различия дисперсий или стандартных отклонений результатов, по которым оценивается вариативность. В этом случае нулевая гипотеза состоит в том, что дисперсии равны между собой, а цель исследования — доказать обратное, т.е. наличие различия между дисперсиями. При этом допускается, что различие может быть любого знака. Такие гипотезы называются двусторонними.
Но иногда задача состоит в том, чтобы доказать увеличение или уменьшение параметра; например, средний результат в экспериментальной выборке выше, чем контрольной. При этом уже не допускается, что различие может быть другого знака. Такие гипотезы называются односторонними.
Критерии значимости, служащие для проверки двусторонних гипотез, называются двусторонними, а для односторонних — односторонними.

Слайд 33

Статистика в аналитической химии
Статистические критерии - это инструмент, для того чтобы иметь

возможность ответить на вопросы типа :
- Как точно выполнены анализы?
- Сколько анализов мне придется сделать, чтобы преодолеть проблемы неоднородности образцов
или аналитические ошибки?
- Продукт соответствует спецификации?
- С какой уверенностью могу утверждать, что предельное содержание превышено?
- Какой метод точнее и на нем следует остановиться (критерии на основании которых был выбран
тот или иной метод) ?
Возникает вопрос о том, какой из критериев следует выбирать в том или ином случае. Ответ на этот вопрос находится за пределами формальных статистических методов и полностью зависит от целей исследования. Ни в коем случае нельзя выбирать тот или иной критерий оценивания после проведения эксперимента, поскольку это может привести к неверным выводам.
Если до проведения эксперимента допускается, что различие сравниваемых параметров может быть как положительным, так и отрицательным, то следует использовать двусторонний критерий.

Слайд 34

Статистика в аналитической химии
Если же есть дополнительная информация, например, из предшествующих экспериментов,

на основании которой можно сделать предположение, что один из параметров больше или меньше другого, то используется односторонний критерий.
Когда имеются основания для применения одностороннего критерия, его следует предпочесть двустороннему, потому что односторонний критерий полнее использует информацию об изучаемом явлении и поэтому чаще дает правильные результаты.
Риск одностороннего критерия в том, что он может назвать значимой переменную, которая не является значимой на самом деле. Односторонний критерий – это шанс назвать вашу переменную значимой, когда двусторонний критерий не срабатывает.
Двусторонние тесты более строгие в отличие от односторонних. Коэффициент может быть незначим при двустороннем тесте и значим при одностороннем, поэтому использование односторонних тестов может оказаться полезным, так как хочется иметь значимые коэффициенты.
Если односторонний тест не позволил отвергнуть нулевую гипотезу, то есть значимость коэффициента обосновать не удалось, то более строгий двусторонний тест также не отвергнет нулевую гипотезу, и коэффициент является незначимым.

Слайд 35

Статистика в аналитической химии
Выбор подходящего статистического метода для проверки гипотезы
Критерий t-Стьюдента для

одной выборки
Данный метод позволяет проверить гипотезу о том, что среднее значение изучаемого признака отличается от некоторого известного значения. Исходное предположение – распределение признака в выборке приблизительно соответствует нормальному.
Критерий t-Стьюдента для независимых выборок
Данный метод сравнения позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга.
Исходные предположения :
одна выборка извлекается из одной генеральной совокупности, а другая выборка, независимая от первой, извлекается из другой генеральной совокупности;
распределение признака в обеих выборках приблизительно соответствует нормальному;
дисперсии признака в 2-х выборках примерно одинаковы (гомогенны).
Альтернатива методу – непараметрический U-критерий Манна-Уитни (если распределение признака хотя бы в одной выборке отличается от нормального или дисперсии статистически достоверно различаются).
Результатом данного анализа будет наличие или отсутствие достоверного различия между двумя выборками измерений, учитывая, конечно, уровень достоверности (p<0,05).

Слайд 36

Статистика в аналитической химии
Критерий t-Стьюдента для зависимых выборок
Этот метод позволяет проверить

гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Зависимая выборка – когда определенный признак измерен на одной и той же выборке дважды, например, до и после воздействия, лечения и т.п.
Исходные предположения:
каждому представителю одной выборки поставлен в соответствие представитель другой выборки;
данные двух выборок положительно коррелируют;
распределение признака в обеих выборках приблизительно соответствует нормальному.
Альтернатива методу – непараметрический критерий T - Вилкоксона (если распределение признака хотя бы в одной выборке отличается от нормального и t-критерий Стьюдента для независимых выборок (если данные для двух выборок не коррелируют положительно).
Сравнение дисперсий 2-х выборок по критерию Фишера.
Данный метод позволяет проверить гипотезу о том, что дисперсии 2-х генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Ограничения метода - распределения признака в обеих выборках не должны отличаться от нормального.
Альтернативой сравнения дисперсий является критерий Ливена, для которого нет необходимости в проверке на нормальность распределения.
Данный метод может применяться для проверки предположения о равенстве (гомогенности) дисперсий перед проверкой достоверности различия средних по критерию Стьюдента для независимых выборок разной численности.

Слайд 37

Слайд 38

Статистика в аналитической химии
Что такое метод ANOVA ?
ANOVA (Analysis of Variance) –

это дисперсионный анализ.
ANOVA это рабочая лошадка использования статистики для сравнения средних и определения эффектов влияния факторов на результаты измерения (т.е., чего угодно, что может изменяться или измеряться и при этом влиять на результаты эксперимента).

ANOVA, может разрешить вопрос о наличии значимого эффекта, вызываемого фактором для которого мы имеем какое-то количество наборов данных. ANOVA основывается на понимании двух вещей. Во-первых, того как дисперсии различных компонентов могут комбинироваться, давая общую дисперсию данных. Во-вторых, разница средних может привести к увеличению разброса комбинированных результатов, что может детектироваться в терминах возрастания дисперсии.
Слово «фактор» используется для указания на качество, которое исследуется. Примером может служить исследование влияния изменения полярности растворителя на результаты ВЭЖХ анализа. Фактором в данном случае является полярность растворителя, и мы можем сделать измерения, например, используя три растворителя с различной полярностью. В этом случае мы используем одно-факторный ANOVA, так как имеется только один исследуемый фактор - полярность растворителя.
То насколько изменяется измеряемая величина при изменении фактора имеет название «эффект» фактора. Часто в ANOVA мы всего лишь интересуемся проверкой того, имеется ли вообще какой-либо эффект.

Слайд 39

Статистика в аналитической химии
Однофакторный ANOVA
В однофакторном ANOVA имеются уровни исследуемого фактора с

повторными результатами для этих уровней. Например, мы можем оценить качество работы трех лабораторий, которые должны выполнить двукратный анализ идентичных образцов.
Таким образом, имеется один фактор - «лаборатория» для которого мы имеем три уровня - лаборатория А, лаборатория В и лаборатория С. Данные (результат каждого измерения) размещаются в матрицу с уровнями фактора в каждом столбце и повторами с каждой строке.

Общая планировка представления данных в однофакторном ANOVA

Слайд 40

Статистика в аналитической химии
Конкретная планировка представления данных ANOVA в межлабораторных сличительных испытаниях

Слайд 41

Статистика в аналитической химии
Этапы в вычислении ANOVA таковы:

Слайд 42

Статистика в аналитической химии

Слайд 43

Статистика в аналитической химии
Таким образом, результат расчетов представляют в виде следующей таблицы
где

N- общее число данных, k – число уровней фактора

Слайд 44

Статистика в аналитической химии
Остаточный средний квадрат является оценкой средней дисперсии результатов в

пределах каждого уровня фактора. В случае повторяющихся аналитических результатов представляет собой дисперсию повторяемости.
ANOVA, таким образом, представляет собой полезный способ оценки точности измерения. Обычно нас интересуют различия среди наших факторов, например, «Какая лаборатория лучше сработала на межлабораторных сличительных испытаниях - А или лаборатория В?»
К сожалению SSC сам по себе не сообщает нам ответ, так как этот критерий включает дисперсию измерения. Каждое измерение имеет свою неопределенность. Проверка на значимость различий требует от нас сравнения средних квадратов между факторами и в пределах факторов. Если нет эффекта то SSC и SSr будут одинаковыми. Таким образом если мы хотим выяснить уровень значимости между уровнями фактора и повторяемостью, т.е. «SSc значимо больше чем SSr ?», то необходимо определить связанную вероятность для (F- критерия) с соответствующими степенями свободы (df1, df2), где для ANOVA df1 - межфакторная степень свободы (k-1) и df2 это внутрифакторная степень свободы (N - k).
Хотя ANOVA и может определить значимость эффекта фактора, но если имеется более чем два уровня фактора, то ANOVA не может определить какой из уровней значимо дает вклад в разницу (через которую определяется значимость). Например, предположим, что мы используем ANOVA для решения вопроса о том, имеется или нет значимая разница среди дозируемых объемов для серии из 5 или 10 мл пипеток, путем взвешивания десяти выпущенных объемов от каждой пипетки.

Слайд 45

Статистика в аналитической химии
Матрица данных в этом случае будет иметь пять колонок

(каждая пипетка) и десять строк (повторы), т.е. всего 50 данных. Если ANOVA приводит к заключению, что имеется существенная разница, то неизвестно это одна пипетка отличается от остальных четырех, или более одной? Разумная идея выяснения, какая же пипетка или пипетки отличаются от остальных, может быть реализована т.н. методом наименьшей значимой разницы (least significant difference (LSD)). ANOVA дала внутрифакторное стандартное отклонение ( ) , которое в этом случае является повторяемостью дозирования и взвешивания объема (Sr). Разница между средними любых двух колонок данных, как предполагается, имеет стандартное отклонение где n представляет собой число повторов. 95% доверительный интервал разности между любыми двумя средними составляет , где значение t получено для 45 степеней свободы (N = 50 - 5 =45). Число степеней свободы 45 так как имеется 50 данных и каждый уровень фактора (которых всего 5) отнимает одну степень свободы. Значение представляет собой LSD т.е. максимальная разность между средними, которая будет восприниматься как несущественная. Если средние по всем колонкам упорядочить в возрастающем порядке величины, то любая разность между последовательными средними большая чем LSD свидетельствует о наличии значимой разницы.

Слайд 46

Статистика в аналитической химии
Проверка на нормальность распределения данных
Многие статистические параметры, используемые химиками

– аналитиками, основаны на допущении, что данные распределены нормально.

Некоторые примеры применения статистических вычислений к аналитической практике (Excell)

Иногда, в случае стандартного распределения средних, данные имеют тенденцию к нормальному распределению согласно теории, но чаще всего мы просто скрещиваем пальцы и используем нормальное распределение. Хотя и нет метода, который бы по трем-четырем значениям смог дать вразумительное свидетельство о распределении, но все же имеются тесты по подтверждению нормального распределения для наборов данных для минимум 10 значений.
Критерий согласия Пирсона
Статистикой критерия Пирсона служит величина

χ2 ≤ χ2α

где pj - вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x).

Слайд 47

Статистика в аналитической химии
Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о

соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров. В этом заключается его универсальность.
Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов.
Однако содержание какого-либо химического вещества или элемента в препарате не является дискретной величиной. Фактически оно (содержание) величина непрерывная. Исходя из этих соображений и определяют фактические границы интервалов Хi min ÷ Хi max . Следующий этап расчетов заключается в определении вероятности попадания нормальной случайной величины Хi с предполагаемыми средним значением Xср и среднеквадратичным отклонением SD в заданные интервалы. Иногда для этого используется функция Лапласа для нормализованной случайной величины. Однако, пользуясь современными математическими пакетами, этого можно не делать. Так, в Excel существует функция НОРМРАСП(x; xср; σ; Интегральная). Функция НОРМРАСП(x; xср; σ; 1) возвращает вероятность того, что нормально распределенная случайная величина при среднем xср и среднеквадратичном σ окажется не больше значения Хi. Используя ее расчитывают значение интегрльной функции на границах интервалов F(Хi min )÷ F(Хi max).
Затем необходимо подсчитать общую сумму анализируемых наблюдений n = ∑ni , ну и общую сумму наблюдаемых вероятностей. При неукоснительном использовании критерия согласия Пирсона общая сумма наблюдаемых вероятностей должна быть равна 1. В нашем случае этого не происходит. Это обусловлено применяемым для проверки на нормальность методом построения гистограмм. В связи с этим рассчитывают еще одну величину - предполагаемое общее количество испытаний n’. Эту величину определяют по формуле :

Слайд 48

Статистика в аналитической химии
Далее определяют вспомогательные данные для расчета наблюдаемого критерия согласия

Пирсона χ2 .
Теперь наблюдаемое значение критерия χ2 необходимо сравнить в критическим значением. Уровень значимости, обычный для аналитических исследований принимают равным α = 0.05.
Количество степеней свободы равно количеству наблюдаемых интервалов (в примере = 9 уменьшенному на количество определенных параметров (2, так как определили для выборки среднее и среднеквадратичное отклонение) и на 1: k = 9 - 2 - 1 = 6.
Для уровня значимости α = 0.05 и числа степеней свободы k = 6 определяют критическое значение χ2 - статистики используют либо табличные данные, либо функцию Exсel ХИ2ОБР(α; k). Условие χ2 набл. ≤ χ2 крит. выполняется, следовательно гипотезу о нормальности закона распределения для исследуемой выборки отвергать нет основания.

Слайд 49

Статистика в аналитической химии

Слайд 50

Статистика в аналитической химии

Критерий Шапиро-Уилка.
Этот критерий является одним из наиболее мощных

в большинстве случаев. Статистика W вычисляется по формуле :
W = b2 / S2
где, S2 = Σ (xi-µ)2 , b = Σ an-i+1(xn-i+1-xi), µ - среднее выборки, an-i+1 некоторые константы
Для удобства расчета этого критерия была выведена полезная аппрокисмация, позволяющая применить критерий Шапиро-Уилка без помощи таблиц. Для α = 0,05 предлагается статистика

Если W1 < 1 то нулевая гипотеза нормальности распределения случайных величин отклоняется. В случае вычисления критерия согласно ГОСТ ИСО 5479-2002 его величину сравнивают с табличной и если величина расчитанного критерия больше табличного, то гипотеза о нормальном распределении данных принимается с уровнем значимости 0,05.

Слайд 51

Статистика в аналитической химии

Этот критерий применяется, когда выборка содержит малое количество

наблюдений (n≤30).
Рассмотрим алгоритм применения этого критерия:
1. Проранжировать данные расчётной таблицы в неубывающем порядке.
2. Получить разности между крайними значениями.
Например, из самого большого по значению наблюдения вычитают самое наименьшее, затем из второго по величине – второе по наименьшему значению, и т. д. Таким образом, Δj=Xn-j - Xj
3. Полученные разности Δj умножить на табличные коэффициенты, находимые в зависимости от числа наблюдений и порядкового номера разности.
4. Найти b - сумму умножений, полученную в пункте 3.
5. Найти СКО исходных данных.
6. Рассчитать величину критерия W по формуле: W=b2/SD2
Если Wрасчит.>Wкрит., то принимается нулевая гипотеза о нормальности распределения.

Слайд 52

Статистика в аналитической химии

Слайд 53

Статистика в аналитической химии
Имеется и полезная графическая процедура для испытания нормальности набора

данных, которая может быть реализована в Excel. Называется она Ранкит-методом (Rankit method).
Процедура, построена для n числа данных и заключается в следующих операциях :
1. Необходимо рассортировать данные в порядке возрастания.
2.Вычислить кумулятивную частоту каждого значения, т.е., сколько данных имеют равное или меньшее значение.
3. Вычислить нормализованную кумулятивную частоту = кумулятивная частота/(n +1).
4. Вычислить значение нормальной функции плотности вероятности, связанной с нормализованной кумулятивной частотой для каждого значения (= z).
5. Построить график зависимости z от исходных данных.

Графическая ранкит- процедура

Слайд 54

Статистика в аналитической химии
Если данные распределены нормально, то график должен быть линеен.

Очевидно, что выпавшие значения будут видны как точки на экстремумах оси х, т.е. при значениях много больше, чем можно предположить.

Данные от 25 участников ППТ по титрованию

Слайд 55

Статистика в аналитической химии
Ранкит-график первичной обработки данных
Очевидно, что точка 0.9083 М не

является частью нормального распределения, так как она лежит очень далеко от прямой линии, определяющейся другими точками. Можно предположить, что и другие точки также не являются частью нормального распределения, так, что после удаления 0.9083 М построение Ранкит-графика необходимо продолжить.

Слайд 56

Статистика в аналитической химии
Повтор ранкит-теста для данных с первым удаленным выпавшим значением

Слайд 57

Статистика в аналитической химии
Завершающий ранкит-тест

Слайд 58

Статистика в аналитической химии
Очевидно, что точки-данные 0.092, 0.0936, 0.1177, 0.1219, 0.1222, и

0.1556 являются выпавшими значениями. Удаление этих точек и повторное выполнение вычислений дает Ранкит-график, представленный на последнем рисунке, где наконец видно, что точки расположены на прямой линии. В результате только 18 точек являются частью нормального распределения, а 7 выпали из нормального распределения.
Глядя на итоговый график, представленный на рисунке с удаленными всеми выпавшими значениями, можно видеть, что это практически прямая линия. Ваша способность определить линейность на глаз весьма надежна и, вследствие своей простоты этот метод используется наиболее часто.

Слайд 59

Статистика в аналитической химии
Тесты на выпавшие значения
Выпавшее значение, есть значение, которое не

принадлежит распределению, к которому принадлежат остальные данные. Если включить его в вычисление статистического параметра, такого как среднее или стандартное отклонение, то полученный результат не будет представлять этот параметр.

Поэтому, важно, чтобы выпавшие значения были идентифицированы и исключены из дальнейших вычислений. При повторяющихся химических анализах, выпавшие значения неизбежно появляются на экстремумах (т.е. являются или самым большим, или самым маленьким результатом). Помните, однако, что результаты нельзя просто так отбросить: должна быть основа для идентификации данных как выпавших значений и стратегия работы с ними. Выпавшие значения все же являются результатами и должны исследоваться и включаться в отчет, даже если они не используются последующем анализе. Если данные имеют несколько выпавших значений или содержат данные из двух генеральных совокупностей, то графический метод, такой как Ранкит-график весьма полезен для сортировки нормально распределенных поднаборов результатов. Однако, также полезно иметь быстрый метод для решения вопроса о том, является или нет конкретное значение выпавшим. Метод, который рекомендует ISO является т.н. тест Грубба, хотя многие старые книги предлагают тест Диксона.
Тест Грубба заключается в нахождении критерия G, который потом сравнивается с табличным значением Gcritical или же это критичное значение рассчитывается по соответствующей формуле.
Если G> Gcritical то соответствующая точка отбрасывается.

Слайд 60

Статистика в аналитической химии
Результат применения Excell для выполнения теста Грубба рассмотрим на

следующем примере:
Было проведено определение концентрации кальция в молоке посредством титрования ЭДТА. Было выполнено 10 повторных измерений, в результате которых получены следующие результаты (мг/г) 4.59, 10.00, 6.07, 4.73, 9.91, 5.28, 16.65, 5.17, 4.59 и 4.38. Нужно проверить эту выборку данных на предмет выпадающих значений.

Слайд 61

Статистика в аналитической химии

Слайд 62

Статистика в аналитической химии
Так как Gsuspect > Gcritical значение 16.65 мг/г является

выпавшим и может быть отвергнуто с уровнем вероятности 95%.
Комментарий
Тест Грубба предназначен только для одного выпавшего значения.
2. Отбрасывая выпавшее значение, утверждаем , что оно не является частью нормального распределения. Таким образом, после его исключения можно рассчитать среднее и стандартное отклонение, в нашем случае 6.08 и 2.25, соответственно.
3. Обычный вопрос, который задают: « А после исключения выпавшего значения можно снова проверить самый удаленный от среднего результат?» В идеале тест Грубба предназначен только для одного потенциального выпавшего значения, хотя очень часто приходится видеть, что его применяют и к следующему потенциальному выпавшему значению. Следует быть осторожным, так как если Вы отбрасываете слишком много точек-данных из малого набора данных (скажем из 10 значений), то скорее всего ваши данные не распределены нормально. Для больших наборов данных (больше чем 10 значений) наилучшим способом идентификации выпавших значений является Ранкит-график, где точки, отклоняющиеся от прямой линии не являются частью номального распределения.

Слайд 63

Статистика в аналитической химии
Односторонний t - тест
Систематическая погрешность в аналитической методике

должна быть определена и скорректирована . Систематическая погрешность оценивается путем выполнения измерения с привлечением сертифицированного референсного материала (подчас называемом CRM).

Среднее из ряда определений, может быть использовано для решения вопроса является ли систематическая погрешность значимой путем использования одностороннего t – теста, рассчитав критерий Стьюдента по результатам измерений и оценив ассоциированную с этим критерием вероятность.

Для теста на систематическую погрешность нуль гипотеза состоит в том, что систематической погрешности нет.
Как и во всех такого рода тестированиях, если вероятность ниже заранее оговоренного предела (р < α) то нуль гипотеза (нет систематической погрешности) отвергается и мы заключаем, что таковая погрешность имеется.

Слайд 64

ПРИМЕР :
Содержание фтора в зубной пасте согласно метода измеряется с использованием ионселективного

электрода. Выполнение измерения требует, чтобы проба была приготовлена путем экстракции фторид-иона из зубной пасты. Для определения того присутствует ли на стадии экстракции или измерения систематическая ошибка ряд аналитиков измеряли содержание фторид-иона в образце пасты с приписанным содержанием 0.033 %. Результаты для 9 аналитиков составили 0.042, 0.040, 0.028, 0.035, 0.044, 0.035, 0.041,0.043,0.040%.

Статистика в аналитической химии

Если посмотреть данные, то можно заподозрить наличие систематической ошибки, если все кроме одного значения выше чем приписанное значение, однако, не выполнив тест, нельзя быть уверенным, что это именно так. Построение точек еще более убеждает, что 0.028 % является выпавшим значением. Однако, оценив для этого значения критерий Груббса, получаем значение, говорящее, что полученное значение содержания фторид-иона вписывается внутрь критического диапазона и не может быть отброшено.

Слайд 65

Статистика в аналитической химии

Слайд 66

Приписанное значение лежит непосредственно за 95% доверительного интервала, что дает нам возможность

предположить, что имеется значимая разница. Заметьте, что нанесение данных на график всегда полезно, но все равно следует вычислять вероятности.
Определив р = 0.0103 мы можем заключить, что Но принимается с 99% вероятностью.
Но,так как в условии р < 0.05 то нуль-гипотеза отвергается на уровне вероятности 95% и делается заключение о том, что имеется систематическая ошибка в методике на основе использования ионоселективного электрода.

Статистика в аналитической химии

Слайд 67

Статистика в аналитической химии
Парный t - тест
В некоторых случаях у нас

нет такой роскоши, как возможность проводить измерения на одном и том же тест-материале, но мы можем выполнять всего одно измерение для ряда различных тест-материалов двумя методами. Два метода могут быть сравнены путем учета результатов каждой пары одноразовых экспериментов. Если два метода эквивалентны, то математическое ожидание для разницы между результатами, должно тестироваться по отношению к нулю.

В парном t-тесте, таким образом, вычисляются среднее и стандартное отклонение этой разности и затем выполняется расчет t критерия по формуле, приведенной для одностороннего t-теста, но принимая за 0 величину генерального среднего, что имеет место в том случае, когда два метода дают результаты, равные выборочным средним.

ПРИМЕР :
Количество кальция в различных образцах молочного порошка (в мг кальция на 1 г молочного порошка) анализировалось двумя методами, один из примененных методов - метод ААС с озолением матрицы, другой представлял собой комплексонометрическое титрование.

Слайд 68

Статистика в аналитической химии
a атомно-абсорбционная спектрофотометрия. bКомплексонометрическое титрование.

Слайд 69

Статистика в аналитической химии
Вероятность того, что между методиками нет разницы, рассчитанная по

представленным данным, составляет (1-0.0286)*100=97.14%. Таким образом, мы заключаем, что нет существенной разности между методиками на основе ААС и на основе комплексометрическкого титрования.
1. Для семи из девяти пар AAC дал меньшее значение, чем комплексометрия, что должно
вызвать подозрение аналитика.
2. Без измерений на сертифицированном референсном материале (CRM) мы не можем сказать,
какой из двух методов дает результаты с меньшей систематической погрешностью.

Слайд 70

Статистика в аналитической химии
Наиболее часто используемые тесты однородности дисперсий двух и более

выборок данных

При выборе аналитической методики для анализа проб необходимо учесть ряд вещей, включая требуемыйу ровень точности. Это делается путем сравнения дисперсий аналитических методик.
Для решения вопроса о том имеется или нет значимая разница между дисперсиями существует несколько критериев. Наиболее популрны критерии Кохрена, Бартлетта , Фишера и как «венец» мощности такого рода исследований – метод ANOVA.
Анализ однородности дисперсий по Кохрену
Назначение. Проверка гипотезы о принадлежности нескольких дисперсий к одной генеральной совокупности. Нулевая гипотеза : σ21 = σ22 =….= σ2k
Предпосылки. Данные независимы и распределены по нормальному закону. Количество наблюдений одинаково в каждой выборке. Краткие теоретические сведения. Критериальное значение рассчитывается по следующей формуле:

где S2max, — максимальная из дисперсий;
S2i - эмпирические дисперсии, рассчитанные каждой выборке.

Если G > Gα (k, n), то нулевая гипотеза отклоняется. Критические значения можно найти также, пользуясь таблицами F-распределения, с помощью соотношения

Слайд 71

Статистика в аналитической химии

Слайд 72

Статистика в аналитической химии

Слайд 73

Статистика в аналитической химии
Анализ однородности дисперсий по Бартлетту
Назначение. Проверка гипотезы о

принадлежности нескольких дисперсий к одной генеральной совокупности. Применяется в случае, когда выборки, по которым определяются оценки дисперсий, имеют разный размер (в отличие от критерия Кохрена, требующего выборок равного размера). Нулевая гипотеза : σ21 = σ22 =….= σ2k .
Предпосылки. Распределение данных должно быть нормальным, данные независимы.Данный критерий очень чувствителен к отклонению данных от нормального закона распределения. Если вы сомневаетесь в том, что исследуемые данные распределены в соответствии с нормальным законом распределения, данный критерий лучше НЕ ИСПОЛЬЗОВАТЬ.
Критериальное значение рассчитывается по следующей модифицированной формуле:

Слайд 74

Статистика в аналитической химии
Если рассчитанное значение χ2 больше или равно критическому значению,

взятому с уровнем значимости а и числом степеней свободы ν, то нулевая гипотеза принимается.
Алгоритм вычислений следующий :
Проверить имеющиеся данные (по каждому столбцу отдельно) на соответствие их нормальному распределению. Эту проверку можно выполнить используя критерий Шапиро-Уилка или ,например, при помощи функции NORMSАМР_1 (написанной отдельно на VBA, авторы Лапач С.Н, Чубенко А.В., Бабич П.Н.) . Это необходимо сделать ОБЯЗАТЕЛЬНО, так как данный критерий очень чувствителен к отклонению анализируемых данных от нормального закона распределения.
Вычислить для данных критериальное значение. Использовать формулу, приведенную выше, довольно сложно, поэтому можно применить функцию BARTLET() (написанную отдельно на VBA, авторы см.выше).
Для того, чтобы принять или отвергнуть Но, необходимо вычислить общее число степеней свободы. Это можно сделать как «вручную», так и при помощи пользовательской функции BARTLET_DF ().

Слайд 75

Статистика в аналитической химии

Слайд 76

Статистика в аналитической химии
ANOVA в Excel
Excel предлагает три варианта применения ANOVA

посредством его надстройки Analysis ToolPak («Анализ данных»):
ANOVA: «Однофакторный дисперсионный анализ» ;
ANOVA: «Двухфакторный дисперсионный анализ с повторениями» ; и ANOVA: «Двухфакторный дисперсионный анализ без повторений» .

Пример посвящен сравнению уровней глюкозы в безалкогольных напитках, определяемых методиками на основе спектрофотометрии и энзиматического электрода (второй альтернативный). Заключение, полученное с использованием t-теста, состояло в том, что эти два средних различны. Аналитическая лаборатория поэтому решила проверить обе методики относительно АОАС (Association of Official Analytical Chemists) который использует ВЭЖХ. Аналитические результаты для шести повторных измерений (единицы mM) следующие:
• Спектрофотомерия: 1.90, 1.82, 1.70, 1.94, 1.85,1.90
• Энзиматический электрод: 1.35,1.65,1.76,1.41,1.80,1.33
• Использование методики АОАС: 1.92,1.82,1.85,1.79,1.89,1.95
Эффективным способом решения имеются или нет значительные различия, является однофакторный ANOVA.
Рассмотрим для начала расчеты без применения надстройки «Анализ данных»

Слайд 77

Статистика в аналитической химии

Слайд 78

Статистика в аналитической химии

Слайд 79

Статистика в аналитической химии
C применением надстройки «Анализ данных» все значительно упрощается

Слайд 80

Статистика в аналитической химии

Слайд 81

Статистика в аналитической химии
Результат с применением надстройки «Анализ данных»

Слайд 82

Статистика в аналитической химии
Таким образом значение F составляет 10.39062 с ассоциированной вероятностью

0.001473. Так как это меньше 0.05 то это говорит нам, что нуль-гипотеза (отсутствие различий между методами) может быть отвергнута на уровне вероятности 95% (99.85% = 100 (1 — 0.001473) на самом деле) и, поэтому, мы делаем заключение, что имеется значимая разница в средних связанная с изучаемым фактором, т.е. имеются существенно отличающиеся методики. Т.е. вне связи с тем, как проведены вычисления «вручную» или с использованием встроенного макроса Excel, получается один и тот же ответ.

Слайд 83

Статистика в аналитической химии
Реализация метода ANOVA с использованием статистических программых продуктов Minitab16

и Statistica 6.0

Помимо распространенных офисных табличных процессоров типа MS Excell и Sun OpenOffice Calc часто для научных исследований применяют статистические программы из которых следует упомянуть Minitab 16 (LEAD Technologies) и Statistica 6.0 (Statsoft).
Программы очень функциональны и позволяют извлечь из матриц данных максимум статистической информации, зачастую не всегда необходимую. Применение этих программ должно базироваться на принципе соответствия цели. Т.е. если планируется исследование влияния более чем двух факторов, то тогда применение для реализации ANOVA Minitab 16 и Statistica 6.0 оправдано, а если используется лишь одно-двухфакторный анализ, то вполне достаточно MS Excell.
Рассмотрим реализацию ANOVA с помощью Minitab 16 . Эта программа удобна, поскольку позволяет работать с наборами даннных как Stacked («сложенных в стопку» в одной колонке) так и Unstacked (расположенных более привычно в виде разных колонок). Воспользуемся набором данных из предыдущего примера по определению концентрации глюкозы спектрофотометрическим методом, энзиматическим и ВЭЖХ(AOAC) методами. Данные вначале расположим Stacked, создав предварительно переменную «Метод», параметрами которой являются повторяющиеся наименования методов.

Слайд 84

Статистика в аналитической химии

Слайд 85

Статистика в аналитической химии
После выбора вида статистических расчетов
Stat -> ANOVA ->

One-Way…
В окне задания параметров One-Way Analysis of Variance
Указывают колонку с данными DATA как Response (отклик), а в поле Factor (фактор) – METOD. Указывают уровень значимости 95 или 99 % и нажимают «Ок».

Слайд 86

Статистика в аналитической химии
Результат работы модуля ANOVA будет выведен в окно отчетов

«Session».

Слайд 87

Статистика в аналитической химии
Рассмотрим реализацию ANOVA с помощью Minitab 16 с набором

даннных Unstacked (расположенных более привычно в виде разных колонок). Воспользуемся также набором данных из предыдущего примера по определению концентрации глюкозы спектрофотометрическим методом, энзиматическим и ВЭЖХ(AOAC) методами. Данные расположим Unstacked.

Слайд 88

Статистика в аналитической химии

Слайд 89

Статистика в аналитической химии
Результат работы модуля ANOVA будет выведен в окно отчетов

«Session».

После выбора вида статистических расчетов Stat -> ANOVA -> One-Way…
В окне задания параметров One-Way Analysis of Variance. Указывают колонки с данными как Responses (отклики) («Спектроф.» – «АОАС») . Указывают уровень значимости 95 или 99 % и нажимают «Ок».

Слайд 90

Статистика в аналитической химии
Рассмотрим реализацию ANOVA с помощью Statistica 6.0 . Эта

программа работает с наборами даннных Stacked («сложенных в стопку» в одной колонке). Воспользуемся набором данных из предыдущего примера по определению концентрации глюкозы спектрофотометрическим методом, энзиматическим и ВЭЖХ(AOAC) методами. Данные расположим Stacked, создав предварительно переменную «Метод», параметрами которой являются повторяющиеся наименования методов как в Minitab 16.

Слайд 91

Статистика в аналитической химии

Слайд 92

Статистика в аналитической химии

Слайд 93

Статистика в аналитической химии

Слайд 94

Статистика в аналитической химии

Слайд 95

Статистика в аналитической химии
* это непараметрический аналог парного критерия Стьюдента (t-критерий для

зависимых выборок)

Слайд 96

Статистика в аналитической химии
Чтобы автоматизировать вычисление критических значений статистики W, необходимо определить

свою пользовательскую функцию, например, Wperculcl (alfa; m_size; n_size) при помощи встроенного в Microsoft Excel языка программирования Visual Basic (написанной авторами Лапач С.Н, Чубенко А.В., Бабич П.Н.).

Слайд 97

Статистика в аналитической химии
Двухвыборочный критерий Вилкоксона
Назначение. Проверка гипотезы о равенстве средних

двух независимых выборок.
Нулевая гипотеза. Обе выборки имеют одинаковое распределение, то есть извлечены из одной генеральной совокупности. Следствием чего является равенство двух средних. Предпосылки. Все случайные величины взаимно независимы.
При помощи функции NORMSАМР_1 () проверить имеющиеся данные (по каждому столбцу отдельно) на соответствие (или не соответствие) их нормальному распределению.
Определить размеры обеих выборок , а также уровень значимости α (0,05).
Вычислить верхнее и нижнее критические значения статистики W, используя формулы или пользовательскую функцию, Wperculcl (alfa; m_size; n_size).
Рассчитать критериальное значение Wэмп. Для упрощения этого процесса можно использовать пользовательскую функцию W_crit1(R_l; R_2),

Слайд 98

Статистика в аналитической химии

Слайд 99

Статистика в аналитической химии
Критерий T- Вилкоксона для парных наблюдений (одновыборочный критерий Вилкоксона,

критерий знаковых рангов)
Назначение. Аналог t-критерия Стьюдента для парных наблюдений в случае нечисловых данных или закона распределения, отличного от нормального. Применяют для связанных пар наблюдений (проверка отсутствия эффекта обработки).
Нулевая гипотеза. Распределение разностей пар симметрично относительно нуля.
Предпосылки. Разности независимы, принадлежат непрерывной совокупности (необязательно одной и той же), симметричной относительно нуля.
Рассчитать значения разниц пар двух выборок.
Проранжировать абсолютные значения разниц пар в возрастающем порядке.
Назначить им соответствующие значения рангов от 1 и выше. Нулевые значения разницы не рассматриваются (отсюда — уменьшение общего количества наблюдений N). В общем, построение рангов выполняют как обычно, только знаки значений разниц при этом не учитывают).
Знаком ранга считать знак соответствующей ему разниц.
Посчитать сумму R положительных рангов.
Вычислить критериальное значение:
Проверить критерий.
Для малых выборок (N < 20), если значение R больше табличного значения критерия знаковых рангов Вилкоксона Т* (не следует путать со статистикой ранговых сумм W!) с уровнем значимости α/2 и числом степеней свободы N, нулевая гипотеза отвергается.

* Критерий применяется для сопоставления показателей, измеренных в двух разных условиях на одной и той же выборке. Он позволяет установить не только направленность изменений, но и их выраженность.

Слайд 100

Статистика в аналитической химии
Примечание. Данный критерий устойчив к умеренным отклонениям от принятых

предпосылок. Критерий Вилкоксона не следует применять к нормально распределенным совокупностям. Лучше использовать более мощный t-критерий Стьюдента. Критические значения можно рассчитать по аппроксимирующей формуле :

Слайд 101

Статистика в аналитической химии

Слайд 102

Статистика в аналитической химии
Калибровка является сердцем химического анализа и процесса посредством которого

отклик прибора (в метрологии называется «показание измерительного прибора») связано с значением измеряемой величины, в химии этой величиной чаще всего является концентрация аналита в испытуемом или стандартном (стандартных) растворах. Без надлежащей калибровки измерения прибора не являются прослеживаемыми (traceable) и даже просто корректными.

Калибровка и ее параметры с помощью Excel

Проведя лучшую прямую линию через точки можно нанести на линии значение измеренного сигнала для испытуемого раствора и опустив перпендикуляр на ось концентраций найти его концентрацию. В настоящее время по калибровочным данным рассчитывается т.н. регрессионное уравнение, которое затем используется для получения концентрации испытуемого раствора. Хотя и нет более абсолютной необходимости построения графика для определения параметров калибровочной прямой , но хорошей практикой является построение графика в качестве быстрой визуальной проверки на наличие выпавших значений или на возможное наличие кривизны. Поскольку, что мы можем выбирать значения калибровочных концентраций, то концентрация является независимой переменной, а вот отклик прибора является зависимой переменной (потому, что отклик прибора зависит от концентрации аналита).
Самая используемая модель калибровки - линейная Y= a + bx, где Y показание прибора, х независимая переменная, которая в большинстве случаев представляет собой концентрацию аналита в растворе, а и b коэффициенты модели известные как «пересечение (intercept)» и «наклон (slope)» и которые определяются из ряда измерений для при различных значениях.

Слайд 103

Статистика в аналитической химии
Любое конкретное измерение (уi) будет подвержено погрешностям измерения, таким

образом:
Уі = a + bxj + εi
Аналитические методы, для которых может быть проведено вычитание соответствующего измерения для холостой пробы принуждают калибровочную прямую проходить через нуль.
Y=bx
Даже для простого линейного уравнения при принятии различных допущений о данных мы придем к различным значениям а и b. Большинство электронных таблиц и калькуляторов выполняют «классическую» линейную регрессию. Допущения следующие :
1. Линейная модель корректна (т.е., отклик измерительного прибора на самом деле линейно связан с концентрацией).
2. Все неопределенности заключаются в зависимой переменной (Y) и распределены нормально.
3. Данные имеют гомоскедастический характер, это означает, что погрешности в у не зависят от концентрации. Данные для которых неопределенность, например, растет с концентрацией называются гетероскедастическими.
Большинство аналитических систем нарушают то или иное из этих допущений, но о разумной линейности обычно можно не беспокоиться.
Регрессия будет избегать очень больших отклонений за счет малых и таким образом, единственная «порочная» точка может исказить всю калибровку. Склонность точки тянуть линию на себя на сленге известна как «принцип рычага».
Коэффициенты уравнений вычисляются из данных посредством следующих формул:

Слайд 104

Статистика в аналитической химии
Эти коэффициенты оценивают действительную функцию, ограниченную неминуемым разбросом, который

возникает во время измерения. Точность расчета количественно выражают остаточным средним квадратичным отклонением, Sy, которое является мерой разброса значений измеряемых величин, вокруг градуировочной линии, в соответствии с уравнением :

Слайд 105

Статистика в аналитической химии
Стандартные отклонения могут быть вычислены и для коэффициентов :
Стандартное

отклонение определяемой концентрации из m измерений испытуемого раствора, давшего средний отклик у0 равно :

Слайд 106

Статистика в аналитической химии
Рассмотрим возможность реализации вышеприведенных расчетов в Excell на примере

определения содержания нитрит-иона в воде.

Данные для построения калибровки

С помощью мастера диаграмм легко вывести графическое изображение и линию тренда

Слайд 107

Статистика в аналитической химии
Для реализации вышеприведенных расчетов в Excell необходимо воспользоваться функцией-массивом

– «ЛИНЕЙН» из набора статистических функций данного табличного процессора. Для корректного вывода необходимой информации необходимо в свободной от данных зоне выделить локальный диапазон из двух колонок и пяти строк и выполнить в коммандной строке вызов функции «ЛИНЕЙН».

Слайд 108

Статистика в аналитической химии
После вызова функции «ЛИНЕЙН» появится окно задания необходимых входных

диапазонов данных

Слайд 109

Статистика в аналитической химии
После вызова функции «ЛИНЕЙН» и задания необходимых данных, для

корректного вывода расчетных параметров линейной регрессии необходимо удерживая нажатыми кнопки клавиатуры (Shift+ Ctrl) нажать кнопку Enter. При соблюдении этих правил вывода, результат работы функции «ЛИНЕЙН» будет визуализирован в заданном диапазоне ячеек.

Слайд 110

Статистика в аналитической химии
Соответствие полученных данных функции «ЛИНЕЙН» параметрам линейной регрессии

Слайд 111

Статистика в аналитической химии
Получение расширенных параметров линейной регрессии, согласно ISO 11095:1996 «Linear

calibration using reference materials» с помощью пакета анализа

Слайд 112

Статистика в аналитической химии

Слайд 113

Статистика в аналитической химии

Слайд 114

Статистика в аналитической химии
Метод контроля стабильности калибровки, согласно ГОСТ Р ИСО

11095-2007
Если функция калибровки должна быть использована в течение большого периода времени, желательно применять метод контроля для проверки справедливости функции калибровки, а также для идентификации, а затем устранения источников нежелательных отклонений. Метод позволяет контролировать на регулярной основе измерительную систему и быстро обнаружить беспорядочное поведение или изменения измерительной системы, в результате которых применение имеющейся функции калибровки становится бесполезным или даже вредным.
Это достигается на основе мониторинга результатов измерений (после преобразований в соответствии с функцией калибровки) на m RM (reference material - образец сравнения) с помощью контрольной карты.
Контрольную карту сначала строят на основе данных, собранных в процессе эксперимента по калибровке. Затем контрольную карту используют для решения о необходимости повторного построения функции калибровки. Ту же самую контрольную карту используют для оценки неопределенности результатов измерений после их преобразования в соответствии с функцией калибровки.
Рассчитывают контрольные границы :

Слайд 115

Отбирают m RM так, чтобы соответствующие им принятые значения заполняли диапазон значений,

характерных для нормальных режимов работы измерительной системы. Необходимо не менее двух RM. Рекомендуется три RM. Предпочтительно (но необязательно) использовать RM, которые отличаются от используемых в процессе эксперимента по калибровке.
Регулярно (например, один раз в день ипи один раз при каждом изменении) выполняют одно измерение каждого из этих RM.
Находят преобразованные значения х (і = 1.....т) для каждого из m RM .Вычисляют разности между преобразованными значениями х,* и принятыми значениями х, передаваемыми RM.
Откладывают на контрольной карте полученные контрольные значения в соответствии с моментами времени, в которые были проведены измерения m RM.
Решение о состоянии системы
Если одно или несколько значений , попадают вне контрольных границ это означает, что система находится в неуправляемом состоянии. Необходимо повторить измерения на RM Если хотя бы один из новых результатов измерений m RM попадает в область вне контрольных границ, в этой точке необходимо провести исследование причин такой ситуации. В зависимости от особенностей задачи может быть принято решение о необходимости повторного определения функции калибровки с новым экспериментом по калибровке.

Статистика в аналитической химии

Слайд 116

Карты Шухарта
Контрольные карты — график изменения параметров выборки, обычно средних и среднеквадратичного отклонения.

Различают контрольные карты для количественного и качественного признаков. Цель построения контрольной карты — выявление точек выхода процесса из устойчивого состояния для последующего установления причин отклонения и его устранения.
Задачи построения КК:
определить возможности процесса,
определить точки флуктуации,
спрогнозировать качество процесса.
Контрольные карты были предложены Шухартом (Shewhart) еще в 20-е годы, в период его работы в телефонной компании Bell Laboratories (США), поэтому их иногда называют карты Шухарта. С помощью этих карт выявляется различие между изменчивостью технологического процесса, вызванной простыми причинами, и изменчивостью, появившейся под действием неслучайных причин.

Слайд 117

Карты Шухарта
Контрольные карты используются для оценки "контролируемости" или "неконтролируемости" процесса. Эту оценку

можно получить:
• осуществляя проверку замеров важнейших параметров, например, веса сахара в одной упаковке, диаметра отверстия, просверленного в листе металла, коэффициента возврата Recovery;
• осуществляя проверку отдельных качественных характеристик изделия, например, прочно ли упакован пакет, правильно ли закрыта крышкой бутылка, не повреждено ли фарфоровое изделие и т.д.
В первом случае используются контрольные карты количественного признака, а во втором — контрольные карты качественного признака. Существует несколько видов карт Шухарта. Мы остановимся более подробно на двух типах: контрольной карте средних арифметических и контрольной карте индивидуальных значений.

Слайд 118

Карты Шухарта
КОНТРОЛЬНАЯ КАРТА СРЕДНИХ АРИФМЕТИЧЕСКИХ
Если генеральная совокупность имеет нормальное (или близкое

к нормальному) распределение со средним значением μ и стандартным отклонением s, выборочное распределение выборочного среднего также является нормальным и имеет такое же среднее значение и стандартную ошибку, равную , где n — объем выборки. Для любого нормального распределения между граничными значениями, равными μ ± 2*S, заключено примерно 95% распределения. Вероятность того, что полученное значение окажется больше, чем μ ± 2*S, составляет 2,5%, или один случай из 40, вероятность получения значения, меньшего μ ± 2*S, также составляет 2,5%. Аналогично интервал μ ± 3*S охватывает около 99,8% распределения. Вероятность того, что полученное значение превысит μ ± 3*S или окажется меньше, чем μ ± 3*S , составляет 0,1%, т.е. это событие будет иметь место в одном случае из 1000.
Графическая иллюстрация этих крайних значений приведена на рис. для выборочного распределения выборочного среднего. Эта диаграмма является основой для составления контрольной карты среднего арифметического процесса.

Слайд 119

Карты Шухарта
Для построения графика, приведенного на рис., необходимо, чтобы значения μ и σ были известны. Их

оценки получают по результатам расчетов среднего значения и стандартного отклонения соответствующих параметров процесса на протяжении длительного промежутка времени. 95%-ные границы распределения называются верхней и нижней предупреждающими границами (ВПГ и НПГ). 98%-ные границы распределения называются верхней и нижней корректировочными границами (ВКГ и НКГ).
Построение контрольной карты состоит в нанесении на график выборочных средних в соответствии с номером выборки.
Стандартная процедура использования этих контрольных карт состоит из следующих шагов:

Слайд 120

Карты Шухарта
1. Через равные промежутки времени проводится выборка объемом n и рассчитывается

выборочное среднее.
2. Полученное значение выборочного среднего наносится на контрольную карту в соответствии с номером выборки.
3. Если выборочное среднее лежит за пределами границы корректирования, производится остановка процесса в целях выявления неслучайных причин вариации.
4. Если два последовательно полученных значения выборочных средних находятся в промежутке между предупреждающей границей и границей регулирования, предпринимаются немедленные действия по остановке процесса производства и выявлению неисправностей. Если некоторое среднее значение лежит за пределами предупреждающих границ, следующая выборка производится сразу же, до момента проведения очередной выборки.
5. Если точки на графике образуют явный возрастающий или убывающий тренд, предпринимаются определенные меры даже в случаях, когда эти точки находятся в пределах предупреждающих границ. Этот тренд может оказаться индикатором наличия неслучайных причин.

Слайд 121

Карты Шухарта
Процедура ведения КК в сущности представляет собой не что иное, как

проверку гипотез. Нулевая гипотеза заключается в том, что технологический процесс находится под контролем, причем все технологические параметры соответствуют установленным производственным возможностям. Альтернативная гипотеза утверждает, что процесс не является контролируемым. Каждый раз, когда мы проводим выборку, осуществляется процедура проверки гипотез. Если выборочное среднее лежит за предупреждающими границами, H0 отклоняется при 5%-ном уровне значимости. Если оно находится за пределами границ регулирования, мы отклоняем Н0 при 2%-ном уровне значимости. С помощью контрольных карт можно без труда показать результаты периодически повторяющейся проверки гипотез.

Слайд 122

Карты Шухарта
Формулы расчета средней линии и границ для карт средних

Слайд 123

Карты Шухарта
Контрольные карты для индивидуальных значений (X)
В некоторых ситуациях для управления

процессами невозможно или практически не возможно иметь дело с рациональными подгруппами. Время или стоимость, необходимые для измерения при одиночном наблюдении, настолько большие, что проведения повторных наблюдений даже не рассматривают. Это обычно происходит, когда измерение дорого стоит (например, при разрушительном контроле) или выход продукции все время относительно однороден. В других ситуациях возможно получить только одно значение, например показания прибора или значения характеристики партии исходных материалов. В таких случаях необходимо, чтобы контроль процесса базировался на индивидуальных значениях.
В случае карт индивидуальных значений для получения оценок изменчивости в пределах партии не используют рациональные подгруппы, а контрольные пределы рассчитывают на основе меры вариации, полученной по скользящим размахам, часто двух наблюдений. Скользящий размах - это абсолютное значение разницы измерений в последовательных парах; то есть это разница первого и второго измерения, потом второго и третьего и тому подобное.

Слайд 124

Карты Шухарта
На основе скользящих размахов вычисляют средний скользящий размах R, который используют

для построения контрольных карт. Также на основе всех данных вычисляют общее среднее X. В таблице приведены формулы для расчета контрольных пределов для карт индивидуальных значений.

Слайд 125

Карты Шухарта
Во время использования карт индивидуальных значений необходимо учитывать тот факт, что

:
a) карты индивидуальных значений не так чувствительны к изменениям процесса, как X - и R –карты (карты средних арифметических);
b) во время интерпретации карт индивидуальных значений нужно выявлять осторожность, если распределение процесса не является нормальным;
c) Карты индивидуальных значений не выделяют повторяемость процесса от элемента к элементу, и потому в некоторых случаях лучше использовать обычные X – и R-карты с малыми объемами выборочных подгрупп (от 2 до 4), даже если это требует увеличения интервала между подгруппами.

Слайд 126

Карты Шухарта

Слайд 127

Карты Шухарта
МЕТОД УПРАВЛЕНИЯ И ИНТЕРПРЕТАЦИЯ КОНТРОЛЬНЫХ КАРТ ДЛЯ КОЛИЧЕСТВЕННЫХ ДАННЫХ
Система карт

Шухарта опирается на тот факт, что когда изменчивость процесса от элемента к элементу и среднее процесса остаются постоянными на данных уровнях (оцененных, соответственно, по R и X), то размахи (R) и средние (X) отдельных подгрупп будут изменяться только случайным образом и редко выходить за контрольные пределы. Также не должно быть очевидных трендов или структур данных, кроме тех, которые возникают случайно с некоторой частью вероятности.
Х-карта показывает, где находится среднее процесса и отражает стабильность процесса. X -карта выявляет нежелательные вариации между подгруппами и вариации относительно них среднего. R -карта выявляет любую нежелательную вариацию внутри подгрупп и служит индикатором переменчивости исследуемого процесса. Это мера правильности (конзистентности) и однородности процесса. Если R -карта показывает, что вариации внутри подгрупп не изменяются, то это значит, что процесс остается в статистически управляемом состоянии. Это имеет место только в том случае, если все выборки обрабатывали одинаково. Если R-карта показывает, что процесс вышел из управляемого состояния или уровень на R-карте растет, то это может обозначать, что или отдельные подгруппы испытали разную обработку, или в процессе действует несколько разных систем причинно-следственных связей.
На X -карту также могут влиять условия, при которых процесс вышел из состояния статистической управляемости на R -карте. Возможность интерпретировать размахи или средние значения подгрупп зависит от оценивания переменчивости от элемента к элементу, потому R-карту необходимо анализировать первой.

Слайд 128

Статистика в аналитической химии
Что такое – «Неопределенность» ?
Понятие «неопределенность» (англ. «Uncertainty»),

появилось более 30 лет назад. Неопределенность и связанные с ней величины (стандартная неопределенность, расширенная неопределенность и т.д.), в последнее время широко используются при представлении результатов измерений, особенно в европейских странах. То же происходит и у нас - эти термины (и соответствующие величины) применяются все чаще. Так, понятие неопределенности фигурирует в ряде нормативных документов.

Как известно, фундаментальным понятием классической теории измерений является погрешность

отклонение результата измерения Xi от истинного значения измеряемой величины μ . Погрешность
возникает из-за несовершенства процесса измерений. Хотя погрешность не может быть точно
известна (из - за неизвестности истинного значения), это понятие удобно использовать для
статистического описания процесса измерений. Распределение погрешности δ совпадает с
распределением результатов измерений Х с точностью до начала координат (см. рис 1).

Слайд 129

Статистика в аналитической химии
Рассмотрим теперь, как определяется неопределенность. Согласно EUROCHEM/CITAC Guide “Quantifying

Uncertainty in Analytical Measurements” , Second Ed., 2000, неопределенность - это «Параметр, связанный с результатом измерения и характеризующий разброс значений, которые с достаточным основанием могут быть приписаны измеряемой величине. … Этим параметром может быть, например, стандартное отклонение или ширина доверительного интервала».
Согласно других определений - неопределенность следует рассматривать как «параметр центрированной случайной величины, представляющей собой разность между истинным значением измеряемой величины и результатом измерений, то есть величины, совпадающей по модулю с погрешностью измерений, но противоположной ей по знаку». Другими словами, это параметр распределения величины

Рассматривая подробнее имеющиеся литературные данные можно сказать, что во всех случаях в связи с неопределенностью рассматриваются симметричные распределения результатов измерений (результаты измерений рассматриваются как выборка из нормально распределенной генеральной совокупности), а в качестве параметра, упомянутого в определении неопределенности, всегда рассматриваются стандартные отклонения, характеризующие случайные и скрытые (невыявленные) ошибки измерений, оцененные разными способами (стандартная неопределенность, суммарная стандартная неопределенность), либо кратные им величины (расширенная неопределенность). Фактически предполагается нормальное распределение результатов измерений.

Слайд 130

Статистика в аналитической химии
Обсуждение погрешностей данное выше известно как "классический подход" к

измерению. Он хорошо служил науке об измерениях, но он основан на допущении, что измерение в конечном счете может быть описано единственным истинным значением. В последние годы произошел сдвиг в понимании того, что концепция «истинного» значения может быть не корректной, а поэтому понятия правильности, случайной и систематической погрешностей также могут быть не правомерными. «Подход с точки зрения неопределенности» принимает, то, что есть только одна неопределенность эксперимента являющаяся следствием различных компонентов. Неопределенность характризует степень с которой значение измеряемой величины известно после измерения, принимая во внимание данную информацию от измерения.
Основные причины, по которым вводится понятие «неопределенность», следующие.
Отсчет доверительного интервала в отсутствие систематических погрешностей ведется от
среднего значения результатов измерений Xi . Вообще говоря, при использовании понятия «погрешность» отсчет должен был бы вестись от математического ожидания μ 2 , а величину
используют не от хорошей жизни – истинное значение неизвестно, а - есть наилучшая оценка для μ . Использование понятия «неопределенность» с этой точки зрения более логично - в определениях всех рассчитываемых параметров фигурируют только наблюдаемые величины.
Способы оценки интервала, в котором лежит истинная величина, более разнообразны и детально прописаны в документах, использующих понятие «неопределенность». В частности, учитываются реально имеющие место, но зачастую игнорируемые в отечественных нормативных документах скрытые, или невыявленные, систематические ошибки.

Слайд 131

Статистика в аналитической химии
Использование «неопределённости» позволяет наглядно решать вопрос о соответствии (или

несоответствии) измеренной характеристики качества установленным нормам. Если значение нормы не перекрывается расширенной неопределённостью результата измерения, то, основываясь на этом результате можно делать надёжное заключение о соответствии (или несоответствии) объекта испытания этой норме. Правда, то же относится к корректно рассчитанному доверительному интервалу.
Понятие «погрешность» исходно не являлось на Западе настолько же привычным, как у нас. Поставленные перед необходимостью оценивать интервал, в котором лежит истинное значение, зарубежные специалисты в качестве основы взяли «неопределенность» - у них был выбор.

Слайд 132

Графические методы выяснения источников неопределенности
Диаграмма Исикавы

Слайд 133

"Причинно-следственная диаграмма" («рыбий скелет»)
Автор метода: К. Исикава (Япония), 1952 г.
Назначение метода
Применяется

при разработке и непрерывном совершенствовании продукции (метода). Диаграмма Исикавы - инструмент, обеспечивающий системный подход к к определению фактических причин возникновения проблем.
Цель метода
Изучить, отобразить и обеспечить технологию поиска истинных причин рассматриваемой проблемы для эффективного их разрешения.
Суть метода
Причинно-следственная диаграмма - это ключ к решению возникающих проблем. Диаграмма позволяет в простой и доступной форме систематизировать все потенциальные причины рассматриваемых проблем, выделить самые существенные и провести поуровневый поиск первопричины.
План действий
В соответствии с известным принципом Парето, среди множества потенциальных причин (причинных факторов, по Исикаве), порождающих проблемы (следствие), лишь две-три являются наиболее значимыми, их поиск и должен быть организован.
Для этого осуществляется:
сбор и систематизация всех причин, прямо или косвенно влияющих на исследуемую проблему;
группировка этих причин по смысловым и причинно-следственным блокам;
ранжирование их внутри каждого блока;
анализ получившейся картины.

Графические методы выяснения источников неопределенности

Слайд 134

Общие правила построения
Прежде чем приступать к построению диаграммы, все участники должны прийти

к единому мнению относительно формулировки проблемы.
Изучаемая проблема записывается с правой стороны в середине чистого листа бумаги и заключается в рамку, к которой слева подходит основная горизонтальная стрелка - "хребет" (диаграмму Исикавы из-за внешнего вида часто называют "рыбьим скелетом").
Наносятся главные причины (причины уровня 1), влияющие на проблему, - "большие кости". Они заключаются в рамки и соединяются наклонными стрелками с "хребтом".
Далее наносятся вторичные причины (причины уровня 2), которые влияют на главные причины ("большие кости"), а те, в свою очередь, являются следствием вторичных причин. Вторичные причины записываются и располагаются в виде "средних костей", примыкающих к "большим". Причины уровня 3, которые влияют на причины уровня 2, располагаются в виде "мелких костей", примыкающих к "средним", и т. д. (Если на диаграмме приведены не все причины, то одна стрелка оставляется пустой).
При анализе должны выявляться и фиксироваться все факторы, даже те, которые кажутся незначительными, так как цель схемы - отыскать наиболее правильный путь и эффективный способ решения проблемы.
Причины (факторы) оцениваются и ранжируются по их значимости, выделяя особо важные, которые предположительно оказывают наибольшее влияние на показатель качества.
В диаграмму вносится вся необходимая информация: ее название; наименование изделия; имена участников; дата и т. д.

Графические методы выяснения источников неопределенности

Слайд 135

Достоинства метода
Диаграмма Исикавы позволяет:
стимулировать творческое мышление;
представить взаимосвязь между причинами и сопоставить их

относительную важность.
Недостатки метода
Не рассматривается логическая проверка цепочки причин, ведущих к первопричине, т. е. отсутствуют правила проверки в обратном направлении от первопричины к результатам.
Сложная и не всегда четко структурированная диаграмма не позволяет делать правильные выводы.

Графические методы выяснения источников неопределенности

Слайд 136

Графические методы выяснения источников неопределенности

Слайд 137

Авторы метода: В. Парето (Италия), 1897 г, М. Лоренц (США), 1979 г.
Назначение

метода
Применяется практически в любых областях деятельности. Японский союз ученых и инженеров в 1979 г. включил диаграмму Парето в состав семи методов контроля качества.
Цель метода
Выявление проблем, подлежащих первоочередному решению.
Суть метода
Диаграмма Парето - инструмент, позволяющий выявить и отобразить проблемы, установить основные факторы, с которых нужно начинать действовать, и распределить усилия с целью эффективного разрешения этих проблем.
Различают два вида диаграмм Парето:
по результатам деятельности - предназначена для выявления главной проблемы нежелательных результатов деятельности;
по причинам - используется для выявления главной причины проблем, возникающих в ходе производства.
План действий
Определить проблему, которую надлежит решить.
Учесть все факторы (признаки), относящиеся к исследуемой проблеме.
Выявить первопричины, которые создают наибольшие трудности, собрать по ним данные и проранжировать их.
Построить диаграмму Парето, которая объективно представит фактическое положение дел в понятной и наглядной форме.
Провести анализ диаграммы Парето.

Графические методы выяснения источников неопределенности

Слайд 138

Общие правила построения диаграммы Парето
Решить, какие проблемы (причины проблем) надлежит исследовать, какие

данные собирать и как их классифицировать.
Разработать формы для регистрации исходных данных (например, контрольный листок).
Собрать данные, заполнив формы, и подсчитать итоги по каждому исследуемому фактору (показателю, признаку).
Для построения диаграммы Парето подготовить бланк таблицы, предусмотрев в нем графы для итогов по каждому проверяемому фактору в отдельности, накопленной суммы числа появлений соответствующего фактора, процентов к общему итогу и накопленных процентов.
Заполнить таблицу, расположив данные, полученные по проверяемому фактору, в порядке убывания значимости.
Подготовить оси (одну горизонтальную и две вертикальные линии) для построения диаграммы. Нанести на левую ось ординат шкалу с интервалами от 0 до общей суммы числа выявленных факторов, а на правую ось ординат - шкалу с интервалами от 0 до 100, отражающую процентную меру фактора. Разделить ось абсцисс на интервалы в соответствии с числом исследуемых факторов или относительной частотой.
Построить столбиковую диаграмму. Высота столбца (откладывается по левой шкале) равна числу появлений соответствующего фактора. Столбцы располагают в порядке убывания (уменьшения значимости фактора). Последний столбец характеризует "прочие", т. е. малозначимые факторы, и может быть выше соседних.
Начертить кумулятивную кривую (кривую Парето) - ломаную, соединяющую точки накопленных сумм (количественной меры факторов или процентов). Каждую точку ставят над соответствующим столбцом столбиковой диаграммы, ориентируясь на его правую сторону.
Нанести на диаграмму все обозначения и надписи.
Провести анализ диаграммы Парето.

Графические методы выяснения источников неопределенности

Слайд 139

Достоинства метода
Простота и наглядность делают возможным использование диаграммы Парето специалистами, не имеющими

особой подготовки.
Сравнение диаграмм Парето, описывающих ситуацию до и после проведения улучшающих мероприятий, позволяют получить количественную оценку выигрыша от этих мероприятий.
Недостатки метода
При построении сложной, не всегда четко структурированной диаграммы возможны неправильные выводы.

Графические методы выяснения источников неопределенности

Слайд 140

Процесс оценки неопределенности согласно руководства EURACHEM /CITAC

Слайд 141

Процесс оценки неопределенности согласно руководства EURACHEM /CITAC

Слайд 142

Альтернативный процесс оценки неопределенности согласно руководства NORDTEST TR 537
В руководстве NORDTEST TR

537 «Handbook for calculation of measurement uncertainty in Environmental laboratories» приводится альтернативный процесс оценки неопределенности, базирующийся на данных, которые учитывают результаты межлабораторных испытаний и валидации методов (внутрилабораторная воспроизводимость, робасность).

Слайд 143

Современные методы оценки неопределенности
Стандарт ISO/IEC 17025:2006 определяет международное признание результатов испытаний и

калибровок лабораториями, получивших аккредитацию от органов, которые заключили MRA1 с аналогичными органами других стран. Он законодательно закрепил необходимость наличия процедур оценивания неопределенности измерений, проводимых в аккредитованных лабораториях
а) при выборе, разработке и оценивании пригодности методов и процедур, которые используются в деятельности лаборатории (п. 5.4.1);
б) при использовании стандартизованных и нестандартизованных или разработанных лабораторией методов и процедур калибровки или испытания (п. 5.4.6);
в) при оформлении свидетельств о калибровке и протоколов испытаний (п.5.6.2.1.1. 5.10.4.1);
г) при создании программ и процедур калибровки своих собственных исходных эталонов, образцовых веществ и оборудования, для обеспечения прослеживаемости проводимых лабораторией калибровок и измерений до Международной системы единиц (SI) (п. 5.6).
MRA - The Mutual Recognition Arrangement - соглашение о взаимном признании национальных эталонов и сертификатов о калибровке и измерениях, выпускаемых национальными метрологическими институтами, подготовленное Международным комитетом по мерам и весам (МКМВ)

Рекомендации ISO/IEC 17025:2005 по оцениванию неопределенности измерений в испытательных и калибровочных лабораториях

Слайд 144

Современные методы оценки неопределенности
Основные термины и положения по оцениванию неопределенности измерений, согласно

GUM «Guide to the Expression of Uncertainty in Measurement»ISO, Geneva, First Edition. 1995 и EURACHEM / CITAC Guide Quantifying Uncertainty Analytical Measurement, Second Ed.,2002.
Неопределенностью измерения называется параметр, связанный с результатом измерений и характеризующий рассеяние значений, которые могут быть обоснованно приписаны измеряемой величине.
Приведенное выше определение термина неопределенность сосредотачивает внимание на интервале значений, которые, как полагает аналитик, могут быть обоснованно приписаны измеряемой величине.
Источники неопределенности
На практике неопределенность результата измерения может возникать вследствие влияния многих возможных источников, включая, например, такие как неполное определение измеряемой величины, пробоотбор, эффекты матрицы и мешающие влияния, условия окружающей среды, погрешности средств измерений массы и объема, неопределенности значений эталонов, приближения и допущения, являющиеся частью метода и процедуры измерений, а также случайные колебания.

Слайд 145

Современные методы оценки неопределенности
Стандартная неопределенность — неопределенность результата измерений, выраженная как стандартное

отклонение.
Суммарная стандартная неопределенность - стандартная неопределенность результата измерений, когда результат получают из значений ряда других величин, равная положительному квадратному корню суммы членов, причем члены являются дисперсиями или ковариациями этих других величин, взвешенными в соответствии с тем, как результат измерений изменяется в зависимости от изменения этих величин.
Оценка (неопределенности) по типу А - метод оценивания неопределенности путем статистического анализа ряда наблюдений.
Оценка (неопределенности) по типу В - метод оценивания неопределенности иным способом, чем статистический анализ ряда наблюдений.
Расширенная неопределенность - величина, определяющая интервал вокруг результата измерений, в пределах которого, можно ожидать, находится большая часть распределения значений, которые с достаточным основанием могли бы быть приписаны измеряемой величине.
Коэффициент охвата - числовой коэффициент, используемый как множитель суммарной стандартной неопределенности для получения расширенной неопределенности.

Слайд 146

Современные методы оценки неопределенности
Основные положения концепции неопределенности :
1. Все составляющие неопределенности в

результате измерения можно сгруппировать в две категории в соответствии со способом их оценивания:
А - составляющие, оцениваемые путем применения статистических методов (обработкой результатов многократных измерений);
В - составляющие, оцениваемые другим способом (по характеристикам, взятым из предыдущих экспериментов, из паспорта на прибор, методик выполнения измерений, из справочников и т.д.). К источникам этих неопределенностей относятся: случайные погрешности однократных измерений; поправки, вводимые в результат измерения, неисключенные систематические погрешности, погрешности справочных данных и т.д.
2. Составляющие типа А оцениваются как стандартные (среднеквадратические) отклонения средних арифметических многократных наблюдений (неопределенности типа А - uA). Эти составляющие характеризуются числами степеней свободы ν (для прямых многократных измерений ν = n -1 , где n - количество многократных наблюдений, выполненных при измерении). Если между составляющими типа А наблюдается статистическая взаимосвязь (корреляция), то необходимо указывать коэффициенты корреляции r(xi,xj)=rij.
3. Составляющие типа В также оцениваются как предполагаемые стандартные (среднеквадратические) отклонения, получаемые из известных границ, в которых могут находиться значения этих составляющих (неопределенности типа В - uB ). Между составляющими типа В может существовать предполагаемая взаимосвязь, тогда следует указывать коэффициенты предполагаемой корреляции.

4. Суммарная стандартная (среднеквадратическая) неопределенность uс рассчитывается по правилу суммирования дисперсий :

Слайд 147

Современные методы оценки неопределенности
5. Интервальной оценкой неопределенности является расширенная неопределенность U, которую

получают путем умножения стандартной суммарной неопределенности uС на так называемый коэффициент охвата k. При указании расширенной неопределенности указывают уровень доверия вероятность Р. Обычно эта вероятность принимается равной 0.95.

Основные расчетные формулы для определения неопределенности

1. Стандартная неопределенности типа А

2. Стандартная неопределенность типа В

где, θi – неисключенная систематическая погрешность, αi – коэффициент, связанный принимаемым законом распределения (αi = 3 для равномерного, αi = 6 для треугольного, αi = 2 для арксинуса и αi = 4 для нормального закона распределения)

Слайд 148

Современные методы оценки неопределенности
3. Коэффициенты чувствительности. Расчет их необходим для определения вклада

неопределенности каждой входной величины в неопределенность измеряемой

4. Вклад неопределенности каждой входной величины в неопределенность измеряемой величины.

5. Суммарная стандартная неопределенность

6. Эффективное число степеней свободы

7. Коэффициент охвата

8. Расширенная неопределенность

Слайд 149

Современные методы оценки неопределенности

Слайд 150

Современные методы оценки неопределенности
Важным фактором корректной оценки неопределенности является составление модельного уравнения.

Модельным уравнением является зависимость между выходной и входными величинами. Как входные величины, в модельное уравнение входят как измеренные величины, так и разные поправки и коэффициенты. Расширенную и суммарную стандартную неопределенность выходной величины образует неопределенность входных величин.
Значения входных величин находят путем измерения с одноразовым или многоразовым наблюдением, или оцениванием, из внешних источников (паспортные данные на мерную посуду, весы и тому подобное). Определяют типы оценивания неопределенности (А или В) и законы распределения входных величин.
Составление бюджета неопределенности
Вычисленные вклады неопределенности удобно представлять в виде бюджета неопределенности, который включает в себя список всех входных величин Х1,...,Хm их оценок х1,...,хm вместе с принадлежащими им стандартными неопределенностями измерения u(хi) и законами их распределения, а также числами степеней свободы. Кроме этого для каждой величины таблица должна содержать вклад неопределенности.
Для занесенных в таблицу числовых значений должны указываться единицы измерения для соответствующей величины. В нижней строке бюджета неопределенности можно расположить информацию о выходной величине (входная величина Y, ее оценка у, неопределенность входной величины u(у), эффективное число степеней свободы veff, коэффициент охвата k, расширенная неопределенность U ).
Бюджет неопределенности представляет собой таблицу и является удобной основой для составления программы для оценивания неопределенности измерений в среде Excel.

Слайд 151

Современные методы оценки неопределенности

Слайд 152

Современные методы оценки неопределенности

Слайд 153

Современные методы оценки неопределенности
Недостатки подхода GUM к оценке неопределенности
В основе общего подхода

лежит т.н. закон распространения неопределенности, базирующийся на разложении нелинейной модельной функции в ряд Тейлора первого порядка. Применение такого подхода при существенно нелинейной зависимости дает смещенную оценку результата измерений и недостоверную оценку суммарной стандартной неопределенности.

При нахождении расширенной неопределенности предполагается, что закон распределения выходной величины в соответствии с центральной предельной теоремой - нормальный и коэффициент охвата хорошо аппроксимируется коэффициентом Стьюдента с числом степеней свободы, определяемым формулой Велча-Саттерсвейта. Первое предположение справедливо для случая линейного модельного уравнения, большого числа входных величин и их симметричных законов распределения.

Формула Велча-Саттерсвейта принципиально не предназначена для работы с коррелированными входными величинами и ее применение в этом случае может привести к существенной недостоверности оценивания расширенной неопределенности.

Слайд 154

Современные методы оценки неопределенности
Основываясь на указанных недостатках, было предложено применить метод статистического

моделирования (метод Монте-Карло) для определения расширенной неопределенности в измерениях.
Порядок оценивания расширенной неопределенности согласно и с использованием метода статистического моделирования Монте-Карло и применением программного обеспечения MS Excell с пакетом анализа является наиболее удобным и легко осуществленным.
Он заключается в следующих операциях :
1 Формирование массивов данных
а) Генерируют L массивов (по количеству входных величин; для абсолютного градуирования
L= 7) случайных чисел заданного объема n (n = 105), что подчиняются необходимым законам распределения. Для этого используют программу MS Excell с пакетом анализа и опцию «Генерация случайных чисел». Для входных величин, оцениваемых по типу “А”, генерируют нормально распределенные массивы с заданием среднеквадратического отклонения в соответствии с оценкой каждой входной величины. Для входных величин , оцениваемых по типу “В”,генерируют равномерно распределенные массивы из заданием симметричного диапазона оценок этих входных величин. То есть, если для дозирования объема V0 используется мерная пипетка вместимостью 10 см3, то оценка V0 будет составлять ±0,1 см3. ( от - 0,1 см3 к + 0,1 см3).
б) Формируют массив выходной величины, путем подстановки значений входных величин, которые сгенерировали, в модельное уравнение.
в) Упорядочивают (ранжируют) массив выходной величины.

Слайд 155

Современные методы оценки неопределенности
2. Расчет параметров бюджета неопределенности (расширенной и стандартной суммарной

неопределенности, коэффициента охвата) по методу Монте-Карло
По получении массива данных выходной величины определяют:
- оценку среднего результата измерения по формуле :

, где

- значение выходной величины;

- объем масива выходной величины.

- оценку суммарной стандартной неопределенности результата измерения :

- объем масива выходной величины.

- значение выходной величины;

- оценка среднего результата измерения.

, где

Слайд 156

Современные методы оценки неопределенности
- расширенную неопределенность для заданного уровня доверия. Для

получения оценки расширенной неопределенности необходимо расчитать интерквантильный интервал по формуле:

, где и

соответственно n(1+p)/2 и n(1-p)/2 члены упорядоченного масива
данных выходной величины.

Для p = 0,95 и n = 105 квантилей распределения выходной величины оцениваются для 97500 и 2500 члена упорядоченного масива выходной величины.

- оценку коэффициента охвата по формуле :

, где

- расширеная неопределенность для заданного уровня доверия;

- оценка суммарной стандартной неопределенности.

Слайд 157

Современные методы оценки неопределенности
Схема реализации алгоритма Монте-Карло

Слайд 158

Современные методы оценки неопределенности
При реализации метода Монте-Карло в среде Excell устанавливают надстройку

«Анализ данных», в которой вызывают функцию «Генерация случайных чисел»

Слайд 159

Современные методы оценки неопределенности
1. Генерируют массив из 10000 данных входной величины, оцениваемой

по типу А. В данном примере это Х - масса вещества, нанесенного в точку ТСХ пластинки, получаемая в результате расчета с использованием уравнения регрессии, описываемого калибровочную зависимость между площадью хроматографического пятна и соответствующей массы вещества.

Слайд 160

Современные методы оценки неопределенности
2. Генерируют массив из 10000 данных входной величины, оцениваемой

по типу В. В данном примере это V0 – исходный объем экстракта.

Слайд 161

Современные методы оценки неопределенности
3. Продолжают генерирование массивов из 10000 данных входных величин,

оцениваемых по типу В. В данном примере это m - масса навески препарата и Val – объем экстракта, нанесенный микрошприцом в точку на ТСХ пластинке .

Слайд 162

Современные методы оценки неопределенности
4. После того как будут сгенерированы все массивы входных

величин, в колонке «Е» будет выполнен расчет выходной величины (массовой доли трибенурон-метила) в препарате защиты растений, согласно модельного уравнения для всех 10000 значений . Полученные данные необходимо скопировать диапазоном «Е8:Е10008» и вставить в колонку “F” используя специальную вставку только «Значений», которая исключает копирование формул расчета.

Слайд 163

Современные методы оценки неопределенности
5. Для получения результата по расчету расширенной неопределенности, скопированные

данные в колонке “F” необходимо ранжировать (упорядочить) по возрастанию, используя возможности Excell. После ранжирования в ячейке «G8» будет расчитан интерквантильный диапазон, обеспечивающий получение значения расширенной неопределенности. Суммарная стандартная неопределенность расчитывается как СКО из 10000 значений выходной величины. Коэффициент охвата находят путем деления значения расширенной неопределенности на величину суммарной стандартной неопределенности.

Слайд 164

Слайд 165

Современные методы оценки неопределенности
Сколько значимых цифр?
Для измерений, проводимых посредством современных приборов, цифры

обычно выводятся в электронном виде и должны использоваться как таковые даже если не понятно какие из них реально значимы. Только когда Вы пишете конечный результат, то число следует округлить до соотвествующего числа значимых цифр.
Способ, которым записан результат, должен сказать кое-что о точности результата. Чем больше цифр приведено, тем более подразумевается точность. Значимые числа это те числа, которые содержат полезную информацию. Может быть не уместным приводить длину плавательного бассейна с точностью до долей миллиметра.
Для решения вопроса о том, что такое корректное число, необходимо знать неопределенность измерения. Это может быть следствием знаний, опыта или здравого смысла аналитика, или может быть получено из стандартного отклонения повторных экспериментов.
Если известно стандартное отклонение или 95% доверительный интервал, то записывайте эти числа с двумя значащими цифрами. Тогда результат измерения может быть записан с тем же количеством десятичных знаков. Например:(1.123±0.032) М.
Является ли полученная неопределенность разумной?
На этот вопрос нет простого ответа! Все зависит от того для ответа на какой вопрос требуется Ваш результат и как много времени и ресурсов Вам выделено. Важно, что Вы должны выдать измерение с достаточной правильностью для того, чтобы дать возможность принять
необходимое решение.

Слайд 166

Чтобы дать ответ на этот вопрос следует воспользоваться руководством EURACHEM / CITAC

Guide «Use of uncertainty information in compliance assessment», First Edition 2007.
Для принятия решения о соответствии полученного результата какой-либо спецификации, необходимо принять во внимание неопределенность измерения. На рисунке 1 показано типичные сценарии, которые возникают, когда результаты измерений, например концентрации аналита, используются для оценки соблюдения верхнего предела спецификации.

Современные методы оценки неопределенности

Слайд 167

Вертикальные линии показывают ±U расширенную неопределенность для каждого результата и связанные кривой

указывают на выведенную плотность вероятности функции для значения, показывая большую вероятность значения, находится оно рядом с центром расширенной неопределенности интервала или вблизи концов. Случаи i) и iv) достаточно ясны; результаты измерений и их неопределенности обеспечивают хорошее доказательство того, что значение соответственно значительно выше или ниже предела. В случае (ii) однако, существует высокая вероятность того, что значение выше предела, но предел тем не менее находится в диапазоне интервала расширенной неопределенности.
В зависимости от обстоятельств, особенно связанных с риском принять неправильное решение, вероятность принятия неправильного решения может быть минимизирована, чтобы оправдать решение о несоответствии результата заявленой спецификации. Аналогичным образом в случае (iii) вероятность того, что значение находится ниже предела может или не может быть достаточной, чтобы принять результат для оправдания соответствия спецификации.
Этот документ содержит дополнительные указания по настройке соответствующих критериев для принятия однозначных решений по вопросам соответствия, учитывая результаты связанные с информацией о неопределенности.
Ключом к оценке соответствия является принятие концепции «Правила разрешения». Эти правила дают рецепт для принятия или отклонения продукта, основанный на результате измерения, его неопределенности и пределов спецификации или ограничений, принимая во внимание приемлемый уровень вероятности принятия неправильного решения. На основе «Правила разрешения» определяются «зоны приемлемости» и «зоны исключения», таким образом, что если результат измерения находится в зоне приемлемости, то продукт объявляется соответствующим ,а если в зоне исключения, то продукт признается несоответствующим.

Современные методы оценки неопределенности

Слайд 168

Начало зоны исключения находится в пределах спецификации L плюс значение g, (так

называемой предохранительной полосы).
Значение g выбирается так, чтобы для измерения результата, большего или равного L+g вероятность ложного отклонения была меньше или равна α. То есть, если результат находится в зоне исключения, то принятое правило дает низкую вероятность того чтобы разрешенный предел на самом деле не было превышено. (Рис. 2 а).
На (рис 2b) g был выбран для обеспечения низкого риска ложного признания.
В общем случае g будет кратно u стандартной неопределенности. Для случая, когда распределение вероятных значений приблизительно нормально, значение 1.64*u даст вероятность 5% , а значение 2.33*u означает вероятность 1%.

Современные методы оценки неопределенности

Слайд 169

В некоторых случаях спецификация устанавливает верхний и нижний пределы, например контроля состава.
Рис

3 показывает зоны принятия и исключения для такого случая, где предохранительные полосы выбраны так, что для образца существует высокая вероятность того, что параметр находится в пределах спецификаций.
Чем больше значение u тем больше доля образцов, которые будут оцениваться неправильно. Чем меньше значение u, тем выше будет стоимость анализа. Таким образом в идеале u должна быть выбрана оптимально для минимизации затрат на анализ, однако не в ущерб правильности.

Современные методы оценки неопределенности

Информация о том как это сделать однако очень редко доступна. В некоторых случаях, когда спецификации устанавливает верхний и нижний пределы, максимальный допустимый размер u определяется как доля разницы между этих пределов. Например одна такая спецификация утверждает, что расширенная неопределенность должна быть не более чем одной восьмой части этой разницы. Общий подход должен проводить скрининг измерений с помощью метода сравнительно дешевого и относительно большой неопределенности, а проверять с помощью метода с небольшой неопределенности для этих образцов, для которых в результате скрининга не не было выработано четкого решения.

Слайд 170

Как согласуется погрешность с неопределенностью?
Формулы пересчета параметров неопределенности в параметры погрешности :

Слайд 171

Как согласуется погрешность с неопределенностью?
Формулы пересчета параметров неопределенности в параметры погрешности :

Слайд 172

Поэтапная валидация метода
Валидация - процесс установления характеристик и ограничений метода, идентификации влияний,

которые могут изменять эти характеристики и в какой степени. С другой стороны, валидация - это процесс подтверждения того, что метод является пригодным для соответствующей цели, то есть, может быть использован для решения специфической аналитической проблемы.
В соответствии со стандартом ISO/IEC 17025 все методы испытания, используемые в лабораториях, должны быть валидированы и утверждены. Валидация методов выполняется для того, чтобы достичь необходимых характеристик типа точности, воспроизводимости и надежности результатов испытания.
ОБЩИЙ НАБОР ПОКАЗАТЕЛЕЙ ВАЛИДАЦИИ
Специфичность/ селективность
Правильность/точность (процент возврата Rec)
Прецизионность (воспроизводимость SR/ сходимость Sr)
Чувствительность /(LOD, LOQ)
Линейность
Диапазон измерения
Робасность
Неопределенность U

Слайд 173

Поэтапная валидация метода
Основополагающим документом по проведению валидации аналитических методов является руководство ЕВРАХЕМ.

Слайд 174

Поэтапная валидация метода
Важные характеристики валидации для различных типов испытания
обычно не измеряется

+ обычно измеряется
(1) может быть необходим в некоторых случаях
(2) Может не требоваться в некоторых случаях

Слайд 175

Поэтапная валидация метода
Специфичность (Specificity) (Селективность)
Руководство ICH Q2A использует термин «специфичность», несмотря на

то что, например, в IUРАС в настоящее время обсуждается вопрос о замене этого термина на термин «селективность». В предварительных рекомендациях IUPAC «Селективность в аналитической химии» уточняется различие между обоими терминами следующим образом: «Специфичность является предельным случаем селективности».
Специфичность (specificity) — это способность методики безусловно определять анализируемое вещество в присутствии компонентов, которые могут быть в пробе. Как правило, ими являются примеси, продукты распада, плацебо и т. д. Отсутствие специфичности у отдельной аналитической методики может быть компенсировано использованием другой дополнительной аналитической методики.
Это определение имеет следующие приложения:
- проверка подлинности (обеспечить подлинность анализируемого вещества);
- испытания на чистоту (обеспечить тот факт, что выполненные аналитические методики позволяют правильно определить содержание примесей, т. е. родственных примесей, тяжелых металлов, остаточных растворителей и т. д.);
количественное определение (обеспечить точность измерения при определении содержания/активности анализируемого вещества в пробе).
Идеальным случаем подтверждения специфичности (селективности) является отсутствие на хроматограммах посторонних пиков из плацебо или отсутствие интерференций пиков искомого аналита с пиками холостой пробы.

Слайд 176

Поэтапная валидация метода
Например, в случае лекарственного препарата изготовленного из стандартизированого растительного экстракта

специфичность аналитической методики подтверждается путем доказательства того, что:
- все вспомогательные вещества, используемые при изготовлении лекарственного препарата, при указанных условиях хроматографирования или не дают никакого пика, или дают пики, отчетливо отличающиеся от пиков определяемого вещества;
- действующее вещество, содержащееся в экстракте, четко определяется в присутствии в экстракте других веществ;
- подлинность определяемого действующего вещества доказана с помощью какого-либо стандартного образца с известной или доказанной структурой, путем сравнения как времен удерживания, так и спектров на различных длинах волн.
Оценка специфичности методики определения наличия определенных компонентов экстракта в лекарственном препарате проводится путем сравнения ВЭЖХ-хроматограммы с хроматограммой плацебо (смеси всех компонентов без экстракта) и/или аутентичного экстракта с доказанной подлинностью или смеси стандартных образцов. Примеры хроматограмм представлены далее.

Слайд 177

Поэтапная валидация метода

Слайд 178

Поэтапная валидация метода

Слайд 179

Поэтапная валидация метода
В случае лекарственного препарата изготовленного из субстанции, полученной химическим синтезом

специфичность аналитической методики является доказаной, если ни используемый растворитель, ни подвижная фаза, ни компоненты матрикса (плацебо), ни примеси не искажают результат в пределах требуемой прецизионности.
Специфичность методики доказывается путем получения хроматограммы действующего вещества, растворителя, плацебо и (при необходимости) подвижной фазы, а также отдельных примесей. Должно быть показано, что на специфичность аналитической методики не влияет ни один из вышеназванных факторов.
Если, кроме того, эта методика также используется для исследований стабильности, необходимо проверить, не влияют ли на специфичность методики продукты деградации.
Например: Нитрендипин с тремя известными примесями.

Слайд 180

Поэтапная валидация метода

Слайд 181

Поэтапная валидация метода

Слайд 182

Поэтапная валидация метода
Селективность в анализе может принимать две ступени :
Качественная — ступень,

в которой другие вещества не влияют на определение искомых аналитов согласно применяемой процедуре анализирования образца.
Количественная — ступень, используемый в сочетании с другим словом (например постоянная, коэффициент, индекс, фактор, число) для количественной характеристики влияний (помех). Т.е. в случае интерферентных помех в определении искомого аналита необходимо введение корректировочных поправок в расчетные формулы, учитывающие влияние.
Согласно руководства ЕВРАХЕМ необходимую документацию, подтверждения селективности оформляют помимо приведенных выше хроматограмм, следующим образом:
Анализируют образец холостой пробы матрицы, как указано в описании анализа десятикратно .
Результат расчета площади в области выхода анализируемых пиков не должен отклоняться значительно от 0, т.е. фактически посторонние пики должны отсутствовать. Если все же имеется какой-либо интерферирующий компонент, то обязательно должна быть сделана коррекция нуля введением соответствующей поправки к вычислениям (вычитание площади интерферирующего компонента из площади анализируемого). Этот факт должен быть зафиксирован в методе.

Слайд 183

Поэтапная валидация метода
Диапазон (Range).
Разработка метода измерения предполагает предварительный выбор рабочего диапазона Рабочий

диапазон зависит от:
Практических целей градуировки (калибровки).
Рабочий диапазон должен включать, насколько это возможно, весь диапазон для анализирования различных образцов . Концентрация пробы, которая чаще всего встречается, должна находиться в центре рабочего диапазона.
b) Возможности технической реализации.
Получаемые значения измеряемых величин, нужно линейно соотносить с концентрациями. Это налагает некоторые требования, например, чтобы значение измеряемых величин, в нижнем пределе рабочего диапазона значимо отличались бы от значений холостого опыта. Поэтому нижний предел рабочего диапазона должен быть равен или больше предела определения данной методики. Разводить или концентрировать пробу нужно без риска систематической ошибки.
c) Дисперсия значений измеряемых величин, не должна зависеть от концентрации.
Эту независимость проверяют статистическим тестом. Суть теста заключается в проверке однородности дисперсий на границах рабочего диапазона. Данные для этого теста получают следующим образом :

Слайд 184

Поэтапная валидация метода
С целью проверки однородности дисперсий десять раз параллельно измеряют для

концентраций на нижнем и верхнем пределах (хmin и хmax) рабочего диапазона. В результате этих измерений получают десять значений измеренных величин, yij.
Оба ряда данных с концентрациями хmin и хmax используют для расчета дисперсий и по уравнению :

Дисперсии с помощью F-критерия проверяют на значимость расхождений на пределах рабочего диапазона . Для этого вычисляют с помощью уравнения значение PG:

PG сравнивают с табличными значениями квантиля F-распределения.
а) если PG b) если PG > Ff1,f2, 0.99 разница между дисперсиями значима
Если разница между дисперсиями значима, то стоит уменьшить рабочий диапазон до размеров, при которых расхождение дисперсий будет случайно.

Слайд 185

Поэтапная валидация метода
Точность (Accuracy) и правильность (Trueness)
Точность — близость соглашения между результатом

испытания и принятым референтным (приписанным) значением. Термин точность при применении к множеству (выборке) результатов испытаний включает комбинацию компонентов случайной ошибки и общей систематической ошибки или компонента смещения. Иногда употребляется термин «истинность» (trueness).
Точностью также называют количественную разницу между средним из набора результатов или индивидуального результата и значения, которое принято как истинное или правильное значение для измеренного количества. Степень соответствия между аналитическим результатом и истинным значением должна быть высокой.
Правильность аналитической методики количественного определения доказывается на всем диапазоне применения . Для этого может быть использован один из представленных далее способов.
В качестве приводимых данных для подтверждения точности обычно приводят графические данные о регрессионной зависимости коэффициента возврата (Recovery) от анализируемой концентрации и данные о распределении так называемых остатков (разниц между фактическими значениями и значениями, полученными из регрессионной зависимости). Указывают также коэффициенты возврата, RSD для них.

Слайд 186

Поэтапная валидация метода
1. Метод с плацебо с нулевым содержанием определяемого компонента.
В методе

с плацебо определяется фактор отклика действующего вещества в модельной смеси компонентов плацебо. Концентрация компонентов плацебо составляет 100% навески от номинального, указанной в методике контроля. Действующее вещество добавляется в модельную смесь в соответствии с требуемым уровнем концентрации (например, 80,100 и 120% содержания субстанции в лекарственном препарате).
2. Метод добавок
В методе добавок фактор отклика определяется путем добавления действующего вещества к образцу с известной концентрацией субстанции. Например, навеска содержит 70% целевой концентрации в пробе; затем добавками содержание субстанции доводят до 80,100,120%.
Для определения правильности при обоих методах (метод с плацебо и метод добавок) проводится как минимум 9 испытаний с не менее 3 концентрациями в определенном диапазоне применения методики (например, 3 концентрации с 3-кратным определением для каждой концентрации, с выполнением всех стадий аналитической методики).
Оценка проводится путем расчета процента нахождения известного добавленного количества действующего вещества, стандартного отклонения, коэффициента вариации (CV) и доверительного интервала среднего значения (Р - 95%).

Слайд 187

Поэтапная валидация метода
3. Метод сравнения
Сравнение результатов аналитической методики с результатами второй, независимой

и провалидированной методики. Расчет проводится с учетом статистических тестов (например, F- и t-критерии).
Для оценивания точности (правильности) используют различные критерии: 1) отношение разности величин (заданной и истинной) к заданной величине. Если процентное отклонение от заданной величины меньше 3S , правильность результатов находится в допустимых пределах;
2) по допустимому отклику в зависимости от концентрации активного компонента (см. таблицу), для биоаналитических методов – не более 15 %, за исключением предела количественного определения – не более 20 %.

Оценка правильности в зависимости от концентрации активного компонента в анализируемом образце

Слайд 188

Поэтапная валидация метода

Слайд 189

Поэтапная валидация метода
Прецизионность (precision).
Прецизионность аналитической методики выражает степень близости (степень дисперсии) между

сериями измерений, полученных при параллельных измерениях одного однородного образца, в установленных условиях.
Прецизионность может исследоваться на следующих уровнях: повторяемость, промежуточная прецизионность и воспроизводимость. Прецизионность должна оцениваться на однородных аутентичных образцах. Однако если невозможно получить однородный образец, она может определяться с использованием специально приготовленных образцов или испытуемых растворов.
Прецизионность аналитической методики обычно выражается как дисперсия, стандартное отклонение или коэффициент вариабельности серий результатов измерений.
Прецизионность зависит только от распределения случайной ошибки и не касается истинного значения или приписанного значения. Количественные меры точности критически зависят от предусмотренных условий. Сходимость (повторяемость) и воспроизводимость — специфические наборы чрезвычайных условий. [Прим. к рус. переводу. Английский термин «precision», характеризующий в аналитических измерениях степень рассеяния результатов при повторении процедуры анализа одного и того же образца, не имеет общепринятого русского эквивалента. Если прринять для него термин “воспроизводимость” (Рекомендации научного Совета по аналитической химии АН СССР, 1975), это внесет путаницу в перевод подтерминов “repeatability” («сходимость») и “reproducibility” (“воспроизводимость”), отвечающих соответственно минимальному и максимальному варьированию влияющих факторов.

Слайд 190

Поэтапная валидация метода
Во избежание недоразумений, слово “точность”, которое иногда используется для перевода

«precision», должно относиться исключительно к термину “accuracy”, характеризующему степень близости результата к истинному значению измеряемой величины. Поэтому представляется оправданным использование для «precision» несколько непривычного термина «прецизионность». Наиболее близким по значению может быть слово «кучность».]
Сходимость (повторяемость)
Сходимость должна показать, что методика анализа при проведении в одинаковых условиях обеспечивает получение сравнимых результатов.
Аналитические условия должны быть следующие.
• тот же самый лаборант
• тот же самый метод анализа
• тот же самый образец
• та же самая аппаратура
• в тот же самый день
• одни и те же реактивы
Сходимость может быть показана при помощи:
- анализа не менее 6 подготовленных проб при 100% концентрации (номинальном содержании) фармацевтической субстанции в исследуемом растворе;
- анализа не менее 9 подготовленных проб в рамках диапазона применения этой методики (например, 3 концентрации, 3 повтора).

Слайд 191

Поэтапная валидация метода
Оценка и расчет результатов проводится путем вычисления среднего значения, стандартного

отклонения, коэффициента вариации и доверительного интервала. Критерий приемлемости для коэффициента вариации необходимо устанавливать в зависимости от предполагаемых возможных значений (например, границы нормы для содержания исходного вещества в спецификации). В зависимости от определенного коэффициента вариации и границ нормы в спецификации устанавливается число испытаний, необходимых для рутинного контроля каждой пробы.
Таблица 1. Отношение между количеством анализов и коэффициентом вариации для определения достоверного отклонения от заданного значения, р = 95% [по Гриму (1973)]

Слайд 192

Поэтапная валидация метода
Пример: Если нормы количественного содержания действующего вещества в фармацевтической субстанции

составляют 100 ± 2% и коэффициент вариации аналитической методики составляет 1,5%, то при количестве испытаний n = 3, не может быть принято статистически достоверное заключение о соответствии спецификации (± 2,4% статистически достоверное). Скорее всего, для этого должно быть проведено не менее n = 4 испытаний (± 1,9% статистической достоверности).
Не имеется никаких официальных требований для максимального размера стандартного отклонения и относительного стандартного отклонения (sr) (или коэффициента вариации (CV), что фактически есть суть одно и то же). Зависит от типа анализа. Стандартное отклонение может изменяться между 2 и 20 %. Для анализа лекарственных соединений при контроле качества стандартное отклонение – менее 5 %. Для биологических и биоаналитических методов – не более 15 % для каждого концентрационного уровня. Исключение составляет определение остаточных количеств веществ, которые баллансируют на пределе количественного определения, поэтому для этого случая – не более 20 %.
Предел сходимости «r»: значение меньше чем или равное тому, для которого абсолютная разность между двумя результатами испытания, полученными в условиях сходимости, можно ожидать нахождение в пределах вероятности 95 %.
Сходимость (предел) вычисляют по формуле:
r = 2.8 * СV или r = 2.8 * Sr

Слайд 193

Поэтапная валидация метода
Принятые критерии для точности во многом зависят от типа анализа.

Американской ассоциацией аналитической химии (АОАС) утверждена программа для аналитических методов , в которой приводятся данные оценки сходимости как функции аналитических концентраций.
Данные оценки сходимости как функции концентрации анализируемого компонента

Слайд 194

Поэтапная валидация метода
Для оценивания допустимых пределов сходимости и воспроизводимости иногда прибегают к

так называемым критериям Горвица. Это расчетный критерий, устанавливающий эмпирическую зависимость между RSD (относительным СКО) и концентрацией вещества (С) в анализируемом объекте.

Критерий Горвица для расчета предела сходимости

Критерий Горвица для расчета предела воспроизводимости

Слайд 195

Поэтапная валидация метода
Воспроизводимость
Воспроизводимость - это прецизионность в условиях, когда результаты испытания получены

одним и тем же самым методом на идентичных испытательных образцах в различных лабораториях с различными операторами, использующими различное оборудование.
Пределом воспроизводимости «R» является значение меньшее либо равное тому, для которого абсолютная разность между двумя результатами испытания, полученными в условиях воспроизводимости, находится в пределах вероятности 95 %.
Воспроизводимость (предел) вычисляется по формуле: R = 2.8 * sR
Метод должен быть стабильным, то есть, характеристики должны быть воспроизводимыми при повторении от дня к дню, от лаборанта к лаборанту, от лаборатории к лаборатории, от аппарата к аппарату и т.д.
В целом воспроизводимость оценивается как степень разброса результатов, получаемых анализируемым методом. Статистическими показателями разброса результатов являются среднеквадратичное отклонение и относительный показатель разброса результатов – коэффициент вариации CV. Как правило, частным применением исследования воспроизводимости является промежуточная прецизионность. Обычно этот критерий валидации рассчитывают в пределах одной лаборатории для разных операторов или разных приборов. Воспроизводимость – понятие, предполагающее проведение более широкомасштабных межлабораторных испытаний, что не всегда доступно.

Слайд 196

Поэтапная валидация метода
Линейность
Линейность аналитической методики доказана, если в выбранном диапазоне применения можно

показать прямо пропорциональное соотношение между концентрацией исследуемого вещества в растворе и сигналом детектора (фактором отклика).
Линейность методики подтверждается в диапазоне концентраций от 80 до 120% (от номинала) действующего вещества в исследуемом растворе (на ряде разведений исходного раствора). При этом измеряется и анализируется как минимум 5 концентраций, причем значение для каждого анализа получается путем расчета среднего значения из нескольких инъекций (вколов).
Оценка проводится по наличию линейной зависимости между концентрацией вещества и сигналом с помощью подходящего регрессионного уравнения (например, полученного методом наименьших квадратов). Характеристики линейности методики выражаются в виде коэффициента корреляции, наклона прямых, а также величины отрезка на оси ординат. В качестве дополнительной информации для оценки линейности может быть приведено графическое представление и отклонение полученных значений от регрессионной прямой.
Если для рутинного контроля показателя «количественное определение» предусматривается калибровка по одной точке, то доверительный диапазон отрезка на оси ординат должен включать нулевую точку. В этом случае необходимо оценивать линейность методики в диапазоне концентраций от 10 до 120% (от номинала). Наряду с линейной функцией для определенных типов детекторов может быть показана другая математическая зависимость, причем число калибровочных точек для рутинного контроля должно быть подобрано соответствующим образом.

Слайд 197

Поэтапная валидация метода
Основные и статистически обоснованные принципы построения и оценивания калибровочных регрессионных

зависимостей изложено в :
ДСТУ ISO 8466-1-2001 «ОПРЕДЕЛЕНИЕ ГРАДУИРОВОЧНОЙ ХАРАКТЕРИСТИКИ МЕТОДИК КОЛИЧЕСТВЕННОГО ХИМИЧЕСКОГО АНАЛИЗА. Часть 1. Статистическое оценивание линейной градуировочной характеристики»
ДСТУ ISO 8466-2-2001 «ОПРЕДЕЛЕНИЕГРАДУИРОВОЧНОЙ ХАРАКТЕРИСТИКИ МЕТОДИК КОЛИЧЕСТВЕННОГО ХИМИЧЕСКОГО АНАЛИЗА. Часть 1. Принцип оценивания нелинейной градуировочной характеристики второго порядка».
ДСТУ ISO 11843-2:2004 Способность к обнаружению. Часть 2. Методология в случае линейной калибровки).
Критерии, которые обязательно должны приводиться совместно с калибровочным графиком:

Слайд 198

Поэтапная валидация метода
Тест Манделя. Во время статистической проверки на линейность, градуировочные данные

используют для расчета линейной и нелинейной градуировочной характеристики с остаточным средним квадратичным отклонением Sy1 или Sy2.

Если PG ≤ F: Нелинейная градуировочная характеристика не обеспечивает ощутимо лучшей аппроксимации, - значит, градуировочная характеристика линейна.
Если PG > F: Рабочий диапазон стоит уменьшить так, чтобы получить для него линейную градуировочную характеристику. Если это невозможно, значение измеряемых величин, для проанализированных проб нужно оценивать с применением нелинейной градуировочной характеристики.

Расхождение дисперсий DS 2 рассчитывают по уравнению : DS2 =(N-2)·S2y1 -(N-3)·S2y2
Ds2 и дисперсию нелинейной градуировочной характеристики Sy2 проверяют с помощью
F- критерия (критерий Фишера для F(0.01,1,N-3)), для выявления значимости расхождений. Для этого по уравнению рассчитывают критерий Манделя :

Слайд 199

Поэтапная валидация метода
Предел обнаружения (detection limit)
Предел обнаружения отдельной аналитической методики представляет

собой наименьшее количество анализируемого вещества в пробе, которое может быть обнаружено, но не обязательно выражено точным значением. Для инструментальных методов определяют отношение сигнал/шум или измеряют величину фонового сигнала. Для неинструментальных методов предел обнаружения определяется анализом образцов с известными концентрациями аналита и установлением минимального уровня аналита, при котором он может быть достоверно обнаружен. Согласно фармакопейной документации, установленный предел обнаружения и определения должен быть подтвержден анализом модельных смесей, содержащих аналит на пределе и близко к нему.
Предел количественного обнаружения (quantitation limit)
Предел количественного обнаружения отдельной аналитической методики представляет собой наименьшее количество анализируемого вещества в пробе, которое может быть оценено количественно с приемлемой правильностью и прецизионностью. Предел количественного обнаружения является параметром методик определения количественного содержания компонентов, присутствующих в образце плацебо (т. е. все вещества, кроме действующего вещества) в низких концентрациях, и в частности, используется для характеристики методик определения примесей и/или продуктов деградации.

Слайд 200

Поэтапная валидация метода
Предел обнаружения (детектирования) для аналитического прибора LOD
Предел обнаружения (детектирования)

прибора — самое низкое количество (выраженное как масса), которое может быть измерено с разумной статистической достоверностью. Обычно LOD определяют на стандартных растворах.
В классике жанра хроматографического метода, предел детектирования выражается как количество образца, соответствующее удвоенному или утроенному шуму анализа. Необходимость выполнения надлежащего количественного определения не является необходимым требованием при выполнении макроанализов.
Классическая формула для хроматографических методов для LOD :

Слайд 201

Поэтапная валидация метода
Для нехроматографических методов предел детектирования, выраженный как концентрация или количество

, получают из наименьшей меры xL , которая может быть обнаружена с разумной достоверностью для данной аналитической процедуры. Значение xL расчитывают по уравнению:
xL = xbl + k * sbl,
где

Предел обнаружения LOD и предел определения LOQ могут быть вычислены и расчетным методом

где LOD – предел обнаружения, LOQ – предел количественного определения, Sу – остаточное стандартное отклонение регрессионной зависимости, b – наклон калибровочной кривой.
Уравнение для нахождения предела обнаружения имеет то преимущество, что оно получается полностью из калибровочного уравнения. Более статистически «основательно» уравнение получаемое из данных калибровки, которое опубликовано ISO (ISO 11843-2:2000) (наш эквивалент ДСТУ ISO 11843-2:2004 « СТАТИСТИЧЕСКИЙ КОНТРОЛЬ. СПОСОБНОСТЬ К ОБНАРУЖЕНИЮ.
Часть 2. Методология в случае линейной калибровки») :

Слайд 202

Поэтапная валидация метода
Здесь калибровка выполняется с I независимыми калибровочными растворами (включая холостую

пробу, если возможно то раствор со значением возле предполагаемого предела детектирования), каждый измеряется J раз. К представляет число повторов, которые должны проводиться для каждого испытуемого раствора для получения усредненного отклика. Чем больше повторов Вы можете проводить, тем ниже уровень аналита Вы сможете «поймать».

Слайд 203

Поэтапная валидация метода
Возврат (Recovery)
Возврат (также употребляются термины «процентная мера правильности», «открываемость», «извлечение»,

«экстрагируемость».): частное от деления количества аналита, добавленного к образцу для испытаний (укрепленному или пробе со стандартной добавкой) до анализа, к разности результатов для укрепленного и неукрепленного образца, и выраженное в процентах; процент возврата (% Rec) рассчитывают следующим образом:

Процент возврата для анализа должен быть высоким и постоянным от анализа к анализу.
Что касается с медицинских препаратов, определение возврата должно выполняться с использованием образцов плацебо (холостых проб). В других случаях имеется свободный выбор между добавкой к плацебо (холостым пробам) или стандартными добавками.

Слайд 204

Поэтапная валидация метода
Определение возврата добавкой активного ингредиента к плацебо (холостой пробе)
Прибавьте точно

установленное количество активного ингредиента (аналита) к образцу плацебо (холостой пробе). Приготовьте образец, как изложено в обычной методике анализа. Сделайте 10 одиночных определений.
Проделайте определение возврата, добавляя около 80 %, 100 % и около 120 % ожидаемого активного содержания ингредиента (аналита) к плацебо(холостой пробе).
Особенно в случае продуктов разложения, которые образуются из активных ингредиентов (аналитов), определения возврата должны выполняться с добавкой 10 %, 50 % и 100 % ожидаемого максимального допустимого содержания, если это позволяет более низкий предел обнаружения (предел детектирования).

Анализ приемлем, если процент возврата находится между 97 и 103 % для макроопределений. Согласно Постановлению № 20 от 20.04.1999 г. Главного санитарного врача при определении содержания химических соединений в сельскохозяйственном сырье, продуктах питания и объектах окружающей среды процент возврата должен находиться в пределах от 70 до 120 % при ОСКО возврата не более 20 %. Уровень содержаний при этом предполагается от 0,01 до 0,5 мг/кг или мг/л. Если, доверительный интервал для процента возврата не включает 100%, то фактический результат должен быть исправлен с процентом возврата, т.е. коэффициент возврата должен быть задействован в формуле расчета конечного результата.

Слайд 205

Поэтапная валидация метода
Определение возврата со стандартной добавкой
Сделайте гомогенный образец плацебо (холостой пробы).

Определите содержание активного компонента (аналита) в объединенном одиночном анализе. Добавьте между 50 и 100 % количества активного ингредиента (аналита), обычно находящегося в матрице. Если уместно, можно добавить и меньшие количества (10 или 20 %) в зависимости от условий линейности и других условий анализа.
Выполните 10 определений возврата.

Ia = фактическое количество, найденное при анализе
Ip = расчетное содержание в образце (образец плацебо, холостой пробы))
It = добавленное количество к образцу

Анализ приемлем, если процент возврата попадает между 90 и 110 % (При определении следов тяжелых металлов, пестицидов и других остатков общепринятые международные соглашения допускают более широкие грницы для возврата 70–130 % и даже 60–140 %. Это зависит от содержаний и обычно регламентируется общими операционными процедурами, либо отражается в конкретных методиках анализа. Фактический результат должен быть исправлен с учетом процента возврата (что достигается введением множителя 1/Rec в расчетную формулу.

Слайд 206

Поэтапная валидация метода
Робасность
Испытание на стабильность: внутрилабораторное исследование для изучения поведения аналитического процесса,

когда производятся незначительные изменения в окружающей среде и/или эксплуатационных режимах.
Робастность (ошибкоустойчивость) аналитической процедуры является мерой ее способности оставаться незатронутой незначительными, но преднамеренными изменениями в параметрах метода и обеспечивает показателем ее надежности в течение нормального использования. (Заметим, что стабильность и робастность (ошибкоустойчивость) — синонимы.)
Определяется проведением теста правильности при небольших реальных отклонениях пара-метров методики или свойств анализируемого объекта. Процедура изучения стабильности должна показать стабильность аналитов в течение получения, обработки образца, длительного (замороженного при предписанной температуре хранения), кратковременного хранения (при температуре (20±2) °С от 4 до 24 ч), после циклов замораживания/оттаивания (три цикла) и самого аналитического процесса.
К процедуре исследования робасности метода подходят индивидуально в каждом отдельном случае. Например, метод ВЭЖХ предполагает исследование влияния отклонений содержания ингредиентов подвижной фазы от ± 5 % до ± 15 %, изменения рН подвижной фазы на ± 0,25 ед. , изменения температуры колонки на ± 5 °С, реакцию на смену колонок. Обычно при этом фиксируются данные по изменению RT или RTT, RSD площадей пиков, Rs для критичных пар пиков , асимметричность пиков, эффективность. В таких исследованиях рождается истина о приемлемости тех или иных условий, которые впоследствии и формируют критерии приемлемости хроматографической системы.

Слайд 207

Поэтапная валидация метода

Слайд 208

Поэтапная валидация метода

Слайд 209

Поэтапная валидация метода

Слайд 210

Поэтапная валидация метода

Слайд 211

Поэтапная валидация метода
Итак, как же спланировать серии экспериментов для получения исчерпывающего отчета

по валидации метода ?

Статистика в аналитической химии

Содержание

Определение понятия процесса измерения. Статистика в аналитической химииХимия, и в частности

Статистика в аналитической химииИспользование статистики в химических, клинических и фармацевтических лабораториях является

Если мы проводим эксперимент, то мы почти всегда получаем результат с погрешностью.

Статистика в аналитической химииПри оценивании величины систематической погрешности предполагается проводить эксперимент большое

Иллюстрация систематической погрешностиСтатистика в аналитической химии1. Производитель пипетки утверждает тот факт, что

Статистика в аналитической химииСлучайные и систематические ошибки в аналитической химии вызываются множеством

Статистика в аналитической химииЕсли отбросить ошибку пробоотбора, как непосредственно не относящуюся к

Статистика в аналитической химии

Статистика в аналитической химии

Статистика в аналитической химииОсновные статистические понятия в аналитическом измерении (генеральная совокупность и

Статистика в аналитической химииМера центральной тенденции любой выборки - это число, характеризующее

Статистика в аналитической химииМедиана представляет собой срединное значение данных, расположенных в восходящем

Статистика в аналитической химииСреднееВыборочное среднее (арифметическое среднее) это результат суммирования всех результатов

Статистика в аналитической химииСреднее из n данных выбранных случайно из нормально распределенной

Статистика в аналитической химииРеальные данные могут быть нормально распределены, но часто распределение

Статистика в аналитической химииСтандартное отклонение и дисперсияРазброс генеральной совокупности, демонстрируемый «тучностью» колоколообразной

Статистика в аналитической химииОтносительное стандартное отклонениеОтносительное стандартное отклонение (RSD), известное также как

Статистика в аналитической химииВ математической статистике есть так называемая центральная предельная теорема,

Статистика в аналитической химии

Статистика в аналитической химииНесколько огорчает наличие корня квадратного от n в уравнениях

Статистика в аналитической химииДоверительные интервалы и доверительные пределыСтандартное отклонение среднего говорит нам

Статистика в аналитической химииСтрогий расчет границ доверительного интервала случайной величины возможен лишь

Статистика в аналитической химииПараметры этой функции μ и σ характеризуют: μ -

Статистика в аналитической химииЧисленные значения коэффициентов пропорциональности t были впервые рассчитаны английским

Статистика в аналитической химииВеличина меньше, чем s(x) (среднее точнее единичного). Для серии

Зачем нужно проводить испытание гипотез? Статистика в аналитической химииНеизменно помни, что природа -

Одним из применений анализа полученных данных является возможность дать ответы на вопросы

Статистическая значимость, или так называемый Р - уровень значимости - это основной

Статистика в аналитической химии

Статистика в аналитической химииПроверка гипотез обычно проходит следующие этапы: 1. Определение используемой

Статистика в аналитической химииОдносторонние и двусторонние критерии проверки значимости Если цель исследования

Статистика в аналитической химииСтатистические критерии - это инструмент, для того чтобы иметь

Статистика в аналитической химииЕсли же есть дополнительная информация, например, из предшествующих экспериментов,

Статистика в аналитической химииВыбор подходящего статистического метода для проверки гипотезыКритерий t-Стьюдента для

Статистика в аналитической химииКритерий t-Стьюдента для зависимых выборок Этот метод позволяет проверить

Статистика в аналитической химииЧто такое метод ANOVA ?ANOVA (Analysis of Variance) –

Статистика в аналитической химииОднофакторный ANOVAВ однофакторном ANOVA имеются уровни исследуемого фактора с

Статистика в аналитической химииКонкретная планировка представления данных ANOVA в межлабораторных сличительных испытаниях

Статистика в аналитической химииЭтапы в вычислении ANOVA таковы:

Статистика в аналитической химии

Статистика в аналитической химииТаким образом, результат расчетов представляют в виде следующей таблицыгде

Статистика в аналитической химииОстаточный средний квадрат является оценкой средней дисперсии результатов в

Статистика в аналитической химииМатрица данных в этом случае будет иметь пять колонок

Статистика в аналитической химииПроверка на нормальность распределения данныхМногие статистические параметры, используемые химиками

Статистика в аналитической химииКритерий согласия Пирсона (χ2) применяют для проверки гипотезы о

Статистика в аналитической химииДалее определяют вспомогательные данные для расчета наблюдаемого критерия согласия

Статистика в аналитической химии

Статистика в аналитической химии Критерий Шапиро-Уилка.Этот критерий является одним из наиболее мощных

Статистика в аналитической химии Этот критерий применяется, когда выборка содержит малое количество

Статистика в аналитической химии

Статистика в аналитической химииИмеется и полезная графическая процедура для испытания нормальности набора

Статистика в аналитической химииЕсли данные распределены нормально, то график должен быть линеен.

Статистика в аналитической химииРанкит-график первичной обработки данныхОчевидно, что точка 0.9083 М не

Статистика в аналитической химииПовтор ранкит-теста для данных с первым удаленным выпавшим значением

Статистика в аналитической химииЗавершающий ранкит-тест

Статистика в аналитической химииОчевидно, что точки-данные 0.092, 0.0936, 0.1177, 0.1219, 0.1222, и

Статистика в аналитической химииТесты на выпавшие значенияВыпавшее значение, есть значение, которое не

Статистика в аналитической химииРезультат применения Excell для выполнения теста Грубба рассмотрим на

Статистика в аналитической химии

Статистика в аналитической химииТак как Gsuspect > Gcritical значение 16.65 мг/г является

Статистика в аналитической химииОдносторонний t - тест Систематическая погрешность в аналитической методике

ПРИМЕР :Содержание фтора в зубной пасте согласно метода измеряется с использованием ионселективного

Статистика в аналитической химии

Приписанное значение лежит непосредственно за 95% доверительного интервала, что дает нам возможность

Статистика в аналитической химииПарный t - тест В некоторых случаях у нас

Статистика в аналитической химииa атомно-абсорбционная спектрофотометрия. bКомплексонометрическое титрование.

Статистика в аналитической химииВероятность того, что между методиками нет разницы, рассчитанная по

Статистика в аналитической химииНаиболее часто используемые тесты однородности дисперсий двух и более

Статистика в аналитической химии

Статистика в аналитической химии

Статистика в аналитической химииАнализ однородности дисперсий по Бартлетту Назначение. Проверка гипотезы о

Статистика в аналитической химииЕсли рассчитанное значение χ2 больше или равно критическому значению,

Статистика в аналитической химии

Определение понятия процесса измерения.
Статистика в аналитической химии
Химия, и в частности

Статистика в аналитической химии
Использование статистики в химических, клинических и фармацевтических лабораториях является

Статистика в аналитической химии
При оценивании величины систематической погрешности предполагается проводить эксперимент большое

Иллюстрация систематической погрешности
Статистика в аналитической химии
1. Производитель пипетки утверждает тот факт, что

Статистика в аналитической химии
Случайные и систематические ошибки в аналитической химии вызываются множеством

Статистика в аналитической химии
Если отбросить ошибку пробоотбора, как непосредственно не относящуюся к

Статистика в аналитической химии
Основные статистические понятия в аналитическом измерении (генеральная совокупность и

Статистика в аналитической химии
Мера центральной тенденции любой выборки - это число, характеризующее

Статистика в аналитической химии
Медиана представляет собой срединное значение данных, расположенных в восходящем

Статистика в аналитической химии
Среднее
Выборочное среднее (арифметическое среднее) это результат суммирования всех результатов

Статистика в аналитической химии
Среднее из n данных выбранных случайно из нормально распределенной

Статистика в аналитической химии
Реальные данные могут быть нормально распределены, но часто распределение

Статистика в аналитической химии
Стандартное отклонение и дисперсия
Разброс генеральной совокупности, демонстрируемый «тучностью» колоколообразной

Статистика в аналитической химии
Относительное стандартное отклонение
Относительное стандартное отклонение (RSD), известное также как

Статистика в аналитической химии
В математической статистике есть так называемая центральная предельная теорема,

Статистика в аналитической химии
Несколько огорчает наличие корня квадратного от n в уравнениях

Статистика в аналитической химии
Доверительные интервалы и доверительные пределы
Стандартное отклонение среднего говорит нам

Статистика в аналитической химии
Строгий расчет границ доверительного интервала случайной величины возможен лишь

Статистика в аналитической химии
Параметры этой функции μ и σ характеризуют: μ -

Статистика в аналитической химии
Численные значения коэффициентов пропорциональности t были впервые рассчитаны английским

Статистика в аналитической химии
Величина меньше, чем s(x) (среднее точнее единичного). Для серии

Зачем нужно проводить испытание гипотез?
Статистика в аналитической химии
Неизменно помни, что природа -

Статистика в аналитической химии
Проверка гипотез обычно проходит следующие этапы:
1. Определение используемой

Статистика в аналитической химии
Односторонние и двусторонние критерии проверки значимости
Если цель исследования

Статистика в аналитической химии
Статистические критерии - это инструмент, для того чтобы иметь

Статистика в аналитической химии
Если же есть дополнительная информация, например, из предшествующих экспериментов,

Статистика в аналитической химии
Выбор подходящего статистического метода для проверки гипотезы
Критерий t-Стьюдента для

Статистика в аналитической химии
Критерий t-Стьюдента для зависимых выборок
Этот метод позволяет проверить

Статистика в аналитической химии
Что такое метод ANOVA ?
ANOVA (Analysis of Variance) –

Статистика в аналитической химии
Однофакторный ANOVA
В однофакторном ANOVA имеются уровни исследуемого фактора с

Статистика в аналитической химии
Конкретная планировка представления данных ANOVA в межлабораторных сличительных испытаниях

Статистика в аналитической химии
Этапы в вычислении ANOVA таковы:

Статистика в аналитической химии
Таким образом, результат расчетов представляют в виде следующей таблицы
где

Статистика в аналитической химии
Остаточный средний квадрат является оценкой средней дисперсии результатов в

Статистика в аналитической химии
Матрица данных в этом случае будет иметь пять колонок

Статистика в аналитической химии
Проверка на нормальность распределения данных
Многие статистические параметры, используемые химиками

Статистика в аналитической химии
Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о

Статистика в аналитической химии
Далее определяют вспомогательные данные для расчета наблюдаемого критерия согласия

Статистика в аналитической химии

Критерий Шапиро-Уилка.
Этот критерий является одним из наиболее мощных

Статистика в аналитической химии

Этот критерий применяется, когда выборка содержит малое количество

Статистика в аналитической химии
Имеется и полезная графическая процедура для испытания нормальности набора

Статистика в аналитической химии
Если данные распределены нормально, то график должен быть линеен.

Статистика в аналитической химии
Ранкит-график первичной обработки данных
Очевидно, что точка 0.9083 М не

Статистика в аналитической химии
Повтор ранкит-теста для данных с первым удаленным выпавшим значением

Статистика в аналитической химии
Завершающий ранкит-тест

Статистика в аналитической химии
Очевидно, что точки-данные 0.092, 0.0936, 0.1177, 0.1219, 0.1222, и

Статистика в аналитической химии
Тесты на выпавшие значения
Выпавшее значение, есть значение, которое не

Статистика в аналитической химии
Результат применения Excell для выполнения теста Грубба рассмотрим на

Статистика в аналитической химии
Так как Gsuspect > Gcritical значение 16.65 мг/г является

Статистика в аналитической химии
Односторонний t - тест
Систематическая погрешность в аналитической методике

ПРИМЕР :
Содержание фтора в зубной пасте согласно метода измеряется с использованием ионселективного

Статистика в аналитической химии
Парный t - тест
В некоторых случаях у нас

Статистика в аналитической химии
a атомно-абсорбционная спектрофотометрия. bКомплексонометрическое титрование.

Статистика в аналитической химии
Вероятность того, что между методиками нет разницы, рассчитанная по

Статистика в аналитической химии
Наиболее часто используемые тесты однородности дисперсий двух и более

Статистика в аналитической химии
Анализ однородности дисперсий по Бартлетту
Назначение. Проверка гипотезы о

Статистика в аналитической химии
Если рассчитанное значение χ2 больше или равно критическому значению,