Это - учебно-методические материалы по медицинской информатике и статистике с сайта 1mgmu.com
Увеличить шрифт ::
Уменьшить шрифт
9.2.3 Использование электронной таблицы Excel для проведения расчетов по медицинской статистике
Определение достоверности различия наборов частот
Хотя полученные в пункте 2 величины частот и визуально отличаются друг от друга, но имеющиеся различия могут быть случайными флюктуациями.
Проверим статистическую гипотезу о том, что доля серопозитивных во всех возрастных группах одинакова при помощи критерия «хи-квадрат».
Суммарная доля СД серопозитивных с защитным титром была получена в D12 и была примерно равна 41,71%. Для каждой k-ой возрастной группы рассчитаем ожидаемое количество серопозитивных Nо(k), умножив количество наблюдений в данной группе на суммарную долю СД. Таким образом, Nо(k) – сколько бы в этой группе было серопозитивных, если бы доля серопозитивных в группе в точности совпадала с долей серопозитивных среди всех наблюдений. Полученное ожидаемое число на обязательно должно быть целым.
Теперь для каждой k-ой группы рассчитаем существенность разницы D(k) между фактическим n и ожидаемым Nо(k) количествами как
D(k)=(Nо(k)-n)*(Nо(k)-n) / Nо(k)
Для группы в целом просуммируем D(k)-ые по подгруппам.
В том случае, если все различия в частотах случайны, полученная сумма должна быть распределена как «хи-квадрат распределение» с числом степеней свободы, на единицу меньше числа сравниваемых подгрупп. Так как это распределение в Excel затабулировано, то можно определить вероятность того, что полученное или большие значения суммы могут быть результатом случайных флюктуаций частот. Полученная вероятность – доверительная вероятность нулевой гипотезы о равенстве частот в подгруппах. Если она слишком маленькая, то нулевая гипотеза отвергается.
В данном случае полученная величина вероятности очень мала, поэтому гипотеза о том, что наблюдаемые различия обусловлены случайными флюктуациями, явно можно отвергнуть.
При содержательном анализе виден высокий уровень антител у детей первого года жизни, потом – резкий спад с постоянным возрастанием титров с увеличением возраста. Ожидаемая причина высокого уровня антител у детей первого года – пассивный иммунитет у детей на естественном или смешанном вскармливании.
Однако для уточнения тенденций желательно более подробно определить, какие различия достоверны, а какие нет. Зададим доверительную вероятность p=0,05. Для точного определения доверительных границ можно воспользоваться статистическими таблицами, однако приблизительное значение можно рассчитать при помощи затабулированной функции КРИТБИНОМ. Она считает величину, не совсем совпадающую с тем, что нам нужно, но близкую к ней. Это различие мало в том случае, если число успешных и неуспешных испытаний не слишком мало (например, порядка 10 или более). В нашем случае успешные испытания – выявление антител, неуспешное испытание – их отсутствие.
Функция КРИТБИНОМ рассчитывает самое большое и малое количество наблюдений, которое (при заданной доверительной вероятности) может быть для данной вероятности события и частоте наблюдений. Поэтому функция КРИТБИНОМ позволяет определить доверительные границы к частоте наблюдаемого события при заданной вероятности, тогда как нам нужно решить обратную задачу – рассчитать доверительные границы к вероятности при заданной частоте.
Обычно в медицине рассчитывают двусторонние доверительные границы. Например, применительно к частоте для заданной доверительной вероятности p определяют Чмин и Чмакс, такие, что с вероятностью 1-p истинная вероятность ИВ события лежит в пределах от Чмин и Чмакс. Следовательно, сумма вероятностей событий ИВ<Чмин и ИВ>Чмакс должны быть равна p. Обычно доверительные границы выбирают таким образом, чтобы вероятности этих двух событий были одинаковы, то есть равны p/2. Поэтому для определения Чмин можно рассчитать, для какого количества Nmin вероятность того, что успешных наблюдений будет менее Nmin, равна p/2.
Для оценки сверху нужно еще поменять знак неравенства, так как КРИТБИНОМ считает вероятность события «число наблюдений меньше заданного». Но если ИВ>Чмакс с вероятностью p/2, то ИВ меньше или равно Чмакс с вероятностью 1- p/2. Поэтому для оценки сверху нужно брать альфу, равную 1- p/2.
Еще раз обращаю внимание на то, что КРИТБИНОМ позволяет рассчитать только приблизительные границы, так как считает их для не совсем той статистической гипотезы, которая проверяется. Поэтому на мелкие неточности типа того, какое неравенство проверяется – «меньше» или «меньше или равно» - можно не обращать внимания.
Для окончательных графиков желательно поменять приблизительные величины границ на точные. Таблица для их расчета приведена в книге, на которую в теоретической части есть ссылка.
Полученные статистические погрешности в современной медицине принято показывать в форме «рогатых графиков».
Оглавление раздела нижнего уровня
Оглавление раздела верхнего уровня
ОГЛАВЛЕНИЕ ОГЛАВЛЕНИЙ
НА ГЛАВНУЮ СТРАНИЦУ САЙТА
Материалы используются на Едином Образовательном Пространстве Первого московского государственного медуниверситета им. И.М. Сеченова