RU EN
Интернет-портал Российского общества клинической онкологии

Новости онкологии Медицинская статистика пошагово

23.01.2023

Медицинская статистика пошагово. Шаг 1. Основные понятия статистического анализа

Козлов Николай Александрович
Котов Максим Андреевич
Хирург, онколог хирургического отделения опухолей головы и шеи ФГБУ «НМИЦ онкологии им. Н.Н. Петрова» Минздрава России, кандидат медицинских наук, Санкт-Петербург.
Выпускник образовательной программы Global Online Fellowship in Head and Neck Surgery and Oncology. Изучал статистику в институте биоинформатики (онлайн-курс «Основы статистики»), курс портала medstatistic.ru «Основы медицинской статистики и систематические обзоры».

Клинические исследования в медицине направлены на получение данных об эффективности различных методов лечения, точности методов диагностики, распространенности заболеваний и состояний. В основе научной работы при проведении исследований лежит формулирование научного вопроса, разработка дизайна исследования, который предполагает сбор и анализ, и интерпретацию данных. Статистический анализ данных имеет в своем арсенале большое количество статистических критериев. Для правильного выбора статистического критерия необходимо знать виды статистики, типы данных, типы переменных и сами принципы выбора статистического критерия для анализа.

Важно понимать, что, проводя научные исследования, мы хотим понять, как работает тот или иной метод лечения или насколько точен определенный метод лечения у определенной группы пациентов. Поэтому необходимо понимать определения генеральной и выборочной совокупности.

Генеральная совокупность (population) – это совокупность всех объектов, обладающих общими признаками, и относительно которых нам хочется делать какие-либо выводы при анализе некоторой конкретной задачи. Например, если исследуется эффективность хирургического лечения рака полости рта, то в этом случае под генеральной совокупностью понимаются абсолютно все пациенты с диагнозом рак полости рта. Мы не знаем точного количества объектов, составляющих генеральную совокупность, и не можем включить все объекты в исследование для ответа на поставленный нами научный вопрос. Поэтому при проведении исследований используется выборочная совокупность.

Выборочная совокупность/выборка (sample) – та часть генеральной совокупности, которая отбирается в рамках исследования, на основе которой будет описываться генеральная совокупность и которая будет отражать закономерности, свойственные генеральной совокупности.

Все данные можно разделить на две большие группы (типа): количественные и категориальные (качественные).

Количественный тип данных представлен числами, которые могут быть как целыми, так и дробными, они имеют математическое значение и смысл. Например, количественными данными могут быть возраст в годах, протяженность опухоли в сантиметрах, количество метастатически пораженных лимфатических узлов средостения.

Категориальный (качественный) тип данных представлен характеристиками, которые нельзя измерить числами, например, пол пациента, характер получаемого лечения (хирургическое лечение, лучевая терапия). Категориальные данные также могут принимать числовые значения (например: 1 – мужчина, 2 – женщина). При этом эти числа не имеют математического значения, то есть нельзя их складывать, вычитать, умножать, делить и возводить в степень. Число – это только кодировка характеристики (признака) объекта исследования.

Категориальные данные подразделяются на порядковые и номинальные, которые в свою очередь подразделяются на бинарные и мультиномиальные.

Порядковый тип данных позволяет ранжировать (упорядочивать) объекты, если указано, какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. Однако они не позволяют определить, «на сколько больше» или «на сколько меньше» данного качества содержится в переменной. В отличие от количественных переменных, порядковые значения не могут иметь дробные или промежуточные значения, которые не известны заранее, а от номинальных переменных они отличаются тем, что должны иметь 3 и более значений, и должны быть расположены в порядке возрастания или порядке убывания.

Примером порядковой переменной является стадия по TNM, статус ECOG, степень дифференцировки опухоли, возрастная группа.

Бинарные данные имеют только два значения признака (как правило, его наличие или отсутствие), в то время как мультиномиальные – 3 и более значений.

Примером бинарных данных является наличие отдаленных метастазов (1 – метастазы есть, 0 – метастазов нет), летальный исход (0 – нет, 1 – есть) или наличие сопутствующих заболеваний (0 – нет, 1 – есть).

Примером мультиномиальных переменных является локализация опухоли (1 – желудок, 2 – толстый кишечник, 3 – поджелудочная железа), метод лечения (1 – хирургическое, 2 – лучевая терапия, 3 – химиотерапия, 4 – таргетная терапия).

Важно также понимать, что типы данных можно преобразовывать друг в друга. Например, уровень гемоглобина в крови можно представить в виде количественной переменной (100 г/л), в виде качественной бинарной переменной (нормальный уровень гемоглобина/сниженный уровень гемоглобина) и порядковой переменной (анемия легкой степени/ анемия средней степени/ анемия тяжелой степени).

Все статистические методы подразделяются на описательные и аналитические.

Описательная статистика позволяет описать данные, но не позволяет сделать статистических выводов. Например, мы можем вычислить долю мужчин и женщин в исследуемой группе пациентов, определить средний уровень креатинина у пациентов или узнать наиболее частую гистологическую форму опухоли.

Аналитическая статистика используется для проверки различных гипотез и уже позволяет делать статистические выводы, основываясь на нахождении закономерностей в исследуемой выборочной совокупности.

Описательная статистика для характеристики данных использует понятия усредненного значения признака (мера центральной тенденции) и уровень его вариабельности (мера дисперсии).

К мерам центральной тенденции относятся среднее арифметическое, медиана и мода.

Среднее арифметическое (mean, M) – число, равное сумме всех чисел множества, деленной на их количество. Основная проблема среднего арифметического – высокая чувствительность к выбросам, то есть выраженным значениям признака.

Медиана (median, Me) – значение, которое разделяет выборку на две части, если проранжировать все значения признака в выборке от меньшего к большему. Например, очень часто в клинических исследованиях в области онкологии используется понятие медиана выживаемости, которая измеряется в месяцах (неделях, годах). Медиана выживаемости, равная 8 месяцам, означает, что половина исследуемых живы в течение 8 месяцев от начала исследования.

Мода (mode, Mo) – наиболее часто встречающееся значение в выборке.

Меры вариабельности признака показывают степень разнородности выборки, к которым относят размах, стандартное отклонение и межквартильный размах.

Размах (range) – минимальное и максимальное значение признака.

Стандартное отклонение (standard deviation, SD, «сигма») показывает, насколько в среднем все значения отклоняются от среднего арифметического. Рассчитывается как квадратный корень из суммы квадратов отклонений каждого значения от среднего, деленой на количество наблюдений (n) или n-1 (при n<30).

Чем шире размах значений и чем чаще встречаются значения, отличные от средней, тем выше стандартное отклонение.

Стандартная ошибка (Standard Error, SE) – мера соответствия выборочных данных генеральной совокупности. Показывает, насколько исследуемая выборка соответствует генеральной совокупности (мера репрезентативности выборки). Стандартная ошибка увеличивается с увеличение величины стандартного отклонения и уменьшается с увеличение количества исследуемых объектов.

Доверительный интервал (confidence interval, CI) – интервал значений, в котором с определенной долей вероятности (обычно 95%) можно ожидать нахождение среднего значения. Доверительный интервал рассчитывается исходя из стандартной ошибки. Чем меньше количество исследуемых объектов и выше стандартная ошибка, тем шире доверительный интервал. Например, в публикации вы можете встретить, что медиана безрецидивной выживаемости в группе пациентов, получивших лечение цисплатином, составила 6,4 месяца (95% ДИ 4,2-8,6). Это означает, что в генеральной совокупности пациентов медиана безрецидивной выживаемости в 95% случаев будет находиться в диапазоне от 4,2 до 8,6 месяца.

Межквартильный интервал (interquartile range, IQR) – значение между первым и третьим квартилями, или 25-м и 75-м процентилем.

При анализе количественных данных для правильного выбора критерия статистического анализа необходимо знать, как распределены данные – нормально или нет.

Нормальное распределение, или распределение Гаусса, имеет следующие критерии. Если нарисовать гистограмму частот распределения, то она имеет вид симметричного колокола.

Гистограмма нормального распределения

Рисунок 1. Гистограмма нормального распределения.

  • Среднее арифметическое значение равно моде, то есть средние значения встречаются наиболее часто.
  • Среднее арифметическое значение равно медиане, то есть раненые распределены симметрично.
  • Соблюдение правила Гаусса или правила «трех сигм»: в интервале M±1σ находится 68,3% исследуемых значений, M±2σ – 95,4% значений, M±3σ – 99,7%.

При нормальном распределении переменные описываются при помощи среднего арифметического, стандартного отклонения (SD) или стандартной ошибки (SE), а для графического представления данных используют гистограммы. Для анализа нормально распределенных количественных переменных используются методы параметрической статистики.

Все типы распределения, которые не соответствуют критериям нормального распределения, называются ненормальными. При ненормальном распределении переменные описываются при помощи медианы и межквартильного интервала, а для графического представления данных используют ящичные диаграммы (box plot, «ящик с усами»). Для анализа нормально распределенных количественных переменных используются методы непараметрической статистики.

График «ящик с усами», box plot

Рисунок 2. График «ящик с усами», box plot.

Для того чтобы понять, нормально ли распределены количественные данные или нет, используют два метода – визуальный и использование статистических критериев (Шапиро-Уилка и Колмогорова-Смирнова).

Визуальный метод оценки заключается в построении графика – гистограммы распределения частот изучаемой переменной. В том случае, если визуально построенная гистограмма похожа на гистограмму распределения частот в виде симметричного колокола, данное распределение нормальное. Это самый быстрый способ оценки нормальности распределения количественных данных. К визуальным методам также относятся такие методы оценки, как оценка показателей эксцесса, асимметрии и коэффициента вариации.

Критерий Колмогорова-Смирнова используется при наличии более 50 наблюдений в выборке, а критерий Шапиро-Уилка – в случае менее 50 наблюдений. Данные статистические критерии тестируют гипотезу о том, что исследуемое распределение данных отличается от нормального распределения. Если по результатам теста мы получаем значение уровня значимости p-value >0,05, распределение считается нормальным, так как отличие исследуемого распределения нормального распределения статистически незначимое.

Для понимание статистического анализа необходимо также понимание группирующей переменной, а также связанной и несвязанной выборки.

Группирующая (или кодирующая) переменная используется для разделения исследуемой выборочной совокупности на группы наблюдений. Обычно группирующая переменная является категориальной (содержит непрерывные значения 1,2,3,4,5). Например, группирующей переменной может быть пол (мужчины, женщины), стадия опухолевого процесса по TNM AJCC (I, II, III, IV), метод лечения (хирургическое, химиолучевая терапия, лучевая терапия).

Независимые (несвязанные) выборки (independent samples) – выборочные совокупности, в которые объекты исследования набирались независимо друг от друга. Примером независимых выборок является исследование разных пациентов, получающих разное лечение (хирургическое и лучевую терапию). Для исследования независимых выборок используются независимые статистические тесты (independent sample test).

Пациент Уровень нейтрофилов в крови у пациентов, получавших химиотерапию (109 /л) Уровень нейтрофилов в крови у пациентов, получавших иммунотерапию (109 /л)
Пациент №11,21,8
Пациент №20,92,1

Зависимые (связанные) выборки (depending samples, linked samples) состоят из одних и тех же объектов исследования, обследованных в разные моменты времени. Примером зависимых выборок является измерение количества нейтрофилов у одних и тех же пациентов с нейтропенией до и после введения колониестимулирующего фактора. Для исследования независимых выборок используются парные статистические тесты (paired test, dependent sample test).

Пациент Уровень нейтрофилов в крови у пациента до введения колониестимулирующего фактора (109 /л) Уровень нейтрофилов в крови у пациента через 24 часа после введения колониестимулирующего фактора (109 /л)
Пациент №10,51,0
Пациент №20,30,9

Заключение

В шаге 1 мы рассмотрели понятие генеральной и выборочной совокупности, методы описательной статистики, типы данных и переменных, а также варианты распределения количественных данных. Для того чтобы правильно выбрать статистический критерий при планировании собственного исследования либо оценить правильность выбранного критерия при критическом чтении научных статей, необходимо:

  1. определить количество исследуемых групп;
  2. определить, являются ли группы зависимыми или нет;
  3. определить тип данных (количественные, качественные);
  4. для количественных данных определить тип распределения (нормальное или нет).

В последующих шагах мы будем рассматривать различные статистические тесты, которые применяются для анализа данных в клинических исследованиях, как они работают, в каких случаях применяются и, самое главное, как интерпретировать полученные результаты.