Therapia

2007 > №1 (11)

Медицина доказательная

Доказательная медицина: методы терапии и профилактики

В.В. Власов, д-р мед. наук, профессор, директор Российского отделения Кокрановского сотрудничества, вице-президент Общества специалистов доказательной медицины

Испытания методов лечения и профилактики

Полноценная статья должна содержать наиболее важные сведения, приведенные в табл.1. Отсутствие любого из перечисленных элементов означает неполноценную методику исследования или неполное сообщение о его проведении. Полный документ с требованиями к отчетам об РКИ доступен на сайте http://www.consort-statement.org/, а русский перевод — на http://www.mediasphera.ru/recom/consort.htm; несоответствие отчета об РКИ первым семи критериям означает крайне низкое качество исследования. В таких исследованиях возможны очень большие ошибки.

РКИ дают наиболее надежные сведения об эффектах лечебных и профилактических вмешательств. В известном смысле все лечебные вмешательства являются профилактическими, поскольку нацелены на предотвращение неблагоприятных исходов. В свою очередь, неблагоприятный исход — это сохранение текущего состояния, которое расценивается как неблагоприятное, или возникновение новых событий, расцениваемых как неблагоприятные. Часто говорят о благоприятных исходах вмешательства, но это то же, что снижение частоты неблагоприятных исходов: снижение летальности (частоты неблагоприятного исхода) равняется частоте полезного исхода (повышению выживаемости). Поскольку РКИ дают самые надежные сведения об эффективности лечения, следует ориентироваться на результаты именно таких исследований в поиске ответа на клинический вопрос.

Почему не следует рассматривать другие испытания, несмотря на то, что они несут некоторую полезную информацию, пусть и менее надежную? Этот вопрос детально исследовали участники Кокрановского сотрудничества (www.cochrane.org). Действительно, исследования других типов, например, анализы текущей практики, несут дополнительную информацию. Однако, ввиду несовершенства этих исследований, их результаты являются очень неопределенными, а число таких исследований очень велико. Поэтому врач не в силах оценить результаты таких исследований. Более того, даже авторы систематических обзоров [1] обычно отказываются от использования результатов таких исследований по той же причине — эти сведения ненадежны, и их трудно сопоставить с результатами РКИ.

Именно из-за плохо проведенных первичных испытаний множество пациентов было подвергнуто «лечению», которое позднее при правильной проверке оказалось неэффективным или вредным — лигированию внутренней грудной артерии; иммуностимуляции левамизолом; гормонозаместительной профилактике хронической ИБС в постменопаузальный период. Колоссальные средства здравоохранения были затрачены и продолжают расходоваться на никогда не испытывавшиеся новшества типа диспансеризации или родовых сертификатов. Список методов лечения и организации помощи, которые при доброкачественных испытаниях оказались бесполезными, можно продолжать на многих страницах. Поэтому проще и правильнее отказаться от проведения исследований низкого качества, чем пытаться их осмыслить.

Способ анализа данных в РКИ

Часть пациентов могут отказываться от назначенного лечения или по другим причинам подвергаться необходимому, но не запланированному в испытании на основании рандомизации лечению. Следовательно, возникает проблема: к какой группе таких больных относить? Существует несколько основных решений этой проблемы.

Пациентов, которым не проводили лечение, положенное по рандомизации, можно анализировать в зависимости от полученного лечения (анализ ‘as treated’, англ.). Недостаток этого анализа состоит, в частности, в том, что переходить на «традиционное лечение» могут преимущественно пациенты с большей тяжестью болезни, и чаще это происходит при применении более инвазивного метода лечения. Соответственно исходы «традиционного лечения» могут быть ухудшены, а нового — выглядеть лучше, чем они есть на самом деле. Иногда бывает наоборот, поскольку инвазивное лечение кажется «необходимым», больной отказывается от лечения, положенного по рандомизации. Например, поскольку высокодозовая химиотерапия в середине 90-х годов прошлого века выглядела как самый эффективный способ лечения рака молочной железы, многие пациентки искали пути к ее получению, несмотря на то, что испытания еще не дали убедительных результатов. В 1999 г. выяснилось, что у такого лечения — крайне тяжелого для женщин — нет преимуществ.

Больных, прекративших экспериментальное лечение, можно не включать в контрольную группу и пациентов в контроле, перешедших на испытываемое лечение, — тоже, просто исключать из анализа. Это называется анализом в соответствии с выполнением протокола (per protocol, англ.). Это тоже плохой метод, поскольку, например, побочные эффекты могут быть более выражены у более тяжелых больных, и их исключение изменит исходы в опытной группе. В группе плацебо таких случаев непереносимости лечения будет, как правило, меньше. Результат лечения с использованием нового метода в данном примере будет завышен.

Наиболее правильным, хотя и не идеальным, является метод анализа в соответствии с назначением по результатам рандомизации (intention to treat analysis, ITT, англ.). При таком анализе исходы лечения рассматривают у больных в группах, выделенных при рандомизации, независимо от того, какое лечение они фактически получили. Сегодня этот метод анализа является общепринятым. Главное его достоинство в том, что этот метод моделирует реальную практику. Ведь врач выбирает лечение сегодня, не зная точно, как придется вести пациента завтра, но для него желательно знать, что с точки зрения перспективы больного, независимо от того, сможет ли он регулярно принимать лекарство, выбор сегодня — правильный. Одновременно метод анализа в соответствии с назначенным лечением прост для понимания и дает, видимо, несколько заниженную оценку фактической разницы между сравниваемыми методами. Это важно для осторожных практических выводов из результатов испытаний.

Статистическая и клиническая значимость результатов

При изучении лечения и профилактики заболеваний ту часть риска, которая устраняется применением изучаемого вмешательства, называют эффективностью лечения (effectiveness, англ.). В эксперименте, т.е. в строгих условиях клинического испытания, оценивается аспект эффективности, называемый действенностью вмешательства (efficacy, англ.). Поскольку оценивают результат испытания методом анализа в зависимости от назначенного лечения, иногда этот аспект эффективности называют эффективностью использования (use-effectiveness, англ.). В клинической практике по различным причинам полезность вмешательства обычно бывает меньше. Эффективность вмешательства как метода лечения, в принципе, с учетом привходящих моментов, влияющих на исходы, иногда называют эффективностью метода (method-effectiveness, англ.) или «практической эффективностью» — в противопоставление «идеальной эффективности», изучаемой в условиях клинического испытания.

В хорошем исследовании обязательно должны быть отслежены конечные результаты, клинически важные исходы. Без них обоснование метода лечения является неполноценным. Так, истории известен пример лечения желтой лихорадки американским доктором Benjamin Rush путем кровопускания. Он лечил по 100 человек в день, и ни один из них не умер в процессе лечения. Правда, отдаленных результатов никто не наблюдал. Это не мешало B. Rush на протяжении длительного времени отстаивать свой метод лечения.

Выясните, не представляет ли автор статистически значимые, но малые различия как клинически значимые? Статистически значимо то, что действительно существует с высокой вероятностью. Обычно это обозначают P<0,05, что свидетельствует: отсутствие различия имеет низкую вероятность — меньше 5%. Клинически значимо то, что своими размерами (например, величиной снижения смертности) убеждает врача в необходимости изменить свою практику в пользу нового образа действий. Если различия статистически незначимы, то следует проверить, достаточна ли численность обследованных.

Вычисление показателей действенности вмешательства

Для выражения результата вмешательства, величины эффекта используют ряд показателей, часть из которых правильно отражает клиническую значимость эффекта ЛС, а часть — нет. Вычисления иллюстрирует табл. 2.

Сопоставляя два вида лечения (или лечение с тактикой невмешательства), сравнивают вероятность (риск) неблагоприятных исходов у леченых и нелеченых больных. Поскольку подразумевается, что лечение приводит к снижению риска, постольку разница между этими вероятностями называется «абсолютным снижением риска» (ARR). При неуспешном лечении «снижение» будет со знаком минус. Снижение риска лучше всего отражает ту пользу, которую дает метод, и с наименьшими искажениями. Этот показатель иногда называют терапевтической полезностью (therapeutic benefit, англ.) [2].

С точки зрения перспективы применения метода лечения, удобен показатель ЧПЛП. Он переводит относительные величины в число больных, которых надо лечить, чтобы предотвратить один неблагоприятный исход. Это самый наглядный показатель, рекомендуемый для использования врачам [3]. Так же, как ARR, ЧПЛП отражает размер эффекта в конкретных условиях практики — при обычной для практики частоте клинически важных исходов.

Относительный риск и отношение шансов — вторичные относительные показатели, созданные, чтобы сделать эффект вмешательства менее зависимым от того, в каких условиях и при каком исходном риске они проводятся. Результат получается ярче, но надо помнить, что его выражение в виде OR или RR не вполне отражает результаты испытания. Так, снижение риска в два раза может соответствовать снижению от 2 до 1% и от 40 до 20%. Очевидно, что только во втором случае мы имеем дело с клинически значимым эффектом.

Для многих методов профилактики, например, питания со сниженным содержанием холестерина, ARR мало, и соответственно ЧПЛП составляет большое количество людей, которые должны питаться подобным образом в течение длительного времени, например 10 лет, чтобы предотвратить один вредный исход. Именно этим и объясняется скептическое отношение врачей к предлагаемым методам профилактики атеросклероза, в то время как некоторые группы населения проявляют энтузиазм.

Конечно, величина каждого показателя должна оцениваться не сама по себе, а в связи с ее доверительным интервалом (ДИ). ДИ — это относительно новый способ выражения статистической значимости изучаемых эффектов. Обычно вычисляется 0,5% ДИ. Это означает, что с вероятностью 95% истинная (популяционная) величина лежит в этом интервале. Например, если OR=0,6 (95% ДИ: от 0,4 до 0,9), то это означает, что риск снижается примерно в два раза, и с уверенностью в 95% можно утверждать, что истинная величина — в пределах от 0,4 до 0,9. Если ДИ для OR или RR включает единицу или для ARR включает ноль, это означает, что эффект лечения статистически незначим.

Поиск доказательств

Теперь, когда мы знаем, какие исследования нам надо искать и как их критически оценивать, мы может приступить к их поиску в соответствии с нашим клиническим вопросом. Специально для занятых клиницистов Национальная медицинская библиотека США (NLM) имеет на своем сайте упрощенный инструмент, который называется Clinical Queries (http://www.ncbi.nlm.nih.gov/entrez/query/static/clinical.shtml) (см. рисунок).

Если мы введем в строке поиска название патологии, например, «эклампсия» (eclampsia) и метод лечения или профилактики (aspirin), то получим список РКИ, подходящих к этому запросу. R.B. Haynes для всех нас придумал критерии поиска, которые позволяют получить только методологически совершенные исследования. Вы можете увидеть эти критерии, если «кликните» по закладке «Details» над результатами поиска. Именно потому, что выбираются только РКИ, мы получаем всего 78 исследований.

Наш поиск был сокращен: мы использовали только PIC. Теперь давайте введем важнейший исход — летальность (mortality). Мы получаем всего 6 статей, где описываются РКИ, в которых изучали влияние ацетилсалициловой кислоты на развитие эклампсии по показателю летальности у новорожденных или матерей, либо статьи, в которых обобщаются, обсуждаются результаты первичных исследований. Теперь мы получили необходимые нам результаты исследований в соответствии с полноценным клиническим вопросом: влияет ли прием ацетилсалициловой кислоты беременными на развитие эклампсии по показателям летальности (перинатальной или материнской)?

Если поиск не принес результатов, то, во-первых, надо проверить, правильные ли термины мы используем (см. слева указатель ключевых слов/рубрик MeSH Database); во-вторых, возможно, что действительно по нашему запросу нет РКИ. Тогда надо использовать чувствительный поиск (broad, sensitive). Применительно к нашему примеру он принесет «урожай» в 344 ссылки на «aspirin eclampsia». Лишь небольшая часть исследований в этом списке — РКИ. Но в ситуации, когда РКИ мало или совсем нет, мы найдем менее совершенные исследования.

Для более серьезного, профессионального поиска на сайте NLM есть другой интерфейс — PubMed. Он позволяет выполнять самые различные варианты поиска, которым нетрудно обучиться самостоятельно, с помощью детального Help’а на сайте NLM, или с помощью учебных программ, которые доступны в Интернете, а также предоставляются во многих медицинских вузах.

Литература

1. Власов В.В. Эпидемиология. М.: Гэотар-Мед, 2004.

2. Wulff H.R, Gotzsche P.C. Rational diagnosis and treatment: evidence based clinical decision making. 3 ed. Oxford: Blackwell Science, 2000.

3. McQuay H.J, Moore R.A. Использование цифровых результатов систематических обзоров в клинической практике // Междунар. журн. мед. практики. — 1997; (5):7-16

pdf-версия

Довідник еквівалентності лікарських засобів