Therapia

Доказательная медицина: методы терапии и профилактики

В.В. Власов, д-р мед. наук, профессор, директор Российского отделения Кокрановского сотрудничества, вице-президент Общества специалистов доказательной медицины

Клинические испытания

В исключительных случаях размер эффекта лечебного или профилактического вмешательства может быть столь большим, что он виден невооруженным глазом, поэтому в специально организованных испытаниях просто нет необходимости.

Такие вмешательства, как нитроглицерин при стенокардии, никогда по-настоящему не испытывали на эффективность и никогда не станут испытывать. Подобных вмешательств мало. Большая часть того, что применяют в медицине, дает эффект небольшой величины, его можно заметить только в сравнительном испытании**.

Существуют упрощенные методы исследования и прежде всего — это клинические испытания (КИ) с историческим контролем. Например, в 2006 г. внедряют новую методику операции и сравнивают результаты лечения с данными, полученными при использовании старой методики в прошлые годы. Это упрощение обычно приводит к завышенной оценке эффективности, в первую очередь, вследствие подбора особенных пациентов. Второй упрощенный метод — сравнение исходов лечения в одном стационаре с исходами в другом. Возможно, конечно, что различия будут связаны с разными методами лечения, используемыми в этих стационарах, но, вероятнее всего, их также можно будет объяснить несходством между пациентами — в разных стационарах они отличаются по уровню доходов, способам поступления в стационар и десяткам других сложно учитываемых признаков.

Сравнительные испытания должны подчиняться общим правилам проведения исследования. На первом месте стоят этические нормы, главной из которых является требование включения участников в него только на основании информированного добровольного согласия. Отступление от этических норм почти всегда сопровождается другими грубыми нарушениями в технологии исследования, поэтому к неэтичным испытаниям следует относиться настороженно. Из этических норм вытекает и второе важное правило: в КИ могут быть сопоставлены только методы лечения, сравнительные преимущества которых неочевидны, т.е. те, которые и врач, и пациент сочтут примерно одинаково полезными, перспективными. Проводить сравнительные испытания методов, явно имеющих разную эффективность, аморально, поскольку в таком случае члены одной из групп будут заведомо получать неэффективное лечение.

Общие требования к качеству исследования

При описании изучаемой выборки должно быть определено, кто и по каким критериям был включен в испытание и по каким критериям пациентов из него исключали. Под пациентами тут мы подразумеваем любых субъектов, обратившихся за медицинской помощью. Они не включают всех больных, поскольку не все обращаются за помощью. Иногда для участия в исследовании могут быть приглашены здоровые люди (например, для исследования методов профилактики).

Критерии включения служат для описания популяции, которой соответствуют обследованные пациенты, и для решения специалиста, соответствует ли эта популяция той, в которой он практикует. Если речь идет о больных с почечной недостаточностью, то должно быть указано, по какому критерию определялось ее наличие (например, концентрация креатинина в крови); если об инфаркте миокарда — то по каким признакам (критериям) устанавливали диагноз (стандартные изменения на ЭКГ, болевой синдром, активность ферментов); тип лечебного учреждения, в котором изучали пациентов, и в какой срок после возникновения заболевания.

Критерии исключения служат для:

– подтверждения, что изучаемая группа лиц достаточно однородна;

– идентификации той части пациентов, на которых результат исследования не может быть перенесен;

– подтверждения безопасности участников, которым какие-либо аспекты исследования были бы противопоказаны или опасны.

Обычными критериями исключения являются: использование некоторых видов лечения, период беременности, возраст, противопоказания к изучаемому виду лечения. В случае контроля с применением плацебо исключаются лица, для которых его применение неприемлемо.

В разделе «Методы ...» может указываться результат подбора исследуемых групп пациентов. Он включает в себя не только сведения о численности групп, но и показатель отклика, т.е. долю людей, откликнувшихся на просьбу включиться в исследование, от всех соответствующих критериям включения. Здесь же обычно приводится численность исключенных с указанием причин, и количество лиц, которым потребовалось прервать лечение (наблюдение).

Следует ответить на вопрос: достаточно ли представительна для целей данного исследования была отобранная группа? Если критерии включения нечеткие или нестандартные, то можно ожидать, что результаты испытания будут неадекватны целям. Например, участниками исследования могут быть не пациенты с ИБС, как нужно нам для ответа на клинический вопрос, а лица, жалующиеся на боль в груди. Если отклик низок, то результаты могут относиться не ко всем отобранным для включения, а лишь к малой их части. Таким образом, если в статье сведений об отклике не содержится или отклик низок (обычная условная граница — 80%), то результаты исследования следует воспринимать с осторожностью.

Число обследуемых (например, лиц, подвергаемых экспериментальному лечению) должно быть обосновано. Обоснование и вычисление необходимого числа участников исследования исходит из предполагаемой величины эффекта (например, снижения частоты нагноений); структуры исследования и установленного заранее порога статистической значимости обнаружения эффекта. Испытание следует планировать так, чтобы число лиц было достаточным для обнаружения предполагаемого эффекта. Если пациентов мало, то эффект лечения может быть не обнаружен. Важно отметить, что если исследование планировалось для определения различий, например, преимущества нового ЛС перед старым, а обнаружить различия не удалось, то это не значит, что старое и новое ЛС действуют одинаково.

Если вы хотите надежно ориентироваться в доказательной медицине, то запомните:

• необнаружение различий не означает их отсутствие;

• отсутствие сведений об эффективности ЛС не означает его неэффективность;

• отсутствие сведений об эффективности ЛС означает необоснованность его применения (недоказанность эффективности).

Рандомизированные контролируемые испытания

Методология КИ пришла в медицину недавно — в конце XIX века. Простейшим случаем организации КИ является испытание в двух группах — контрольной и опытной. Они должны быть максимально схожими, что обеспечивается рандомизацией (рис. 1). Если в КИ группы создаются рандомизацией, то все различия между ними случайны, и такое испытание называют рандомизированным (РКИ).

Чтобы подобрать абсолютно одинаковых людей, иногда применяется перекрестная организация (англ. cross-over design, рис. 2). При этом между основной и контрольной группами совсем нет отличий: каждый пациент получает по очереди лекарство и плацебо и потому входит и в «контроль», и в «опыт». Например, в первый период одной группе участников дают контрольное лечение, а второй — изучаемое новое. Во второй период лечение в обеих группах меняют. Сопоставляют эффект от лечения в каждой группе в каждый период. Такие данные, полученные на одних и тех же пациентах, называются связанными. Подобного типа испытания проводятся реже, чем в параллельных группах, их можно проводить только для изучения вмешательств при хронических заболеваниях.

Перекрестные КИ ненадежны в случае, если:

– сравниваемые методы лечения дают внешне различающиеся фармакологические эффекты;

– не удается вернуть пациентов к исходному состоянию после предыдущего этапа лечения;

– изменения состояния пациентов во времени неоднородны или эффект накапливается постепенно.

Во всех этих случаях нужны не перекрестные КИ, а испытания с «одновременным» контролем, т.е. на других участниках в парной или независимой выборке. Только результаты таких КИ рассматриваются сегодня как надежные.

Парные выборки (англ. matched pairs) применяются для тех же целей — чтобы сделать пациентов одной группы похожими на пациентов другой. Это случай, когда каждому пациенту в одной группе соответствует парный ему пациент в другой. Парой может быть участник, подобранный, например, по полу и одинаковому возрасту. В действительности испытуемому «опытной» группы может соответствовать не один, а два или три пациента контрольной, если их проще подобрать.

При использовании более 5–6 признаков подобрать пару практически невозможно. Неблагоприятным последствием подбора может быть «избыточный подбор», когда пары подбирают по признаку, непосредственно связанному с изучаемыми особенностями болезни. В таком случае изучаемые особенности могут быть замаскированы. Например, если пациенты контрольной группы были подобраны по равной массе тела, то выявить влияние массы тела на исход заболевания будет затруднительно. Принципиально важно, что путем подбора пар можно устранить влияние лишь известных (предполагаемых) побочных факторов. Полностью нельзя исключить действия других факторов, поэтому подбора пар недостаточно. В идеале для испытания методов лечения необходима рандомизация внутри этих пар — какой пациент из пары будет в опыте, а какой — в контроле, должно быть определено случайностью.

Независимые выборки. КИ должны проводиться таким образом, чтобы контрольная группа параллельно подвергалась всем тем воздействиям, что и опытная, с одним лишь отличием — пациенты в контроле получают другое лечение. Участников подбирают одинаково и относят к опытной и контрольной группам случайным образом (рандомизация). Поскольку их включают в группы независимо друг от друга, такие группы называют независимыми, и их численность может быть любой. Распределяют пациентов по группам случайным образом для того, чтобы различий между ними было как можно меньше и (что даже более важно) чтобы они носили случайный, а не преднамеренный характер по всем признакам, о которых исследователь даже не знает. Например, для того, чтобы сравнить длительность госпитализации после операции холецистэктомии при эндоскопическом и минилапаротомическом доступе больных в операционной рандомизировали бросанием монеты; после операции каждому делали одинаковую наклейку, одинаково смоченную кровью. Вне операционной характер операции не был известен никому. В результате вопрос о выписке решался без учета характера операции. И оказалось, что использование лапароскопической техники не сокращает срок госпитализации.

КИ средств диагностики, профилактики и лечения в перекрестном опыте, на парных и на независимых выборках называют контролируемыми, поскольку в них используется контрольная группа, что позволяет контролировать возможные случайные эффекты. Хотя такие КИ являются сложными и дорогостоящими, они — единственное надежное средство оценки эффективности лечения. Всякие упрощения приводят в конечном счете к ухудшению конечного результата — неверной оценке лечения, дополнительным расходам, использованию в широкой практике неэффективных и опасных средств или неприменению эффективных.

Рандомизация

Случайное (англ. random) распределение пациентов по группам — классическая процедура достижения неразличимости групп в КИ, которую впервые применили в медицине в ХХ веке. Способы рандомизации детально описаны в руководствах по клиническим исследованиям. Они включают разные средства — от бросания монеты и таблиц случайных чисел до специальных программ для ЭВМ. Несмотря на простоту этих средств, часто рандомизацию пытаются еще более упростить и используют непригодные методы.

Примерами таких методов является распределение в группы: по первой букве имени (возникают неравенства групп из-за этнических различий, связанных с именами); дате или сезону рождения (люди, родившиеся в разные сезоны, могут различаться между собой); дню недели поступления в клинику (состояние пациентов, структура заболеваний различается по дням недели) и т.д. Применение упрощенного метода рандомизации чревато тем, что о нем узнают третьи лица и смогут влиять на подбор пациентов. Главным же неблагоприятным последствием является то, что становится известно, кто из больных какое лечение получает, и в проведении исследования возникают многочисленные проблемы. Ошибки в рандомизации даже в лучших медицинских журналах встречаются часто — в 12% статей по испытанию методов лечения.

Не все пациенты дают согласие на участие в рандомизированном испытании, например, потому что предпочтение отдают одному из испытываемых методов лечения и не хотят предоставлять его выбор случаю. Следовательно, таких лиц в исследование не включают, и они получают то лечение, которое им показано и которое они избрали. Результат исследования, от которого отказалось много пациентов, может быть несправедливым для всех людей (в частности, для тех, которые отказываются). Например, испытывать методы лечения боли в пояснице («радикулитов») трудно, поскольку немало больных уверены в том, что им поможет только мануальная терапия. Сравнивать результаты лечения у таких людей и у лиц, которые подвергались лечению на основании рандомизации, нельзя, так как пациенты, предпочитающие некий метод лечения, лечатся старательнее и правильнее выполняют назначения. Это называют аккуратностью или исполнительностью пациентов, но чаще — комплайенсом (англ. compliance), поскольку этот термин имеет еще другое значение — «податливость, согласие с режимом, подчинение указаниям». Окончательного решения этой проблемы не существует. В одних исследованиях учитывают предпочтения пациентов, которые все же согласились на рандомизацию, в других — приводят результаты лечения у больных, которые на рандомизацию не согласились. Существуют специальные схемы проведения РКИ в случаях, когда большинство участников не согласно на случайное назначение лечения.

В отдельных случаях рандомизировать пациентов нельзя (например, если речь идет о вмешательствах в рамках целой больницы или района). Тогда рандомизируют «группы», например, районы, поликлиники. Это называют кластерной рандомизацией (англ. cluster randomization). Анализ данных такого исследования в принципе не отличается от рандомизации отдельных лиц, хотя существенно усложняется. Исследователям приходится заметно увеличивать число участников для того, чтобы получить ожидаемый результат (по сравнению с рандомизацией отдельных пациентов). Естественно, у больных не существует выбора относительно участия в исследованиях, поэтому к такого рода исследованиям пациенты относятся с подозрением, а этические комитеты — критически.

Контрольные группы

Главным способом хорошего испытания медицинского вмешательства является применение замаскированного плацебо в контрольной группе. Использование плацебо совершенно необходимо там, где исследуются заболевания, при которых наблюдается самопроизвольное выздоровление, часты спонтанные изменения течения, обычны ремиссии, и когда оценка результатов лечения проводится по «мягким» субъективным критериям (настроение, качество сна, интенсивность изжоги, зуда, головной боли и т.п.), а не по объективным и надежным признакам (смертность, масса тела, биохимические и гематологические показатели и т.п.). От плацебо-контроля нельзя отказаться, когда эффективного лечения для изучаемого заболевания не существует.

Конечно, плацебо нельзя использовать в случае тяжелых заболеваний, для которых есть хотя бы умеренно эффективное лечение. Считается неприемлемым применять плацебо и в некоторых специфических случаях, таких, как исследование эффективности противозачаточных средств.

Важно подчеркнуть, что применение плацебо дает некоторый весьма незначительный и лишь функциональный эффект. Поэтому оно должно быть совершенно неотличимо от исследуемого лекарства (по форме, запаху, цене и т.п.). Только в этом случае можно ожидать, что различия плацебо и лекарства не будут связаны, например, с тем, что таблетки — разного вида или что одни дают бесплатно, а другие надо покупать. Происхождение эффекта плацебо не следует трактовать упрощенно — как психологическое воздействие. Важно, что плацебо-эффект не является специфическим эффектом исследуемого препарата, а в испытаниях изучают именно специфические эффекты лекарств. Затем в клинической практике врачи применяют лекарства в надежде на их специфический, например, антибактериальный эффект.

Если в опытах на животных возможны «ложные» операции (англ. sham surgery) для того, чтобы отделить воздействие операционной травмы на организм от главной манипуляции (резекции, пластики и т.п.), то в исследовании с участием людей такой подход считается возможным крайне редко. Поэтому в хирургических исследованиях контрольные группы часто отсутствуют или совершенно неудовлетворительны и так распространен «исторический» контроль. Это определяет настоящую ситуацию, в которой многие годы сосуществуют разные варианты операционной тактики, каждый из которых оценивается его создателями как лучший и о каждом есть более или (чаще) менее убедительные свидетельства испытаний с несовершенным контролем или вовсе без него.

Слепой эксперимент

Достижение неразличимости плацебо и лекарства образно называют «ослеплением» — пациент не должен знать (видеть), какое лечение получает. Если лечение известно врачу, то такая организация КИ называется «слепым испытанием» (англ. single blind trial). Поскольку результат лечения зависит не только от испытуемого средства, но и от других факторов, обусловленных работой врача и других специалистов, то желательно, чтобы все работающие с пациентами не знали, кто какое лечение получает. Это называется «двойным слепым испытанием» (англ. double blind trial). Слепым должно быть не только назначение лечения, но в ходе самого испытания характер лечения должен быть сокрыт (англ. concealed). Сокрытие особенно важно там, где велика роль сопутствующих элементов лечения. Например, при КИ антибиотиков в лечении ран необходимо обеспечить, чтобы манипуляции над раной (обработка, перевязка) проводились одинаково всем пациентам. Тут двойное ослепление и тщательное сокрытие лечения незаменимы. Чем объективнее метод измерения эффекта, тем меньше необходимость в использовании слепого КИ, но ни в одном случае слепое КИ нельзя назвать излишеством. Сравнение исследований с разной степенью сокрытия от пациентов и врачей показывает, что при неэффективном ослеплении оценки лечебного эффекта оказываются завышенными на 30–40%.

Важной деталью организации КИ является прекращение прошлого лечения, назначенного пациенту ранее. Должен быть установлен срок, проходящий после прекращения прошлого лечения. Доброкачественная статья должна содержать информацию о том, как часто участники опытной и контрольной групп использовали побочное, не назначенное в ходе испытания лечение. Это бывает всегда и должно учитываться в анализе данных.

«Ослепление» необходимо не только при испытаниях терапевтических вмешательств, но и при любых исследованиях в клинике, где дополнительное знание о пациенте может повлиять на поведение врача. Например, при испытании диагностических средств врач, оценивающий результаты теста, не должен иметь никакой информации, кроме результата теста, иначе он будет сознательно или неосознанно искажать свои оценки в угоду совпадению с этой информацией.

Изучаемые исходы

Часто приходится иметь дело с подменой «целевых» переменных (исходов или показателей результата) «промежуточными» и «косвенными» (суррогатными) показателями процесса. Например, при лечении судорожных расстройств в качестве меры эффективности могут быть использованы не частота припадков, а изменения на ЭЭГ; при профилактике ишемической болезни сердца — вместо частоты инфаркта, стенокардии, внезапной смерти — концентрация холестерина в плазме крови, АД или физическая работоспособность. Это принципиальные ошибки подмены. Использование «суррогатных» (косвенных) оценок состояния здоровья или диагноза может искажать результаты исследования. Например, противоаритмические средства при инфаркте миокарда помогают нормализовать ритм, и это было основанием рекомендовать их профилактическое применение. Когда же провели РКИ, то оказалось, что летальность у пациентов, которым проводили профилактику аритмии, повышена по сравнению с таким показателем у получающих плацебо. Суррогатные оценки приемлемы только в случае, когда клинически важные исходы нельзя оценить, или до тех пор, пока клинически важные исходы еще не изучены.

В случае, если используются оценки специалистов, например, оценки рентгенограмм или эндоскопической картины, должны быть приведены сведения о том, как проверялась надежность этих оценок, использовались ли усредненные оценки нескольких специалистов, как они согласовывались между собой, использовался ли «внешний» эксперт или процедуры голосования и т. д. В противном случае статья приобретает характер увлеченного рассказом врача о своих наблюдениях, не удостоверенных иными средствами. Так бывает, например, при использовании эндоскопической картины как единственного критерия диагноза. Если в статье не рассматриваются процедуры уточнения диагноза (оценки результатов лечения) в спорных и сомнительных случаях, у читателя должно возникнуть сомнение в качестве диагностики. Особенно важно, чтобы исходы лечения оценивались вслепую, т.е. врачами, не знающими, какое лечение получал участник исследования.

Наряду с собственно методами измерения и диагностики должно быть дано описание процедур. Это необходимо, поскольку в работе с пациентами врачи выполняют многое из того, что не является их непосредственной задачей. Например, занимаясь диагностикой в поликлинике, они параллельно более или менее настойчиво рекомендуют пациентам бросить курить, похудеть и т. д., направляют их на профилактическую рентгенографию и анализы. Поэтому процедура обследования должна быть строго регламентирована, а при изложении результатов должны быть приведены данные не только об изменениях «целевого» признака под воздействием исследуемого фактора, но и об изменениях «сопутствующих» переменных. Например, при описании влияния нового лечебного средства, предположим, поверхностного дыхания, на АД, должны быть даны сведения и об основных сопутствующих переменных: об изменениях частоты и интенсивности курения, массе тела, потреблении соли, т.е. обо всем, что может быть связано с изменениями АД помимо изучаемого средства.

Обязательной частью описания метода в случае повторного тестирования должно быть указание на то, как учитывался сам эффект повторного тестирования. При повторном исследовании внешнего дыхания, выполнении тестов на операторскую деятельность или при велоэргометрической пробе обследуемые чувствуют себя увереннее, приобретают навыки. Если это совпадает с ожидаемым терапевтическим эффектом, то требуется убедительное доказательство того, что речь идет именно о результатах лечения, а не тренировки. Специально должны быть обоснованы частота (время) периодических измерений и длительность всего исследования — лечения, наблюдения.

(Окончание в следующем номере)