В октябре 2018 года в престижном научном журнале появилась серия статей, всколыхнувших медицинский мир. Ученые из США заявили после обширного исследования, что люди старше 70 лет, регулярно принимающие аспирин в качестве профилактики, не уменьшают риск заболеть сердечно-сосудистыми заболеваниями, а подвержены куда большему риску смерти от рака. До того времени врачи призывали здоровых пожилых людей принимать аспирин, как средство предотвращения инфаркта миокарда на основе исследований, в которых также утверждалось, что помимо благотворного влияния на сердце, аспирин может снизить риск смерти от рака. Теперь все это было категорически опровергнуто.
В Израиле результаты исследования обеспокоили терапевта Биньямина Мозеса, регулярно прописывавшего своим пациентам аспирин. Он подумал, как же можно внезапно опровергнуть то, что всего годом ранее считалось неопровержимым фактом?! И что теперь делать – менять лечение?! И как можно объяснить это пациентам, не подрывая доверия к лечащему врачу и медицине как таковой?!
69-летний доктор Мозес – известный врач, трудившийся в самых известных медицинских учреждениях страны; кроме того, он – доцент кафедры клинической эпидемиологии Колумбийского университета в Нью-Йорке, а в настоящее время занимается общественной медициной.
Проработав 40 лет в медицинской системе, а также глубоко изучив ее с академической точки зрения, Мозес нередко находит повод для ее яростной критики. Вот и сейчас он спросил себя, не стоит ли рассматривать частный случай с аспирином, как проявление общей тенденции в клинических исследованиях, и решил изучить этот вопрос более подробно. Поставленный им диагноз изложен в книге «Реквием по аспирину». Оказывается, пациент скорее жив, чем мертв.
«Я разбил методологию клинических испытаний на составляющие принципы и изучил, как они применяются на практике, – поясняет Мозес. – Я хотел понять, действительно ли клинические испытания служат лучшим инструментом, приближающим нас к научной истине. Я начал с аспирина, а потом продолжил».
– Давайте тоже начнем с аспирина. Почему между исследованием 2018 года и более ранними исследованиями пролегла глубокая пропасть?
– Это исследование можно охарактеризовать как «идеальное испытание»: исследователи работали без ограничений по времени и средствам и строго соблюдали все принципы контролируемых клинических исследований. В течение 5 лет они наблюдали за 19 тысячами участников, произвольно разбитых на две группы. Одна группа получала аспирин, а другая выступала в качестве контрольной. По всем другим параметрам – возрасту, полу, социально-экономическому статусу, состоянию здоровья, курению и т. д. – сходство между группами было образцовым, и результаты были убедительными. Они не были пограничными и не зависели от статистических уловок.
Проблема состоит в том, что столь успешное испытание – исключение, подтверждающее правило. На практике подобные испытания практически не проводятся. Все предыдущие исследования, связанные с аспирином, охватывали лишь небольшое количество участников. Различия между двумя группами были слишком большими, периоды мониторинга – слишком короткими, а в некоторых исследованиях результаты не оказывались статистически значимыми.
В ряде исследований преимущество аспирина у испытуемых нивелировалось их склонностью к кровотечению, в некоторых случаях даже угрожающей их жизни. Тем не менее, несмотря на все это, медицинское сообщество пришло к единому мнению, что аспирин полезен как для сердца, так и против рака.
– Как такое могло произойти?
– Оказывается, протокол клинического испытания, каким мы его знаем, постепенно становился все сложнее, и спустя 73 года после первого клинического испытания, в котором изучалась эффективность антибиотика стрептомицина для больных туберкулезом, его принципы определены. Однако на практике дело обстоит иначе: многие клинические исследования, как мне удалось выяснить, изобилуют недостатками, что влечет за собой неизбежные компромиссы, ставящие под угрозу надежность выводов, сделанных на их основе.
– Например?
– Возьмем принцип двойного слепого исследования, согласно которому и участники испытания, и врачи, проводящие его, должны быть «слепыми», то есть они не знают, какие участники находятся в экспериментальной группе, а какие – в контрольной. Это достигается путем предоставления контрольной группе плацебо, чтобы смоделировать ситуацию, когда они получают такое же лечение. Дело состоит в том, чтобы различать эффект самого лечения и психологический эффект ожидания успеха со стороны как врачей, так и пациентов. Тем не менее, несмотря на заявленные попытки провести испытания в условиях двойного слепого обзора, во многих случаях значительное число пациентов и врачей могут определить, получали ли они экспериментальное лекарство или им давали плацебо. Это происходит, например, когда лекарство оказывает явное действие, например, при тестировании препарата, который должен влиять на частоту сердечных сокращений. Иногда его выдают побочные эффекты, например, сухость во рту. Подобная неспособность следовать заявленной слепоте может иметь решающее влияние на результаты испытания.
– Но что делать, если препарат обладает побочным эффектом и этого никак не скрыть?
– Каждое испытание должно предполагать обязательное анкетирование как для субъектов, так и для исследователей, насколько они на самом деле «слепы» к идентичности групп – то есть удалось им угадать или нет. При оценке результатов необходимо учитывать степень успешности. Это делается редко.
Погоня за пятью процентами
Список недочетов, обнаруженных Мозесом при проведении тех или иных клинических испытаний, можно продолжить. Главный из них связан с определением того, когда результат считается значительным – другими словами, свидетельствует о существенном явлении, – а когда объясняется всего лишь случайностью. Принято опираться на пороговое значение в 5 процентов, ниже которого результаты считаются значительными, а выше – случайными.
Как сказал Мозес, «это заставляет исследователей манипулировать данными, чтобы достичь желанной цели в 5 процентов. Например, когда компания, которая хотела продавать лекарство от фибромиалгии, достигла результатов, которые не превышали 5-процентный порог, исследователи решили отказаться от данных, полученных от конкретной группы людей с депрессией. После того, как они также пересмотрели один из критериев оценки эффективности лекарства, им удалось переступить порог, но в жизни совершили большую ошибку. Лекарство не облегчило страданий пациентов, но вызывало серьезные побочные эффекты, в некоторых случаях опасные для жизни. Манипуляции могут отражать экономические интересы фармацевтической компании, но в большинстве случаев они проистекают из желания исследователей публиковаться. Хотя так было не всегда. 50 лет назад пороговое значение не считалось определяющим. Только в последние годы ему вдруг уготовили роль суперзвезды.
– И каким образом?
– Людям нужны четкие ответы: да или нет, работает или не работает. Однако хотел бы заметить, что американская Статистическая ассоциация выступила с публичным заявлением, в котором резко раскритиковало правило 5 процентов. По мнению американских статистиков, сведение анализа данных к механистическим законам для оправдания научного аргумента выглядит проблематичным. Результаты клинических испытаний необходимо оценивать с разных сторон, из которых статистическая значимость – только одна, но не самая важная. Например, ученые протестировали новое лекарство на пациентах с раком поджелудочной железы и обнаружили, что оно продлевает их жизнь по сравнению с принятым лечением. Это был статистически значимый результат, и они опубликовали его в уважаемом журнале как большое достижение. Но пациенты, которые получили новое лекарство, прожили на 10 дней дольше, чем те, кто его не получал. И это имеет медицинское или научное значение?
– Говорят, когда пробная версия работает, статистика не нужна.
– Есть испытания, результат которых – своего рода «пуля между глаз». Испытание, в котором изучалась вакцина Pfizer от коронавируса, было таким. Ее эффективность была доказана в образцовых испытаниях, которые тщательно следовали принципам контролируемых клинических испытаний, и результаты были настолько однозначными в краткосрочной перспективе, что, казалось, не потребовалось никакой статистической проверки. Несмотря на все открытия, которые изменили медицину, эффект нового лечения не подлежал сомнению. Например, когда был открыт пенициллин, когда вводили инсулин и когда начали использовать дефибрилляторы в случаях нерегулярной частоты сердечных сокращений.
– Другими словами, все зависит от масштабности исследований…
– Некоторые считают, что фактором, который призван навести порядок в исследованиях и приблизить нас к истине, является мета-анализ, исследование, при котором анализируются все исследования, проведенные по предмету за эти годы, и подводятся их итоги. Это – мощный инструмент, позволяющий обобщить все результаты и извлечь из них более общие и более обоснованные выводы, чем можно сделать во время одного, отдельно стоящего исследования.
На самом деле, это – иллюзия. Источник зла в другом – в желании публиковаться и быть услышанным, что знаменует собой множество небольших, ограниченных и неполноценных исследований в клинической сфере. Нет ничего более обманчивого, чем мета-анализ. Исходное сырье для него – это лоскутное одеяло из клинических исследований, которые действительно схожи меж собой, но столь и различны, и сомнительно, что их можно сгруппировать вместе, чтобы сделать в итоге какой-либо далеко идущий вывод.
Кроме того, когда наблюдается рост количества статей, в том числе, и тех, где представлены ошибочные с научной точки зрения исследования, их результаты влияют на мета-анализ и искажают его. Поэтому объединение результатов небольших исследований не заменяют одного крупномасштабного исследования. Мета-анализ не может превратить нечто низшее в нечто превосходное, поэтому Альван Файнштейн, которого считают отцом клинической эпидемиологии, назвал метаанализ «статистической алхимией XI века» – то есть речь идет о глупой попытке превратить гетерогенную смесь дешевых элементов в золото.
Взаимозависимость между академическим и профессиональным развитием исследователя и количеством публикуемых им статей сегодня беспрецедентна. К счастью, существует большое сообщество, которое говорит о необходимости разорвать эту связь, поэтому я оптимистичен, будучи уверенным, что изменения все равно произойдут. Точно так же изменения должны коснуться и системы поощрения, я имею в виду – призы, премии и гранты. В конце концов, большинство значительных научных достижений – это результат вклада многих исследователей, а не одного ученого.
В случае со СПИДом, например, большое количество людей способствовало выявлению вируса, вызывающего заболевание, разработке теста, который обнаруживает его в крови, и лекарств, которые с ним справляются. Все это позволило спасти жизни миллионов людей. Но только двое ученых получили Нобелевскую премию. Призы могут служить определенным стимулом, но они также могут вызывать безжалостную конкуренцию, в которой цель оправдывает средства. В любом случае они не способствуют творческому подходу, и есть свидетельства того, что они часто наносят ему колоссальный вред. Нередко гранты выдаются под какой-то проект, причем, не всегда оправданно.
Но есть и другая модель, когда гранты присуждаются не конкретному проекту, а конкретному ученому. Согласно этой модели, которая применяется, например, в Медицинском институте Говарда Хьюза в США, успех ученого, получившего грант, измеряется не его способностью или неспособностью подтвердить свою первоначальную гипотезу, а степенью смелости и оригинальностью предложенной идеи. Этих ученых не заставляют публиковаться много и быстро, поэтому они могут делать ставку на новаторские гипотезы и проводить крупномасштабные исследования, не беспокоясь, что длительные испытания или отрицательные результаты преуменьшат итоги их исследований.
– Но клинические исследования – это еще не все?
– Это лишь отправная точка для того, что происходит впоследствии в медицинской практике. Например, когда я прописываю лекарство, эффективность которого была продемонстрирована в клинических исследованиях, мне все равно приходится наблюдать за пациентами, чтобы выяснить, какое влияние оно на них оказывает. В конце концов, они вовсе не обязаны подчиняться статистическим правилам. Отсюда следует, что необходим диалог между врачом и пациентом, который соединяет выводы и состояние пациента – между клиническими исследованиями и самой жизнью.
Тот факт, что сегодня есть клинические исследования, препараты и технологии, заставляет думать, что диалог излишен, но нет большей ошибки. Медицинские исследования предоставляют нам целый ворох инструментов, но только диалог позволяет нам использовать их так, как это удобно для пациента. В то же время ясно, что даже самый плодотворный диалог не заменяет лекарства и процедуры, которые можно считать продуктом выдающихся биологических и клинических исследований, проводимых целеустремленными, честными учеными, не имеющими скрытых мотивов.
Смадар Райсфельд, Источник: “ХаАрец”, Orbita.co.il