По данным тестов на антитела, коронавирусом переболели 12,5% москвичей. Можно ли этому верить? Это много или мало? А в других странах сколько?
Путеводитель по серологическим опросам
В Москве стартовало крупномасштабное тестирование людей на наличие антител к вирусу SARS-CoV-2 для оценки числа перенесших заболевание — так называемый серологический опрос. Уже появились и первые результаты — согласно им, в Москве переболели 12,5% горожан. Результаты аналогичных исследований публикуют в разных странах мира. В Петербурге схема исследования для определения распространения болезни составлялась на базе Европейского университета в Санкт-Петербурге, а проводили его на базе сети клиник «Скандинавия». Некоторые из авторов этого исследования — эпидемиолог Антон Барчук, социологи Анастасия Новкунская и Кирилл Титаев, экономисты Дмитрий Скугаревский и Юлия Раскина — рассказали, зачем нужны серологические опросы, кто и как их должен планировать, что может пойти не так и как интерпретировать результаты таких исследований.
Все материалы «Медузы» о коронавирусе открыты для распространения по лицензии Creative Commons CC BY. Вы можете их перепечатать! На фотографии лицензия не распространяется.
Часть 1
Что мы знаем благодаря серологическим опросам
Что такое серологические опросы?
Коротко. Это научные исследования, которые определяют, сколько на самом деле переболело людей.
Подробнее. Серологические опросы — это базовые эпидемиологические исследования для оценки распространения болезней в популяции. Они основаны на оценке определенных показателей в сыворотке крови (serum — отсюда и название), в данном случае — наличия антител к новому вирусу. В теории антитела являются маркерами перенесенной инфекции, и по количеству людей, имеющих антитела, мы можем оценить долю таких людей в популяции. Их называют «опросами», потому что методология таких исследований очень близка к социологическим: многое зависит от репрезентативности выборки и выбранного инструмента оценки распространения болезни, то есть в данном случае — от чувствительности и специфичности теста.
Зачем они нужны?
Коротко. Зная реальное количество заболевших, можно планировать шаги по контролю эпидемии, уточнить истинную летальность.
Подробнее. В условиях эпидемии требуются решения, которые могут одновременно предотвратить ее развитие и помочь нам быстрее вернуться к нормальной экономической и социальной жизни. Для этого надо знать, насколько распространен этот вирус на самом деле, какая часть населения уже имеет иммунитет к вирусу и насколько стоек этот иммунитет.
Для SARS-CoV-2 характерно большое количество бессимптомных носителей — тех, кто не испытал явных признаков заболевания коронавирусной инфекцией. Поэтому если считать только тех, у кого были симптомы или нашли вирус, то статистика заболевания будет меньше реального распространения. Была ли у человека инфекция, можно выяснить по наличию антител к вирусу в крови — то есть по проверке иммунологического статуса в отношении вируса.
При соблюдении всех правил и при использовании тестов высокой точности серологические опросы — это наиболее корректный способ понять реальное распространение болезни. ВОЗ отмечает, что серологические опросы имеют ключевое значение для контроля эпидемии. Пример протокола серологического исследования распространения антител к SARS-CoV-2 был размещен на странице ВОЗ еще 17 марта 2020 года. Серологические опросы в докладе Американского института предпринимательства упоминались в качестве этапов выхода из локдауна еще на заре пандемии.
Помимо прочего, если мы знаем, сколько реально переболело и сколько умерло, мы можем рассчитать летальность вируса.
Какие бывают виды серологических исследований?
Коротко. В основном исследования бывают трех видов в зависимости от того, сколько раз и кто делает тестирование.
Подробнее. Самое простое — это однократный опрос. После создания выборки проводится однократный тест и оценивается распространение заболевания в конкретный момент времени. Такие опросы можно повторять через определенные промежутки времени и оценивать, как меняется распространение заболевания в популяции. И наконец, третий вариант — это делать повторные тесты у одних и тех же людей через определенные промежутки времени. Тогда помимо динамики распространения заболевания можно оценить динамику антител у каждого конкретного человека. Такой вид исследования позволяет предварительно посмотреть, насколько устойчив иммунитет к заболеванию, а при наличии некоторой дополнительной информации — косвенно оценить, насколько наличие антител защищает от данной инфекции в будущем.
У каждого типа серологического опроса есть свои преимущества и недостатки. В последнем случае, например, сложно мотивировать участников многократно выполнять тесты на протяжении длительного времени.
Идеальных тестов не бывает, но при необходимости даже не слишком специфичный тест можно проверить с помощью повторного исследования (тогда положительным нужно считать только такой случай, когда тест сработал оба раза). В таком случае вероятность получить ложноположительный результат практически нивелируется — это, однако, существенно усложняет всю процедуру тестирования.
Еще о методах тестирования
Тестирование может быть выполнено с помощью различных методов. Наиболее распространены иммуноферментный анализ (enzyme-linked immunosorbent assay, ELISA) и иммунохроматографические тесты (lateral flow tests или immunochromatographic assays). Оба метода используют кровь для анализа и направлены на обнаружение антител (IgG и/или IgM), вырабатываемых иммунной системой пациента в ответ на инфекцию SARS-CoV-2.
В иммунохроматографических тестах часто используются тест-полоски, по их окрашиванию можно понять, есть ли у человека выявляемые антитела. Эти тесты дают ответ быстро, однако ответ состоит в том, есть антитела или нет, но не в том, сколько их. Иммуноферментный анализ более ресурсоемок в плане оборудования, выполнение требует больше времени, зато он позволяет оценить концентрацию (титр) антител. С помощью количественных тестов мы можем делать оценки динамики титра антител.
О чем говорят первые результаты тестирования в Москве?
Коротко. Трудно сказать. Велика вероятность, что в московском сероопросе ошибка из-за нерепрезентативности выборки или неучтенных характеристик теста.
Подробнее. Судя по всему, в Москве большая выборка и проблем со случайной ошибкой быть не должно. Полученное значение в 12,5% в Москве больше похоже на результаты первых исследований (как в Нью-Йорке, например), где получались довольно высокие показатели. Конечно, Москва — это главный очаг эпидемии, и тут правда может быть много переболевших. Но чтобы оценивать результаты подобного исследования, нужно ответить на два вопроса:
- Является ли выборка репрезентативной?
- Делалась ли поправка на характеристики теста?
Ответ на первый вопрос можно дать, уточнив протокол исследования и способ набора его участников. Если попыток оценить вероятность попадания в выборку не было, то высока вероятность нерепрезентативной выборки. Например, если тесты делались неслучайной выборке людей, у которых был выше риск инфекции, то и результат будет завышен.
Характеристики используемого в Москве теста Mindray были опубликованы. Специфичность теста на антитела типа IgM составила порядка 92%, на IgG — около 96%. Если положительным считать тест, где выявляется либо IgG, либо IgМ, либо оба варианта антител, то специфичность была еще ниже, то есть около 88% (когда мы считаем положительным любой результат, где есть хоть какие-то антитела, то доля ложноположительных от IgG и IgM будет суммироваться и специфичность — снижаться).
В зависимости от способа интерпретации теста доля ложноположительных колеблется от 4 до 12%. Это довольно много. Можно повысить специфичность, считая положительными только образцы сыворотки, в которых есть и IgG, и IgM, но тогда чувствительность упадет до 66%, что тоже неприемлемо.
Если поправка на чувствительность и специфичность теста не выполнялась, то популяционная оценка может быть ошибочна. В случае с низкой специфичностью она будет завышена.
Серологические опросы помогают понять, у кого есть защита, а у кого нет?
Коротко. В идеале — да!
Подробнее. Очевидно, что выявление людей, которые имеют иммунитет к коронавирусной инфекции, позволит им, например, отказаться от самоизоляции и вернуться к привычной жизни. Для приоритетных профессиональных групп (таких как медицинские работники), возможно, было бы эффективно сплошное тестирование.
Проведение полного тестирования всего населения невозможно по многим причинам: и экономическим (это дорого), и организационным (на сегодняшний день просто не хватит мощностей, чтобы провести такое тестирование), и этическим (человек имеет право выбирать, знать или не знать ему о своем заболевании и о состоянии своей иммунной системы).
Репрезентативные выборочные обследования — надежный и экономически оправданный способ понять, насколько распространен иммунитет среди населения в целом. Благодаря им можно определить, сколько человек должны им обладать, чтобы достичь коллективного иммунитета, и оценить влияние тех или иных видов общественной активности на распространение инфекции. Эта информация — ключевая для понимания, когда и в какой степени ограничения в экономической и социальной жизни могут быть смягчены или отменены без угрозы последующих волн эпидемии.
Значит, серологические тесты и опросы, по сути, пропуск в нормальную жизнь?
Коротко. В реальности — нет! Мы многое не знаем об иммунитете и защите от вируса, поэтому данные серологических опросов не равносильны данным о защите.
Подробнее. Все написанное выше работает в том случае, если мы точно знаем, как формируется и как долго длится иммунитет, выработанный в ответ на инфекцию. И что он служит защитой от инфекции в будущем, и у нас есть точные диагностические инструменты, чтобы его измерить. Если бы все было так, то, возможно, было бы достаточно проводить несколько повторяющихся сплошных обследований людей из отдельных групп или репрезентативных выборок населения через определенные промежутки времени.
К сожалению, про SARS-CoV-2 все это пока точно не известно. Поэтому очень важно проведение обследований у одних и тех же людей, составляющих репрезентативную выборку населения, через определенные промежутки времени — это, среди прочего, может помочь установить характеристики иммунитета.
Так помогают ли тесты на антитела диагностировать инфекцию и понять, защищен ли человек от нее?
Коротко: Нет, тесты на антитела не подходят для диагностики и пока не дают гарантию защиты.
Подробнее. В отличие от других заболеваний, тесты на наличие антител к SARS-CoV-2 имеют минимальный диагностический смысл. Отрицательный или положительный тест ничего не говорит о наличии у человека вируса на момент забора крови. Антитела к инфекции, которые выявляет тест, развиваются через несколько недель после инфицирования, но у кого-то они могут вообще не появиться в сыворотке крови. Принимать решение о диагнозе, лечении и тем более об изоляции по результатам теста на антитела нельзя. Это все же удел оценки клинической диагностики и ПЦР-тестов.
Также пока мы мало знаем о том, насколько факт перенесенной болезни, который фиксируется с помощью теста, влияет на защиту от этой болезни в будущем. Для этого нужны дополнительные исследования, например для оценки наличия защитных антител существуют специальные лабораторные исследования крови. При этом не у всех людей с антителами, выявленными обычными тестами, находили защитные антитела.
Кто уже проводит серологические опросы?
Коротко. Почти все.
Подробнее. Многие страны мира заявили об исследованиях или уже даже опубликовали первые результаты серологических опросов. Всего можно говорить о более 100 исследований по всему миру. Первое время у всех на слуху были результаты сероопросов в Нью-Йорке, Германии, Италии. Активно обсуждались результаты серологического опроса Стэнфордского университета в округе Санта-Клара в Калифорнии. Авторы опубликовали результаты этого опроса одними из первых еще в начале апреля. Но далее их много критиковали из-за нерепрезентативности.
Одним из первых репрезентативных стало исследование жителей Женевы. Сейчас доступны данные из многих других стран. Например, большую ценность имеют опросы, организованные институтами общественного здоровья некоторых стран: Финляндии, Дании, Швеции, Испании. Запущен сайт, где исследователи агрегируют данные разных сероопросов. Есть еще таблица, где собирают данные исследований.
Что показали полученные результаты?
Коротко: Число переболевших превышает число зарегистрированных случаев примерно в 10 раз. Это меньше, чем ожидали ученые.
Подробнее. В разных регионах, по данным серологических опросов, предполагаемое количество переболевших значительно превышало число зарегистрированных случаев. Так, в штате Нью-Йорк было зарегистрировано 250 тысяч случаев, а опрос показал, что переболели 14%, или 2,6 миллиона человек (правда, в этом сероопросе участвовало три тысячи посетителей магазинов, и это сложно назвать репрезентативной выборкой).
Это характерно для любого заболевания, и различия в десятки раз были ожидаемы для COVID-19. Учитывая, что мы уже знаем о возможности бессимптомного течения, ограничениях в количестве и качестве ПЦР-тестов, — это неудивительно.
Однако более поздние результаты показали, что распространенность болезни была ниже, чем можно было судить по первым публикациям. Причин может быть несколько. Возможно, это связано с тем, что первые сероопросы просто проводились в регионах с наибольшим количеством заболевших (Италия, Нью-Йорк).
Результаты, полученные в Испании, могут свидетельствовать и о проблемах с методологией первых исследований. В этой стране, по полученным данным, было выявлено только 5% носителей антител, а максимальные показатели в Мадриде составили 11%. Это неожиданный результат. В стране, которая была одним из лидеров по числу заболевших и умерших от коронавируса, двузначное число положительных тестов ожидалось в куда большем количестве регионов.
Не менее удивительными оказались результаты в Швеции. Число людей с антителами в Стокгольме составило только 7,3%, а в других регионах оказалось еще ниже. Это неожиданно с учетом критикуемой многими политики властей этой страны, направленной на получение популяционного иммунитета, и ожиданий, что переболеют 25% шведов.
Интересно и то, что, по данным серологических опросов с сайта-агрегатора, самые высокие значения распространения инфекции получены в исследованиях с высоким риском ошибки или доступны только из пресс-релизов и новостей. На самом деле, если очень грубо, для многих стран получается, что число зарегистрированных случаев в 10 раз меньше числа реально переболевших. Многие ученые ждали куда большего разрыва.
Почему цифры оказались такими низкими?
Коротко: Мы не знаем. Может, инфекция распространяется не так быстро; а может, предпринятые меры эффективнее, чем мы думали.
Подробнее. Самый банальный ответ — инфекция не распространяется среди населения так быстро, как мы считали раньше. Более того, результаты этих исследований могут изменить наше представление об эффективности мер и о том, что будет дальше. Возможно, меры были даже слишком эффективны, либо мы преувеличивали возможности распространения вируса.
Казалось бы, это хорошие новости. Если при относительно небольшой доле переболевших, как в Швеции, доля новых случаев не растет, то возможен контроль эпидемии не самыми жесткими мерами. В некоторых странах и вовсе менее 2% переболевших, но эпидемия фактически остановлена.
Но есть и неприятная сторона. Эти результаты свидетельствуют, что истинная летальность (доля умерших среди инфицированных, IFR) не так и низка, как считают некоторые ученые, и может достигать 1%. Также низкие значения распространения сейчас могут интерпретироваться как повышение риска второй волны эпидемии в дальнейшем.
При всем том следует помнить, что есть еще проблема временного зазора между заболеванием и появлением детектируемых в крови антител. Это может привести к недооценке числа переболевших. Кроме того, у части переболевших могут вообще не образовываться антитела, при этом они могут иметь какие-то другие механизмы защиты от инфекции, помимо антител в крови. Тогда еще ниже вероятность, что тесты на антитела будут отражать факт защиты от вируса.
При какой доле положительных тестов можно, например, открывать школы и кинотеатры?
Коротко. Мы пока не знаем.
Подробнее. Только по результатам опроса этого сказать нельзя. Решения о тех или иных мерах все же принимаются не в зависимости от числа переболевших, а как реакция на активную вспышку инфекции. Например, в Финляндии, несмотря на то, что сероопросы показывают не более 3% переболевших, уже открыли школы и планируется открытие ресторанов, а также смягчение ограничений на собрания.
Сероопросы нужны, скорее, чтобы понимать реальное распространение в сравнении с регистрируемым количеством случаев, а также динамику этих изменений. Изначально сероопросы планировались в надежде понять, когда наступит популяционный иммунитет. Теперь похоже, что до популяционного иммунитета еще довольно далеко, а цена его достижения несколько выше, чем ожидалось. Но есть и вариант, что предварительные оценки доли переболевших, необходимой для популяционного иммунитета, были тоже завышены (но и реально необходимого уровня мы еще не достигли).
В любом случае только новые исследования с низким риском ошибок помогут ответить на некоторые из этих вопросов.
Часть 2
Как сделать качественный опрос
Из-за чего возникают ошибки в этих опросах?
Коротко. Проблемы могут быть с репрезентативностью выборки и точностью тестов.
Подробнее. Проблем может быть много, но есть две ключевые — это репрезентативность выборки и характеристики тестов. Проблема с тестами — это их неидеальные характеристики: чувствительность и специфичность. Чем ниже чувствительность, тем выше будет доля ложноотрицательных результатов: тест не будет видеть антитела в крови. Чем ниже специфичность, тем будет выше доля ложноположительных тестов: тест будет детектировать антитела, хотя на самом деле в крови их нет.
Специфичность крайне важна, когда болезнь еще не распространена в популяции. При низкой специфичности теста мы получим значимую долю переболевших в популяции, где, возможно, никто не болел. В исследовании можно делать поправку на чувствительность и специфичность, но если мы точно знаем характеристики теста. Лучше всего, конечно, использовать тесты с максимальной чувствительностью и специфичностью, но идеальных тестов нет. Чувствительность и специфичность многих тестов можно найти на сайте FDA.
А как составляется выборка для сероопросов и от чего зависит ее размер?
Коротко. От предполагаемой доли положительных тестов, характеристик теста и того, какую ошибку выборки мы хотим получить, но больше 2000 человек нет особого смысла.
Подробнее. Эпидемиологи часто предполагают биномиальное распределение числа инфицированных — когда есть только два варианта: человек либо переболел, либо нет. Если тест на антитела идеален (у него нет ложноположительных или ложноотрицательных срабатываний), а предполагаемая распространенность заболевания составляет 50%, то существует простая эвристика: размер выборки обратно зависит от квадрата ошибки выборки (вывод можете посмотреть тут или в любом учебнике статистики). Если вы желаете получить оценку распространенности с ошибкой выборки в 2%, вам потребуется не менее 1 / 0,02 ^ 2 = 2500 человек. Для ошибки выборки в 1% потребуется 10 тысяч протестированных. Больше тестировать смысла не имеет, когда вас интересуют различия уровня одного порядка.
Если мы ожидаем, что распространенность меньше 50%, то при той же ошибке потребуется меньшая выборка. Так, для предполагаемой распространенности в 20% нам нужно не 2500, а около 1600 человек. Во многих популяционных исследованиях обходились выборкой порядка 1000 человек и меньше.
Следующий вопрос — качество теста. В примере выше мы полагали его идеальным. Но когда у теста много ложноположительных или ложноотрицательных результатов, это влияет на ошибку выборки. Поэтому результатам сероопросов, полученным с помощью тестов без опубликованных характеристик, доверять сложнее.
Сейчас мы обсуждали случайную ошибку, но на результат куда больше может влияет систематическая ошибка, в случае если, например, выборка нерепрезентативна.
Как сделать выборку репрезентативной?
Коротко: Выборка репрезентативна, если любой человек из популяции имеет равную вероятность и возможность сдать тест.
Подробнее. В сероопросе используют те же методы, что и в общественных науках. Чтобы признать выборку репрезентативной, нужно быть уверенным, что все объекты популяции имеют равную вероятность попасть в нее. В случае сероопроса люди могут опасаться приходить в места забора крови, не доверять приглашениям, бояться последствий теста или попросту быть недоступны. Худшее, что можно сделать для репрезентативности, — отправить людей на карантин по итогам теста. Тогда вы не обеспечите сколь угодно репрезентативную выборку: люди будут повсеместно отказываться от теста из-за последствий. По тем же причинам тест стоит делать анонимным.
Подобное в эпидемиологии наблюдается с оценками распространенности ВИЧ: люди отказываются участвовать в опросах, доля отказов может доходить до 37% (у мужчин в Малави в 2004 году). При этом отказы могут совершаться по причинам, которые исследователь наблюдает (возраст человека или его пол), или по причинам, которые никакое исследование не измерит точно (так называемые ненаблюдаемые переменные).
Что делать, если люди отказываются приходить?
Коротко. Мы можем оценить, чем отличаются люди, пришедшие сделать тест, но это не всегда просто.
Подробнее. Есть три способа работать с отказами. Во-первых, можно игнорировать проблему. Но тогда ваша оценка распространенности (превалентности) будет лишена всякого смысла, если процент отказов высок, а на тестирование не пришли все заболевшие или, наоборот, все здоровые.
Во-вторых, можно поправить оценку с помощью статистических методов. Но эта поправка будет работать убедительно, когда решение отказаться зависит только от наблюдаемых вами характеристик человека. Страх человека перед инфекцией, например, измерить сложно.
В-третьих, можно провести экспериментальное исследование, постаравшись этим нивелировать проблему самоотбора по ненаблюдаемым характеристикам людей, участвующих в тестировании. Но этот путь самый сложный, так как эксперимент требует грамотного планирования и навыков в его реализации.
Антон Барчук, Анастасия Новкунская, Кирилл Титаев, Дмитрий Скугаревский, Юлия Раскина