Дата
Автор
The Insider
Источник
Сохранённая копия
Original Material

OK, Google. Как открытые данные высвечивают реальную картину эпидемии в России


5 июня родители жены из Набережных Челнов (второй по размеру город Татарстана) прислали сообщение: «мы на больничном». У обоих сухой кашель, температура 38, им по 60, но они успокаивают: «нет, это всего лишь ОРЗ», в поликлинике так сказали. В поликлинике Набережных Челнов так говорили всем, выписывая арбидол (противовирусное с недоказанной эффективностью) и антибиотик азитромицин. В Татарстане, как и во многих других регионах России, недооценивали серьезность эпидемии, официально на тот момент Татарстан справился с COVID, а новые случаи ровненько снижались весь последний месяц. В тот момент, когда родители заболели, республика уже перешла к первому этапу снятия ограничений и готовилась ко второму, словно пойдя на поводу у пользователей соцсетей, весной писавших о «барановирусе», «коронаистерии» и «кто-то знает хоть кого-то больного?». Через несколько дней обоим родителям стало так плохо, что при разговоре не хватало дыхания, скорая не приезжала 14 часов, а в больницу с первого раза — уже с подтвержденной пневмонией — их не положили. Со второго раза положили лишь через несколько часов ожидания, причем отцу попытались сначала отказать - несмотря на 60% поражения легких. Им пришлось лежать в переполненной больнице, кому в палате на 6 человек, а кому — в предбаннике.

Циничные комментарии в соцсетях внезапно исчезли и сменились десятками историй, живых свидетельств того, как коллапсирует здравоохранение. В СМИ же продолжалось молчание. За первые полторы недели июня о том, что происходит в Челнах, не написало ни одно местное медиа. Потом наконец-то заметили — потому что это уже невозможно было не замечать, но официально эпидемия была позади. Чиновники готовились ко второму этапу снятия ограничений. Официальный пик заражений пришёлся на начало мая: 7 мая выявили 105 новых случаев по всей республике. С того момента более ста случаев не выявляли ни разу, официальное число новых заражений снижалось удивительно ровно, а с конца мая из статистики исчезают случайные флуктуации.

При этом по ряду непрямых признаков видно, что именно в мае сюда по-настоящему и пришла эпидемия. В июне уже разгорается серьёзная вспышка, которая спровоцировала мощный прирост смертности, прямо или, как утверждают чиновники, опосредованно: по данным ЗАГС, за май−июль в Челнах умерло на 500 человек больше, чем умирало в среднем в 2017−2019 гг. Прирост смертности в эти 3 месяца +43%, за первые 7 месяцев года +21%.

Сверхсмертность — достоверная и наглядная метрика. Но она серьезно запаздывает — как по объективным причинам (средний лаг между заражением и смертью — 20−25 дней), так и по административным: часть регионов публикует данные ЗАГС о смертности с серьёзной задержкой. Вместе с тем, понимать реальную ситуацию в регионе важно — от этого зависит личная стратегия поведения и персональные меры безопасности.

Есть несколько способов, которые позволяют понять реальную динамику заболеваемости в регионе или городе, когда есть сомнения в официальной статистике. Важно понимать, на какие сигналы смотреть.

Как понять, что происходит в регионе

Число новых случаев в официальной статистике не всегда достоверно. Оно зависит от политики тестирования, от массовости и доступности тестов, от пропускной способности лабораторий, от квалификации медперсонала, который берёт мазок, и лаборантов, которые с ним работают. От того, на каком этапе болезни взят тест: концентрация вируса в носоглотке начинается снижаться уже через неделю после появления симптомов. Наконец, статистика может быть подвержена фальсификациям или искусственному сглаживанию — а именно на это указывают слишком ровные цифры сразу по ряду российских регионов и отсутствие какой-либо дисперсии в новых выявленных случаях.

Поэтому статистику полезно перепроверять косвенными сигналами. И порой именно по таким сигналам можно понять реальную ситуацию с эпидемией. Что это за сигналы?

Сигнал 1. Госпитализации

Если статистику новых случаев можно легко сгладить — как снизу, так и сверху, — то госпитализации скрыть уже не удастся. Эпидемия приводит к колоссальной нагрузке на здравоохранение. И когда начинается стремительный рост госпитализаций, заполняются больницы, перестаёт хватать коек, внепланово открываются новые ковидарии — это признак того, что здравоохранение перестаёт справляться.

Примеров — десятки. Например, в Петербурге в мае-июне число выявленных случаев расходилось с госпитализациями в 1,5−2 раза. Пик новых случаев (541) пришелся на середину мая, тогда как реальный пик эпидемии был в конце мае−начале июня, что спустя два месяца признали и чиновники. Цифры по госпитализациям, которые еженедельно озвучивал Комздрав, отражали динамику эпидемии: от 200−300 в день на майских праздниках (официально — 300−400 случаев COVID) до 750 госпитализаций в день в конце мая−начале июня (при 360−380 официальных случаях).

Есть регионы, которые публикуют информацию о занятых койках (например, Алтайский край). Однако большинство этого не делает. Поэтому зачастую единственный способ оценить загруженность больниц — это СМИ: часто достаточно поискать новости вида «<регион / муниципалитет> больницы переполнены» или «<регион> не хватает коек».

Сигнал 2. Пневмонии

Число выявленных пневмоний, основного осложнения COVID — ещё один индикатор эпидпроцесса. Есть рост пневмоний и значительное превышение средних значений? Это сигнал. Так было в Петербурге: в мае, на подъёме заболеваемости, пневмоний становится в 10 раз больше по сравнению с прошлым годом. Сильный рост пневмоний был заметен и по открытой статистике амбулаторных КТ-центров, куда направляли больных с подозрением на COVID.

Так было и в Башкирии (и во многих других регионах). Здесь в июле начинает резко расти число пневмоний: их число превышает подтверждённые случаи COVID от 2 раз до 5 раз. Например, 6−12 июля выявили 1686 пневмоний — в 5,9 раз больше среднего значения за много лет, тогда как новых случаев COVID за тот же период — всего 330. Чиновники обтекаемо признали, что этот рост можно связывать с COVID.

Методика та же: искать новости вида «<регион> заболеваемость пневмонией», «<регион> выявлено пневмоний».

Сигнал 3. Статистика поисковых запросов

И пневмонии, и госпитализации зависят от открытости региона и от того, что чиновники сообщают СМИ. Это сигналы сверху. Более показательно, что беспокоит самих людей. Один из самых достоверных (по крайней мере, пока) сигналов снизу — статистика поисковых систем. И «Яндекс», и Google выдают статистику вплоть до конкретных поисковых запросов — так, можно выяснить, что именно в конкретный месяц или неделю искали люди из конкретного региона или города.

По-видимому, есть ряд поисковых запросов, которые напрямую коррелируют с реальной заболеваемостью. Здесь важно отсечь поиски любопытствующих и ипохондриков — запросы вроде «симптомы коронавируса» часто продиктованы медийным влиянием и потому недостоверны. Обтекаемые тревожные запросы вроде «тяжесть в груди» — тоже.

Наиболее показательны запросы практичные, характерные для ковида. Это конкретные симптомы: не «слабость в теле», а «пропало обоняние», «не чувствую запахи» или «температура и кашель». Конкретные лекарства: не «лекарство от коронавируса», а «арбидол», «азитромицин», «клексан», «цефтриаксон» и пр. — то, что предписывают официальные рекомендации Минздрава по лечению Covid. Конкретные запросы по пневмониям: «матовое стекло», «вирусная пневмония», «поражение легких», «двусторонняя пневмония» — те формулировки, которые человек увидит в заключении КТ. Конкретные запросы по диагностике: «кт легких», «томография», «сатурация» и пр.

Например, в Санкт-Петербурге в среднем было 700 показов в неделю по запросу «кт легких», а в какой-то момент их стало 10 000, а через несколько недель — и вовсе 22 000. Динамика роста совпадает с реальной динамикой эпидемии в Петербурге. Пик — тоже. Или так можно выяснить, что в Северодвинске в мирное время в неделю было до 5−10 показов в неделю по запросу «пропало обоняние» — а в какой-то момент их число начало резко расти: сначала на порядок — до 50−100, затем до 250 показов. На пике было 340 показов в неделю — и чиновники признали сложную ситуацию с COVID, а город закрыли на карантин. Но рост запросов начался за несколько недель до того, как ситуация в городе стала тревожной.

Всего можно выделить 5 ключевых групп: симптомы, диагностика, лечение, пневмония, госпитализация. Всего 130+ запросов, которые будут в первую очередь делать заболевшие и их близкие. Именно они, как представляется, отражают естественное течение болезни. Методика проверена на пяти регионах (Москва, Дагестан, Санкт-Петербург, Татарстан, Алтайский край) и на трёх муниципалитетах (Набережные Челны, Северодвинск и Архангельск). В каждом случае динамика по запросам отражает реальное течение эпидемии (а в случае с Татарстаном — позволяет его восстановить) - об этом есть подробные заметки аналитика Бориса Овчинникова.

Сигнал 4. Социальные сети

То, что люди обсуждают, и как они относятся к коронавирусу — ещё один из возможных сигналов снизу. Пока эпидемии нет или рост незначительный — преобладают скептические и насмешливые комментарии, расцветает конспирология. Но как только начинается рост — настроения меняются, скептики исчезают, а им на смену приходят люди, которые делятся своими историями: длительное ожидание скорых, трудности в диагностике, отказы в госпитализации. Так было с Набережными Челнами — в какой-то момент свидетельств в соцсетях становится так много, что на них начинают реагировать чиновники и давать официальные ответы, а СМИ наконец обращают внимание на ситуацию в городе.

Сигнал 5. Личные свидетельства

Это контринтуитивно, но это выглядит самым достоверным индикатором: когда в первом−втором кругу знакомых, друзей и близких начинают массово появляться заболевшие (и их не связывает, например, принадлежность к одному одному кругу общения) — это значит, что эпидемия уже здесь, и это будет понятно и так, безо всяких других косвенных признаков. Так произошло и в моем случае.

Есть ещё два сигнала, наиболее надёжных, но о них в финале.

Эпидемия в Татарстане на примере Набережных Челнов. Как всё было на самом деле

Проанализируем используя эти сигналы ситуацию в Татарстане, а именно в Набережных Челнах. Эпидемия распространяется неравномерно, с разной географической локализацией, и некорректно смотреть как на ситуацию «по России в целом», так и «по региону в общем» (если только это не регион с высокой плотностью и связанностью населённых пунктов вроде Москвы и Подмосковья). Важна ситуация в конкретных городах и районах.18 мая замминистра здравоохранения республики заявил о «выходе на плато». Вскоре после этого Татарстан перешёл на первый этап снятия ограничений, а в конце июня — на второй. С 1 июня здесь не было более 54 заражений за день на всю республику. Между тем, именно в июне здесь, по всем признакам, и началась эпидемия. Какие признаки на это указывают?

3.1. Картина по поисковым запросам

Начнём с поисковых запросов, судя по которым эпидемия в Татарстане началась с Набережных Челнов. При этом Челны не уникальны — и та история, которая произошла здесь, очень типична. Источник данных — Яндекс Вордстат и понедельная динамика показов по 92 специфическим коронавирусным запросам, объединённым в 5 групп. В середине марта число запросов растет в полтора раза относительно февраля — именно тогда коронавирус становится темой №1, Европа закрывается на карантин, новости заполняют жуткие рассказы из Италии, а в России появляются первые случаи внутренней передачи. Полноценной эпидемии в России ещё нет — это подтверждают и цифры по госпитализациям, и статистика смертности. Поисковых запросов все больше, но этот рост — исключительно медийного характера.

После двухнедельного всплеска в марте интерес людей падает и весь апрель держится на уровне роста в 15−20% относительно января-февраля с устойчивой тенденцией к снижению. В начале мая число показов снижается до минимума за два месяца. А затем вновь начинается стремительный рост, и с 18 мая, когда в Татарстане объявили «плато», показы начинают экспоненциально расти и прибавляют по 15−40% в неделю. К середине июня Вордстат фиксирует 49 тысяч «коронавирусных» показов, что в 7,7 раз превышает их ожидаемое число (если делать поправку на сезонность). Превышение относительно высокого апрельского уровня, когда коронавирус и борьба с ним были главной федеральной повесткой — 3,2 раза: