Опубликовано : Сен 14, 2020

Теперь все статистики. Вот что ошибаются в креслах экспертов по COVID

Теперь каждый статистик. Вот какие кресла эксперты по COVID ошибаются
Предоставлено: Shutterstock.

Если мы не анализируем статистику, чтобы заработать себе на жизнь, мы легко можем попасть в ловушку дезинформации о статистике COVID-19 в социальных сетях, особенно если у нас нет правильного контекста.

Например, мы можем выбирать статистику, подтверждающую нашу точку зрения, и игнорировать статистику, показывающую, что мы ошибаемся. Нам также необходимо правильно интерпретировать эту статистику.

Нам легко поделиться этой дезинформацией. Многие из этих статистических данных также взаимосвязаны, поэтому недопонимание может быстро увеличиться.

Вот как мы можем избежать пяти распространенных ошибок и произвести впечатление на друзей и семью, правильно получая статистику.

1. Пугает уровень заражения, а не смертность

Сообщения в социальных сетях, сравнивающие COVID-19 с другими причинами смерти, такими как грипп, подразумевают, что COVID-19 на самом деле не так опасен.

Но в этих публикациях отсутствует заразность COVID-19. Для этого нам нужно посмотреть на коэффициент летальности от инфекции (IFR) — количество смертей от COVID-19, разделенное на всех инфицированных (число, которое мы можем только оценить на данном этапе, см. Также пункт 3 ниже).

Пока жюри еще не принято, COVID-19 имеет более высокий IFR, чем грипп. Сообщения, подразумевающие низкий IFR для COVID-19, безусловно, недооценивают его. Они также упускают два других момента.

Во-первых, если мы сравним типичный показатель IFR при гриппе в 0,1% с наиболее оптимистичной оценкой COVID-19 в 0,25%, то COVID-19 останется более чем в два раза опаснее, чем грипп.

Во-вторых, что более важно, нам нужно посмотреть на базовый номер репродукции (R₀) для каждого вируса. Это количество дополнительных людей, которых, по оценкам, заразит один инфицированный.

R₀ гриппа составляет около 1,3. Хотя оценки COVID-19 различаются, его R₀ составляет в среднем 2,8. Поскольку инфекция растет экспоненциально (см. Ниже), скачок с 1,3 до 2,8 означает, что COVID-19 гораздо более заразен, чем грипп.

Объединив все эти статистические данные, вы сможете увидеть мотивацию, стоящую за нашими мерами общественного здравоохранения, направленными на «ограничение распространения». COVID-19 не только смертоносен, он смертельно и очень заразен.

2. Экспоненциальный рост и обманчивые графики

Простой график может отображать количество новых случаев COVID с течением времени. Но поскольку новые случаи могут сообщаться беспорядочно, статистики больше интересуют темпы роста общего числа случаев с течением времени. Чем круче наклон вверх на графике, тем больше нам следует беспокоиться.

В отношении COVID-19 статистики стараются отслеживать экспоненциальный рост случаев заболевания. Проще говоря, необузданные случаи COVID могут привести к постоянно растущему числу новых случаев. Это дает нам график, который вначале медленно движется, но затем со временем резко изгибается вверх. Это кривая, которую мы хотим сгладить, как показано ниже.

Тем не менее, в социальных сетях регулярно сравниваются цифры COVID-19 с другими причинами смерти, которые показывают:

  • более линейные модели (цифры увеличиваются со временем, но с постоянной скоростью).
  • гораздо более медленный рост смертности от гриппа или
  • низкие показатели на ранних стадиях вспышки и поэтому упустите возможность экспоненциального роста.

Даже когда исследователи говорят об экспоненциальном росте, они все равно могут вводить в заблуждение.

Теперь каждый статистик. Вот какие кабинетные эксперты по COVID ошибаются
«Сглаживание кривой» — это еще один способ сказать «замедление распространения». Эпидемия удлиняется, но мы сокращаем количество тяжелых случаев, что снижает нагрузку на системы здравоохранения. Предоставлено: The Conversation/CC BY ND.

Широко распространенный анализ израильского профессора утверждает, что экспоненциальный рост COVID-19 «исчезает через восемь недель». Что ж, он явно ошибался. Но почему?

Его модель предполагала, что случаи COVID-19 растут экспоненциально в течение нескольких дней, а не в течение последовательности передач, каждая из которых может занять несколько дней. Это привело к тому, что он построил график только неустойчивого роста ранней фазы вспышки.

Более качественная визуализация позволяет отсечь эти беспорядочные первые случаи, например, начиная с сотого случая. Или они используют оценки количества дней, необходимых для удвоения числа случаев (примерно шесть-семь дней).

3. Не все инфекции являются случаями

Тогда есть путаница между инфекциями COVID-19 и случаями. В эпидемиологическом плане «случай» — это человек, у которого диагностирован COVID-19, в основном по положительному результату теста.

Но инфекций гораздо больше, чем случаев. Некоторые инфекции не проявляют симптомов, некоторые симптомы настолько незначительны, что люди думают, что это просто простуда, тестирование не всегда доступно для всех, кто в нем нуждается, а тестирование не позволяет выявить все инфекции.

Инфекции «вызывают» случаи, тестирование выявляет случаи. Президент США Дональд Трамп был близок к истине, когда сказал, что число заболевших в США велико из-за высокого уровня тестирования. Но он и другие все равно ошибались.

Дополнительное тестирование не результатов в большем количестве случаев, оно позволяет более точно оценить истинное количество случаев.

Лучшая эпидемиологическая стратегия — не проводить меньше тестов, а проводить как можно более широкие проверки, сводя к минимуму несоответствие между случаями и общими инфекциями.

4. Мы не можем сравнивать количество смертей с случаями, произошедшими в тот же день

Оценки различаются, но время между заражением и смертью может составлять до месяца. И разница во времени до выздоровления еще больше. Некоторые люди серьезно болеют и выздоравливают долго, у некоторых симптомы отсутствуют.

Таким образом, смертельные случаи, зарегистрированные в конкретную дату, отражают случаи смерти, зарегистрированные за несколько недель до этого, когда количество случаев могло быть меньше половины числа текущих случаев.

Быстрое удвоение обращений и длительное время восстановления также создают большое расхождение между подсчетом активных и восстановленных обращений. Мы узнаем истинные цифры только ретроспективно.

5. Да, данные беспорядочные, неполные и могут измениться

Некоторые пользователи социальных сетей злятся, когда статистика корректируется, что подпитывает теории заговора.

Но мало кто осознает, насколько гигантской, хаотичной и сложной задачей является отслеживание статистики по такой болезни.

Страны и даже штаты могут по-разному подсчитывать случаи и смерти. Также требуется время, чтобы собрать данные, а это значит, что необходимо внести ретроспективные корректировки.

Истинные цифры по этой пандемии мы узнаем только ретроспективно. Точно так же и ранние модели были не обязательно ошибочными, потому что разработчики моделей были обманчивы, а потому, что у них было недостаточно данных для работы.

Добро пожаловать в мир управления данными, очистки данных и моделирования данных, который не всегда ценится многими кабинетными статистиками. До сих пор./P>

Spread the love

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *