Во власти цифр

~ 2 ~

В этой книге я надеюсь убедить вас в том, что случайная выборка лучше, чем опрос пользователей твиттера; что корреляция – это не причинно-следственная связь; что погрешности необходимо учитывать и что утверждение Трампа о смертности от коронавируса в США было абсолютно неверным.

– Почему так нельзя? – спросил президента Суон.

– Нужно смотреть по… Вот, глядите. – Трамп протянул журналисту другую страницу. На ней была диаграмма с ярко раскрашенными столбцами. – Вот Соединенные Штаты. Нужно смотреть по случаям заболевания. Вот эти случаи.

Трамп продолжал говорить, но Суон попытался спросить еще раз:

– А почему не в пропорции к численности населения?

Утверждение Трампа не было чистой выдумкой, как полтора миллиона присутствовавших на его инаугурации. Он смотрел на коэффициент летальности (Case Fatality Rate, CFR), то есть на процентную долю умерших от болезни среди всех тех, кто получил положительные результаты тестирования. Это хорошо известный эпидемиологический параметр, позволяющий приблизительно оценить смертность от того или иного заболевания. К концу июля 2020 года, когда состоялось это интервью, значение CFR для Европы составляло 7,0 процента, а для всего мира – 3,9 процента. А для Соединенных Штатов? 3,5 процента – действительно «ниже», как и утверждал Трамп.

И все же что-то в его рассуждениях было не так. К счастью, Суону хватило проницательности сразу же это заметить. Низкое значение CFR не означало, что в США все в порядке. Даже если эта доля мала, количество умерших будет большим, если большим будет количество инфицированных. Поэтому Суон хотел увидеть, как соотносится число умерших с численностью всего населения. В конце июля смертность в Европе находилась на уровне 264 случая на миллион жителей, а в среднем по миру – 84. В США смертность составляла 453 случая на миллион человек. Она превышала европейскую более чем в полтора раза, а общемировую – более чем в пять раз. Если вкратце, то ситуация была прямо противоположной тому, что подразумевает слово «ниже».

Эта книга разоблачает злоупотребления именно такого рода. Если лучшая ложь содержит крупицу истины, то и числовой обман точно так же труднее всего раскрыть, если он связан с реальными цифрами. Такая фальшь бывает достаточно тонкой, чтобы остаться незамеченной, и достаточно убедительной, чтобы ее можно было распространять.

В своей книге я предложу вам средства, позволяющие распознать такой обман. Для этого вам не понадобится ученая степень по статистике – хватит и толики любопытства и здравого смысла. Не помешает и готовность признать свои недостатки.

– А некоторые говорят, что слишком много тестировать вредно. Вы ведь знаете об этом? – сказал Трамп Суону несколько раньше в том же интервью.

– Кто так говорит?

– Да почитайте книги, почитайте учебники.

– Учебники?

Через несколько минут Трамп сформулировал ту мысль, которую хотел высказать:

– Дело в том, что мы тестируем гораздо лучше, чем любая другая страна. Поэтому у нас больше случаев заболевания.

Здесь Трамп сделал с темой тестирования на коронавирус то же, что и с темой смертности: он начал подбирать доводы, которые подтверждали его точку зрения. Числа связаны не только со статистикой, но и с психологией. И этим грешит не один Трамп. Все мы так делаем.

Возможно, вы с надеждой ловите каждую новость о количестве вакцинированных, мечтая, чтобы все это наконец закончилось; может быть, вас раздражает исследование эффективности масок, потому что вам кажется, что это ограничение вашей свободы; или же вас печалит статистика смертности от коронавируса в вашей стране, потому что вы привыкли гордиться своим отечеством.

Все мы встречаем и такие факты, которые радостно принимаем на веру, и такие, которые мы предпочли бы немедленно отвергнуть.

Даже если уловки Трампа в этом интервью вас не обманули, вполне вероятно, что в каком-нибудь другом случае вы на них попадетесь. В марте 2020 года в Нидерландах получила широкое распространение статистическая таблица, в которой смертность от коронавируса в Италии, сильно пострадавшей в то время, сравнивалась с аналогичными данными по Нидерландам. Вывод ужасал: мы идем тем же путем, что и Италия!

Однако при анализе данных оказалось, что они отобраны и подогнаны именно к такому выводу. Каждый из двух наборов чисел начинался с некой произвольной даты, выбранной так, что при экстраполяции итальянских данных и их сравнении с положением в Нидерландах картина действительно получалась тревожной. Но стоило взять данные с другими, более логичными начальными датами, как траектория развития пандемии в Нидерландах оказывалась совершенно отличной от итальянской и менее пугающей. Именно такой тенденциозный подбор данных и использовал Трамп в своем интервью.

А как же довод о том, что число выявленных заболеваний увеличивается из-за более интенсивного тестирования? Он был широко распространен в Нидерландах летом 2020 года, когда пришла вторая волна пандемии коронавируса. Этот довод был не уловкой, а вполне обоснованным аргументом: то, как проводится тестирование, действительно влияет на статистику. Однако это не причина не принимать вторую волну всерьез; просто нужно быть еще осторожнее в истолковании данных. Я сама писала об этом в своих статьях. Но, услышав подобное из уст Трампа, я просто рассмеялась и не стала разбираться в его доводах. Ох уж этот мне чудак со своими учебниками! Мне тоже нужно держать себя в руках.

Пандемия показала нам числа как с лучшей, так и с худшей стороны, еще раз продемонстрировав и то, насколько они важны, и то, как ими можно злоупотреблять ради личной выгоды. Я привожу ряд примеров в этом дополненном издании.

Числа дают нам опору и уверенность в собственных силах. Это подбадривает, особенно в такие неопределенные времена. Но у чисел есть и границы: они не могут ни точно предсказывать будущее, ни говорить нам, какие принимать решения. Надеюсь, эта книга поможет вам увидеть цифры в истинном свете, поскольку они играют важную роль в нашей жизни сегодня и будут играть ее завтра и еще долго после окончания пандемии.

Утрехт, декабрь 2020 года

Вступление
Плененные числами

Она зашла в пыльный кабинет сквозь раздвижные двери и пожала мне руку:

– Хуанита[3].

Полинявший свитер был ей велик, отчего она, и без того невысокая, казалась еще меньше. Когда Хуанита села на складной стул напротив меня, я объяснила по-испански, что приехала в Боливию по заданию нидерландского университета, провожу исследование уровня счастья и имущественного расслоения и хочу задать ей несколько вопросов о ее собственной жизни и стране, в которой она живет.

Я произносила эту заученную речь уже не в первый раз. Десять дней я беседовала с жителями боливийского города Тарихи, расположенного недалеко от аргентинской границы. Я разговаривала с рыночными торговками, пила пиво с фермерами, выращивающими клубнику, ходила на семейные барбекю – лишь бы собрать как можно больше данных. Теперь я добралась со своей пачкой анкет до офиса женской организации, руководство которой предложило связать меня с empleadas domésticas – домработницами. Женщинами вроде Хуаниты.

– Начнем, – сказала я. – Сколько вам лет?

– Пятьдесят восемь.

– К какой этнической группе вы принадлежите?

– Аймара.

«Ага, – подумала я, – значит, она из одного из индейских племен». С такими людьми я раньше не встречалась.

– Семейное положение?

– Не замужем.

– Вы умеете читать?

– Нет.

– А писать?

– Нет.

Я продолжила задавать вопросы в том же духе – профессия, образование, есть ли у нее мобильный телефон, холодильник или телевизор.

– Я зарабатываю двести боливиано в месяц, – ответила она, когда я спросила о ее зарплате. Это было гораздо меньше минимальной заработной платы – 815 боливиано, которую установил незадолго до того президент Эво Моралес.

– Я боюсь, что, если попрошу добавить мне денег, начальник меня уволит. Я живу в carpita.

Я записала это слово, но не знала, что оно означает, пока не посмотрела в словаре. Оказалось, она жила в палатке.

В конце концов я добралась до главной темы своего исследования – уровня счастья и имущественного расслоения. Еще сидя за своим столом на одиннадцатом этаже в Роттердамском университете Эразма, я подготовила в PowerPoint пять диаграмм. Они соответствовали разным вариантам распределения доходов.

В первый же день исследовательской работы в Боливии я заметила, что мои вопросы об имущественном расслоении подходят не всем. Рыночные торговки, с которыми я беседовала, не понимали, что означают мои диаграммы. Могла ли я ожидать, что Хуанита, которая не умела ни читать, ни писать, поймет мой вопрос? Я решила пропустить эту часть анкеты.

Однако она, опередив меня, заговорила.

– Знаете, что не так с Боливией? – Хуанита выпрямилась на стуле. – Есть очень большая группа бедных и очень маленькая группа богатых. И разница между ними только растет. Неужели вас удивляет, что в этой стране больше никто никому не доверяет?

Сама того не зная, моя собеседница описала диаграмму А. При этом она еще и ответила на два других моих вопроса – о ее прогнозах на будущее и уровне доверия в ее стране. Я очень сильно недооценила ее. Я покраснела, но продолжила разговор как ни в чем не бывало. Мы дошли до последнего вопроса.

– Оцените по шкале от одного до десяти, насколько вы счастливы.

– Один.

– А насколько, как вы считаете, вы будете счастливы через пять лет?

– Один.


[3] Я уже писала о встрече с Хуанитой в своем блоге Out of the Blauw и в блоге организации Oikocredit Nederland. Поскольку я не сумела связаться с ней и показать ей это изложение, ее имя изменено. Глава 1. Числа могут спасать