InvestFuture

Как нас обманывают при помощи статистики? / Дарелл Хафф

Посмотрели: 481

Привет, друзья. Вы на канале InvestFuture, с вами Кира Юхтенко, и сегодня мы поговорим с вами о статистике. Очень часто с ее помощью на нас пытаются повлиять. Например, чтобы мы купили «нужный» продукт или выбрали «правильного» кандидата на выборах. И вообще наверняка вы слышали высказывание, что есть ложь, есть наглая ложь, а есть статистика.

Вот сегодня мы как раз и поговорим: как злоупотребляют статистикой для обмана и манипулирования? Как понять достоверность данных? Как происходят подсчеты? Что остается за кадром?

И поможет нам во всем этом разобраться Дарелл Хафф, автор книги «Как лгать при помощи статистики». Он прямо-таки вооружает знаниями, чтобы разобраться в этой науке и не позволят ввести в заблуждение. Данная книга – наиболее известная работа автора. Она не стареет, хотя была опубликована еще в 1954 году и стала самой продаваемой книгой о статистике второй половины ХХ века.

Об авторе - Дарелл Хафф

Давайте сначала посмотрим, что мы знаем о Дарелле Хаффе. Это американский писатель, он родился в 1913 году, но лишь с 1946-го посвятил себя написанию книг. Как ни странно, в основном о быте и домохозяйстве. Однако больше всего он известен именно благодаря своей книге «Как лгать с помощью статистики». В том числе он, он разработал доступный и практичный метод преподавания этой науки в колледжах и школах. Вот фото Хаффа (рис. 1).

Даррел Хафф

Рис. 1. Фото Дарелла Хаффа, источник – «Альпина Паблишер»

Кстати, сам Хафф использовал статистику не только во благо. Он был лоббистом табачных компаний, и ему заплатили, чтобы он свидетельствовал перед Конгрессом в 1950-х и 1960-х годах «о безвредности курения». Хафф должен был «высмеять любую связь между сигаретами и болезнями». И вот в 1965 году Хафф на слушаниях обвинил медиков в том, что в их отчёте «бесчисленные неудачи и «ошибки»». Табачные компании хотели даже спонсировать Хаффа, чтобы он выпустил продолжение своей книги – «Как врать с помощью статистики о курении». Но до реализации не дошло. Видимо, писатель не захотел.

Интересно, что вся информация о связи Дарелла Хаффа с табачными компаниями стала публичной только в 1998 году.

О чём книга «Как лгать при помощи статистики»?

Автор говорит о том, что ложь приобрела цифры благодаря статистике. А за этим последовали убедительность и логика, ведь в «умелых руках» за цифрами может скрываться всё что угодно. Статистикой искажают общественное мнение, используют её для личного обогащения. Она помогает скрывать настоящие цифры и неприглядные факты, в том числе, при решениях государственного масштаба.

В рецензиях отмечают: книга хороша не только выводами или большим количеством примеров. Важно, что она учит критическому мышлению и здравому отношению к цифрам, объясняет, что статистика – это не «сакральное знание», а инструмент, с помощью которого зачастую манипулируют нашим мнением.

Но стоит понимать, что книга старая – 1954 года, так что некоторые современные особенности статистики, исследований, рекламы и маркетинга не учитываются. Конечно же, в ней нет ничего про интернет или Big Data. Однако в статистике и сейчас остаётся пространство для интерпретаций и относительных оценок.

Всего в книге 10 глав, и темы постепенно становятся сложнее. Но в целом Дерелл Хафф рассказывает самые основы статистики и уделяет много внимания примерам из жизни, пусть и семидесятилетней давности.

Всё начинается с выборки. Автор объясняет, что такое репрезентативность, откуда может возникать предвзятость. Далее идет речь про очень расплывчатое «среднее» и об отличия среднего арифметического, медианы и моды. Немного затронут закон средних чисел. Описан и критерий значимости – насколько вероятно, что полученная цифра отражает реальный результат, а не что-то случайное. Все это перетекает в вероятную и стандартную ошибки – точность выборки.

Помимо примеров в книге много картинок, большинство из них – карикатуры. Но есть и другие – это реальные графики и изображения с искажённой статистикой. Вот, например (рис. 2).

Обманчивый график из книги "Как лгать с помощью статистики"

Рис. 2. Обманчивый график из книги

Также в нескольких главах автор описывает, как обманывать через графики и диаграммы.

Далее материал усложняется. Речь идёт о причинах и следствиях. Например, о древнем заблуждении – если за событием А следует событие В, значит, А является причиной В. С этим помогает разобраться корреляция. Автор описывает её виды, чтобы читатель не запутался. Хафф также затрагивает и ковариацию – меру линейной зависимости двух случайных величин. Он приводит примеры, как причина и следствие могут меняться ролями или даже одновременно будут и причиной, и следствием друг для друга. 

В последней главе автор приводит конкретные рекомендации, «как поставить статистика на место» с помощью пяти простых вопросов. Вопрос «кто это говорит?» проверяет предвзятость статистических данных. Вопрос «откуда ему это известно?» важен, чтобы проверить смещение выборки и качество отбора, особенно для корреляции. А также стоит спросить: «Не подменен ли объект исследования?», «Есть ли в нем смысл?», «Есть ли в нем прогнозы?». Не будем забывать, что прогнозы – не больше чем догадки на основе прошлого опыта и имеющихся знаний.

Актуальные советы и частые ошибки статистики

Друзья, теперь перейдём к экономике и современным примерам, посмотрим, как работает статистика на макроэкономических показателях. Ведь именно они помогают инвесторам оценить состояние рынка, что важно при анализе компаний для выбора ценных бумаг.

Как и в книге, мы рассмотрим базовые советы, как не обмануть себя, глядя на цифры или громкие заголовки. А вот подробно почитать про основные экономические показатели для инвестора можно в нашем телеграм-канале IF Stocks.

Смотрим все показатели в сумме

Друзья, важно понимать, что сами по себе отдельные показатели редко помогут что-то понять. Например, для данных о торговом балансе нужно учитывать отдельно импорт и экспорт, а для статистики по занятости – уровень участия в рабочей силе. И не стоит забывать, что многие показатели складываются из нескольких компонентов. Например, инфляция состоит из динамики цен по множеству отдельных категорий товаров. А импорт и экспорт разделяются как по товарам/ресурсам, так и по странам.

Также макростатистика может быть обманчивой, если не учитывать эффект базы. Об этом говорится и в книге Хаффа. Современный пример: в 2021 году по всему миру макростатистику оценивали очень осторожно, ведь было легко обмануться позитивными данными. Экономика действительно резко восстанавливалась после локдаунов, но цифры были высокими и из-за эффекта низкой базы. В 2020 году бизнес встал, и статистика была очень слабой. Так что в сравнении с ней данные 2021 года могли выглядеть значительно лучше, чем было на самом деле.

Инфляция в статистике

Теперь поговорим об инфляции. В данных о росте цен часто используют показатели «без учёта». Так, в США и ЕС публикуют базовую инфляцию – не считая цен на еду и топливо, потому что те же цены на энергоресурсы постоянно меняются. В итоге, «чтобы лучше понимать состояние экономики», волатильные категории убирают. Как вот здесь, например (рис. 3).

Волатильность общей инфляции и базового ИПЦ в США. Источник – EconomicsHelp

Рис. 3. Волатильность общей инфляции и базового ИПЦ в США, источник – EconomicsHelp

Но когда мы углубимся в «разбивку» инфляции в США, можно понять, почему Штаты так беспокоятся за рынок нефти и газа: дорогая энергетика сейчас влияет на треть показателя инфляции.

ВВП в статистике

Сам по себе ВВП даёт мало информации, поэтому, как правило, публикуют сразу его динамику. На ВВП могут влиять приток-отток капитала и уровень безработицы. Чем больше денег инвестируют в страну, тем больше их вкладывается в производство. А безработица показывает трудовые ресурсы в экономике. Соответственно, чем больше людей трудится, тем выше должен быть выпуск, а значит, и ВВП.

Однако ВВП, как правило, считается по кварталам, а поэтому он запаздывает в оценке состояния экономики. Так что можно отслеживать косвенные показатели. Например, заказы на товары длительного пользования (Durable Goods). При этом важно обращать внимание на своеобразную цикличность. Здесь учитываются расходы на товары сроком использования более 3 лет. Так что периоды роста заказов сменяются «застоями», когда большинство людей уже накупили холодильников и микроволновок, а их срок службы ещё не истёк. 

Внешняя торговля в статистике

Торговый баланс объединяет экспорт и импорт страны. Поэтому не стоит смотреть только на него. Снижение баланса может означать падение экспорта или рост импорта, и наоборот. Также важно учитывать курс валюты. Для России, например, дорогой рубль выгоден для импорта, но не для экспорта. И доходы/расходы изменяются соответственно курсу. А торговая война США и Китая не закончилась, хотя и отошла на второй план. Поэтому  важно внимательно следить за торговым балансом и его компонентами. Особенно на динамику с ключевыми торговыми партнёрами.

Рынок труда в статистике

Статистика занятости может быть достаточно сложной для изучения. Особенно хорошо сбор данных развит в США. При этом перед публикацией предыдущие показатели часто пересматривают. Еще важно учитывать возникающую сезонность из-за временного трудоустройства. Также на занятость могут влиять природные катаклизмы. Часто в США можно проследить, как ураганы в отдельных штатах сказываются на общих данных.

Значимым показателем для безработицы является и уровень участия в рабочей силе — отношение количества занятых или безработных к числу всех трудоспособных граждан. Потому что люди могут вовсе перестать искать работу, тогда они больше не считаются безработными. В таком случае снижение безработицы неочевидное. Показатель уменьшился, но уровень участия покажет подвох. На графике видно, что безработица в США около допандемийного уровня. Но участие в рабочей силе всё ещё не дошло до показателей 2019 года. (рис. 4.)

Безработица и участие в рабочей силе в США, источник – TradingEconomics

Рис. 4. Безработица и участие в рабочей силе в США, источник – TradingEconomics

Кому будет полезна книга «Как лгать при помощи статистики»?

Итак, друзья, к какому же выводу мы приходим? Любые статистические данные, факты и цифры в газетах, книгах, журналах и рекламе следует принимать к сведению, только когда вы сами изучите их. «Порой осторожная недоверчивость помогает сфокусироваться на сути», – пишет Дерелл Хафф. Но отвергать статистику без достаточных оснований, конечно, не стоит.

И это особенно важно для экономической статистики, которая влияет на поведение рынка. Важно осознавать, когда толпа неверно интерпретировала свежие данные и переоценила позитив или негатив.

Что ж, мы с вами рассмотрели на базовом уровне ловушки и подводные камни, которые стоит учитывать в самых популярных макропоказателях. А книга «Как лгать при помощи статистики», на мой взгляд, может помочь в том, чтобы научиться критично смотреть на статистику в повседневной жизни.

Оцените материал:
(оценок: 47, среднее: 4.55 из 5)
Читайте другие материалы по темам:
InvestFuture logo
Как нас обманывают при

Поделитесь с друзьями: