Голая статистика - Чарльз Уилан (Naked Statistics - Charles Wheelan) Сегодня хочу поделиться мини рецензией об этой замечательной книге. Заодно ответить на вечный вопрос: может ли книга про статистику быть живой, понятной и не вызывать флэшбеки с пары по матстату. На сайте самого Уилана про него написано коротко и нагло: Author. Professor. Speaker. Political Reformer. Автро явно не из тех, кто открывал статистику только ради сдачи экзамена. И это чувствуется с первых страниц. Я, как человек, который уже много лет живёт в аналитике, BI и моделях, я довольно скептически отношусь к «популярным» книгам по статистике - но тут история другая: __«Голая статистика» - это, пожалуй, одна из лучших книг по статистике, которые я читал.__ А читал я их уже немало - от классики до совсем академического кирпича. О чём книга (и почему это не скучно) • Корреляция • Основы теории вероятностей • Центральная предельная теорема (ЦПТ) • Опросы общественного мнения • Регрессионный анализ На обложке вообще написано: __«Самая интересная книга о самой скучной науке»__ И вот тут Уилан делает магию: он реально разжёвывает статистику так, что и новичку ок, и человеку с опытом есть что подчеркнуть и переосмыслить. При этом он объясняет сложные вещи на живых примерах: загадка Монти Холла, Perry Preschool Study, марафон любителей сосисок, супружеская жизнь Ким Кардашьян (да, и она послужила статистике), исследования Americans Changing Lives и многое другое. Центральная предельная теорема по-человечески Отдельный кайф книги - блок про выборки, опросы и ЦПТ. Вот как сам Уилан описывает ЦПТ: «Центральная предельная теорема, значение которой для статистики соизмеримо со значением Леброна Джеймса для профессионального баскетбола». Если перевести на практический язык: __если у нас есть правильно сформированная выборка, то наблюдаемые на ней характеристики с высокой вероятностью отражают свойства всей генеральной совокупности.__ Несколько цитат, которые показались особенно точными «Опираясь на статистику, легко врать, но без статистики очень трудно выяснить истину». - Андрейс Дункельс «Вы не можете управлять тем, что не в состоянии измерить. Помимо этого, то, что вы измеряете, действительно является тем, чем вы пытаетесь управлять». «Какой бы соблазнительной ни была элегантность и точность вероятностных моделей, они не заменят нам здравого размышления о сути и цели выполняемых вычислений». И мой любимый образ 🔥: «Когда увеличивается размер неправильно сформированной выборки, высота мусорной кучи также увеличивается, а вонь от неё становится сильнее». __«Голая статистика»__ трезво напоминает: 📍 Статистика и анализ данных - это мощный инструмент, чтобы лучше понимать реальность, а не подгонять её под наши фантазии. 📍 Любая модель - всего лишь приближение мира, а не откровение. 📍 Аналитик всегда должен быть не только «человеком формул», но и человеком здравого смысла. Как я люблю говорить: мало быть data-driven, важно оставаться data-informed Как эта книга помогла лично мне В далёком уже 2019-м я учился на Data Science в Нетологии. Одна из тем была Центральная предельная теорема. Формулы были красивые, преподаватели старались, домашки летели одна за другой - но абсолютно не было понятно, как эту теорему вообще применять в реальной аналитике и зачем она нужна, кроме как для галочки на экзамене. И вот спустя время попадает мне в руки __«Голая статистика»__. И Уилан, как настоящий профессор-волшебник, берёт и на примере марафона любителей сосисок(!) объясняет ЦПТ так, что наконец-то становится ясно: • как она работает • почему она настолько фундаментальна • и в каких реальных задачах она решает половину аналитических головоломок. Так что да - эта книга не только хороша сама по себе, она ещё и сильно закрывает пробелы, которые другие источники часто оставляют открытыми.