Книги, которые мы собрали в этой подборке, точно стоит прочитать тем, кто связал свою жизнь с big data, данными и их анализом. В списке — варианты для новичков, профессионалов и просто любопытных.
Основы профессии
Статистика для всех
Автор: Сара Бослаф
«Статистика для всех» Сары Бослаф — это основы статистических концепций и методов, предназначенные для людей, не имеющих специального образования. Автор приводит примеры из реальной жизни и использует простые аналогии, чтобы объяснить сложные понятия и сделать статистику доступной для всех.
В книге есть главы о базовых статистических понятиях: среднее значение, стандартное отклонение и корреляция, — а также более продвинутые темы: регрессионный анализ и анализ выживаемости. Издание содержит практические задания, которые помогают закрепить полученные знания.
Статистика и котики
Автор: Владимир Савельев
Еще один бестселлер от российского автора. В своей книге «Статистика и котики» Владимир Савельев предлагает обучаться с юмором. Автор в легкой и доступной форме объясняет основные понятия и методы статистики, используя забавные примеры с котиками.
Data Science. Наука о данных с нуля
Автор: Джоэл Грас
Книга «Data Science. Наука о данных с нуля» Джоэла Граса — отличное пособие для тех, кто хочет изучить основы data science. В книге подробно рассмотрены все этапы работы с данными: от сбора и очистки до анализа и визуализации.
Грас не перегружает текст сложными терминами и формулами, а старается объяснить все концепции на примерах из реальной жизни. Книга содержит множество практических заданий, которые помогут закрепить полученные знания, что особенно важно для тех, кто только начинает свой путь в data science.
«Data Science. Наука о данных с нуля» не устаревает, она актуальна и современна. Автор освещает последние тенденции и технологии в области data science, что позволяет читателям быть в курсе новостей и тенденций в этой сфере.
Важные инструменты
Python и анализ данных
Автор: Уэс Маккинни
«Python и анализ данных» Уэса Маккинни — руководство по использованию языка Python для анализа данных. Автор показывает, как использовать Python для решения различных задач, связанных с анализом, и рассказывает о:
- работе с данными;
- визуализации;
- статистике;
- машинном обучении.
Книга будет полезна как новичкам, так и опытным разработчикам, которые приступают к курсу по изучению анализа данных с помощью Python.
Python и наука о данных для чайников
Авторы: Джон Пол Мюллер, Лука Массарон
Книга «Python и наука о данных для чайников» только на первый взгляд кажется простой. Авторы не жалеют читателей и помогают погрузиться в мир программирования по полной.
Из книги вы узнаете, как с помощью языка программирования Python строить диаграммы и графики, анализировать данные и выполнять статистический анализ.
Если вы еще не знаете, как Python связан с Anaconda и что такое Google Colab, то книга рекомендована к прочтению!
Работа с данными в любой сфере
Автор: Кирилл Еременко
Книга будет интересна специалистам в области data science, аналитики и статистики, а также тем, кто хочет освоить эти области.
В книге «Работа с данными в любой сфере» Константина Еременко рассказывает о том, как собирать, очищать и визуализировать данные, а также о методах статистического анализа и машинного обучения. Автор раскрывает, что такое среднее значение, стандартное отклонение, корреляция, учит анализировать данные, строить графики и делать выводы.
Книга наполнена примерами из бизнеса, медицины, образования, которые помогают лучше понять изложенный материал и применить его для решения практических задач. Для начинающих книга может быть сложной. Тем, у кого уже есть опыт работы с данными, она расширит арсенал методов и инструментов.
Заставьте данные говорить
Автор: Алексей Колокольников
Книга «Заставьте данные говорить» Алексея Колоколова — это бесплатное руководство по анализу и визуализации данных в Excel. Автор описывает методы и способы обработки, а также предлагает примеры использования этих методов в реальных ситуациях.
Книга ценна тем, что подойдет даже начинающим специалистам. Не нужно много знать в области программирования или статистики, чтобы научиться создавать дашборды.
Автор намеренно уделяет большое внимание вопросам визуализации данных, что позволяет читателю лучше понять результаты анализа, а потом и делать интерактивные схемы и графики самостоятельно. О других инструментах визуализации данных можно почитать в нашей статье.
Сейчас существует множество форматов и новых площадок для получения информации: от чатов с единомышленниками до обучающих видео и целых онлайн-курсов. Однако книги не отходят на второй план, а остаются важным источником знаний.
Книги содержат проверенные базовые практики, основаны на принципах и концепциях, которые не устаревают со временем, предлагают углубленное и детализированное погружение в тему, показывают методы, техники и навыки без ограничения конкретными вариантами их применения. Книги полезны как для новичков, так и для опытных специалистов любой области, они помогают как получить знания, так и освежить в памяти то, что уже было известно ранее.
Для специалистов из сферы аналитики я могу порекомендовать несколько книг:
- Книга «Статистика и Котики» от Владимира Савельева. Автор расскажет, что такое дисперсия и стандартное отклонение, как можно определить t-критерий Стьюдента и U-критерий Манна-Уитни, объяснит много других сложных терминов — и все это на понятных примерах с котиками.
- Книга «Машинное обучение» от авторов Бринк Хенрик, Ричардс Джозеф, Феверолф Марк. Книга даст понимание основных концепций машинного обучения, объяснит, что из себя представляет сбор данных, моделирование, классификация и регрессия. И что наиболее важно — с ее помощью можно получить практический опыт работы с реальными данными.
- Книга «Машинное Обучение: Подготовка к сложному интервью» от Али Аминиана. Эта книга — путеводная звезда для тех, кто проходит собеседование по системному проектированию в машинном обучении. Она подходит как начинающим, так и опытным специалистам. В ней содержится инсайдерская информация о вопросах на интервью, методиках решения задач, анализ реальных вопросов и более 200 наглядных диаграмм.
Данные вокруг нас
Все лгут: поисковики Big Data и интернет знают о вас все
Автор: Сет Стивенс Давидовиц
Сет Стивенс-Давидовиц — журналист, пишущий о технологиях и науке. Он работал в The New York Times, The Wall Street Journal и Wired Magazine.
«Все лгут: поисковики, Big Data и интернет знают о вас все» — книга, в которой автор исследует, как крупнейшие компании, такие как Google и Amazon, собирают личные данные пользователей — а потом используют эту информацию в своих целях: манипулируют поведением, определяют покупательские предпочтения и даже влияют на политические взгляды людей.
Как лгать при помощи статистики
Автор: Дарелл Хафф
Если Сет Стивенс-Давидовиц в книге «Все лгут» разоблачает большой бизнес и его методы использования данных, то Дарелл Хафф переманивает нас на «темную сторону».
Книга «Как лгать при помощи статистики» — это критика того, как в средствах массовой информации и политике используют статистические методы. Автор утверждает, что многие люди не разбираются в принципах статистики и том, как она работает, что приводит к неправильному использованию статистических данных и, как следствие, к ошибочным выводам.
Хафф объясняет различные статистические методы и показывает, как можно лгать при помощи статистики.
Почему. Руководство по поиску причин и принятию решений
Автор: Саманта Клейнберг
Книга «Почему. Руководство по поиску причин и принятию решений» Саманты Клейнберг — это введение в теорию причинности, области научного знания, которая изучает, как люди объясняют события и принимают решения. Автор рассматривает различные виды причинности:
- каузальные ассоциации;
- структурные и функциональные объяснения;
- нормативные;
- телеологические.
Клейнберг также обсуждает применение теории причинности в различных областях, включая психологию, философию и нейронауку.
Если вы сомневаетесь, нужно ли вам читать эту книгу, задумайтесь: умеете ли вы правильно принимать решения на основе полученных данных? Понимаете ли причины, которые привели к таким результатам статистики? Если ответ нет, то книга для вас!
Иллюзия выбора
Автор: Касс Санстейн
Автор анализирует, как мы делаем выбор и кто на самом деле принимает решения за нас. Касс утверждает, что наша свобода выбора часто является иллюзией, созданной маркетингом и социальными нормами.
Книга предназначена для широкого круга читателей и будет интересна тем, кто интересуется статистикой, психологией, социологией и маркетингом. Читайте ее, если устали от сложных математических исследований.
Удовольствие от Х
Автор: Стивен Строгац
Книга Стивена Строгац «Удовольствие от Х» — это сборник эссе на различные темы, связанные с математикой и информатикой.
Стивен Строгац — талантливый ученый-математик и преподаватель крупного технического вуза в США. В своем издании он обсуждает небанальные вопросы: красоту и сложность фракталов, роль математики в искусстве и науке, перспективы развития искусственного интеллекта.
BIG DATA. Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим
Авторы: Виктор Майер-Шенбергер, Кеннет Кукьер
Еще одна книга о том, как математика, статистика и обработка больших данных влияют на нашу жизнь. Авторы «Больших данных. Революция, которая изменит то, как мы живем, работаем и мыслим» Виктора Майер-Шенбергер и Кеннет Кукьер считают, что мир стоит на пороге очередной технической революции.
Благодаря большим данным мы не только научимся узнавать суть вещей, но и сможем предсказывать будущее. Авторы обсуждают различные аспекты Big Data: сбор, хранение, анализ и использование данных для принятия решений. А еще — рассматривают потенциальные риски и этические вопросы, связанные с использованием Big Data.