Сегодня продолжаем сравнивать DataCamp и Яндекс.Практикум: в этом материале коротко расскажу, чему учат на каждой из платформ в доступных бесплатно вводных курсах.
Яндекс.Практикум
Во введении (Основы Python и анализа данных) – 9 тем, с примерным временем освоения 29 часов. 9 тему вычёркиваем сразу – она сугубо продающая и рассказывает о том, как организована основная часть программы.
В оставшихся восьми темах студент:
- Познакомится с интерфейсом программы (включая среду для написания и запуска кода);
- Познакомится с функцией read_csv из библиотеки pandas;
- Научится выводить данные на экран командой print();
- Научится объявлять переменные;
- Познакомится с двумя видами графиков из библиотеки seaborn: хитамапами (тепловыми картами) и столбчатыми диаграммами*;
*Если вы когда-либо сталкивались с задачами аналитики и презентации данных, то знаете, что цвет на графике – такой же элемент, как и сами значения, оси и др. Цвет функционален: он сообщает читателю о том, что на какой-то элемент нужно обратить внимание. К сожалению, авторы библиотеки seaborn по умолчанию используют цвет в столбчатых диаграммах совершенно неправильно, а именно – для красоты визуализации. В итоге графики выглядят так
Цвет здесь не то, что не функционален – он откровенно отвлекает за счёт того, что представлен градиентом, заставляет думать над вопросом «а что вообще показывает цвет на этом графике?». Это сбивает с толку и отвлекает. Запомните: цвет несёт смысловую нагрузку. Этому графику хватило бы одного цвета для всех столбцов.
Вернёмся к содержанию курса. Помимо перечисленного выше, студен также:
- Научится читать ошибки интерпретатора Python;
- Познакомится с базовыми типами данных: str, int, float, и – несколько позже – boolean;
- Узнает, какие операции можно проводить с каждым типом данных и познакомится с логическими операторами;
- Познакомится со списками в Python;
- Познакомится с циклом for и условной конструкцией if – elif – else;
- Научится уточнять задачи и формулировать гипотезы, требующие проверки; кроме того, познакомится со стандартным подходом к аналитическим задачам:
- Постановка задачи;
- Получение данных;
- Предобработка данных;
- Исследовательский анализ данных;
- Подготовка прототипа решения;
- Проверка результатов;
- Доработка решения;
- Оформление результатов;
- Проверка реальностью.
- Решит несколько кейсов, представленных в игровой форме.
Довольно большой набор, где технические навыки не доминируют – значительная часть из оценочных 29 часов посвящена именно обзору образа мышления аналитика и структуре стандартного аналитического проекта.
DataCamp
Курс – Introduction to Data Science in Python. Примерно 4 часа на освоение, 13 видео, 44 упражнения.
Курс охватывает следующие темы:
- Импорт библиотек (включая aliases, пропущенные в Практикуме).
- Переменные: правила объявления переменных, типы данных.
- Функции и аргументы функций.
- Обзор функционала библиотеки Pandas.
- Методы head и info.
- Фильтры данных в таблицах (дата фреймах) – без злоупотребления циклом for.
- Различные типы графиков:
- Линейные графики**;
- Диаграммы рассеяния (scatterplots);
- Столбчатые диаграммы (bar charts);
- Гистограммы.
- Стилизация графиков – легенда, заголовок, подписи осей, оформление элементов графика.
**Дискретные данные (дни недели) плохо подходят для линейных графиков. Взгляните: здесь есть простор для ошибок в интерпретации. Столбчатая диаграмма подошла бы намного лучше.
Сравнение
Как уже отмечал в первом материале, программа Яндекс.Практикума ставит своей целью не только (и, вероятно, не столько) познакомить студентов с инструментами, используемыми аналитиком в повседневной работе, сколько с основами профессии. Первые 29 часов это подтверждают – DataCamp за 4 часа даёт больше вводной информации о языке Python, чем ознакомительный курс от Практикума, но практически ничего не сообщает о том, с чем работает «Аналитик данных на Пайтоне».
Стоит также сделать оговорку: все 29 часов Практикума доступны бесплатно, в то время как DataCamp предлагает для ознакомления только первую главу (~1 час).
В обоих введениях есть спорные решения – по крайней мере, на мой взгляд. Поэтому совет: вне зависимости от того, какую платформу выберете лично вы, оставайтесь критично настроенными по отношению к той информации, которую вам дают. Какими бы авторитетными ни казались источники.
P.S. к первому материалу – пара мыслей о сертификатах
В обеих программах обучающийся получит подтверждение прохождения курса в виде сертификата. DataCamp на них щедр – за каждый мини-курс, требующий на прохождение около 4-х часов, вы получите сертификат. Яндекс выдаст только один сертификат – за полное прохождение программы.
Важно понимать, что сертификат не является подтверждением ваших навыков. Это именно подтверждение прохождения курса – того, что вы готовы тратить своё время и деньги на обучение. Сертификаты не дают вам особого преимущества при приёме на работу, но могут быть рассмотрены HR’ом. Конечно, не нужно прикреплять к резюме каждый сертификат, полученный на DataCamp, особенно за совсем уж вводные курсы.
Будьте готовы к тому, чтобы подтвердить свои навыки. Стоит завести репозиторий на github и сделать несколько самостоятельных проектов, желательно – с публикацией результатов (это позволит ответственному менеджеру оценить не только код, но и то, как вы выражаете свои мысли). Обе рассматриваемые платформы также предлагают вам проекты – в случае с Практикумом, они обязательные и служат проверке усвоения вами навыков курса, на DataCamp – это отдельный функционал. Если самостоятельно находить идеи тяжело – обязательно воспользуйтесь этой функцией. И всегда помните, что сертификат – это лишь приятное дополнение к тому, что вы умеете, а не конечная цель обучения (если, конечно, у вас нет странной потребности в коллекционировании сертификатов).