DataCamp vs. Яндекс.Практикум. Сравниваем вводные курсы

Сегодня продолжаем сравнивать DataCamp и Яндекс.Практикум: в этом материале коротко расскажу, чему учат на каждой из платформ в доступных бесплатно вводных курсах.

Яндекс.Практикум

Во введении (Основы Python и анализа данных) – 9 тем, с примерным временем освоения 29 часов. 9 тему вычёркиваем сразу – она сугубо продающая и рассказывает о том, как организована основная часть программы.

В оставшихся восьми темах студент:

  • Познакомится с интерфейсом программы (включая среду для написания и запуска кода);
  • Познакомится с функцией read_csv из библиотеки pandas;
  • Научится выводить данные на экран командой print();
  • Научится объявлять переменные;
  • Познакомится с двумя видами графиков из библиотеки seaborn: хитамапами (тепловыми картами) и столбчатыми диаграммами*;
*Если вы когда-либо сталкивались с задачами аналитики и презентации данных, то знаете, что цвет на графике – такой же элемент, как и сами значения, оси и др. Цвет функционален: он сообщает читателю о том, что на какой-то элемент нужно обратить внимание. К сожалению, авторы библиотеки seaborn по умолчанию используют цвет в столбчатых диаграммах совершенно неправильно, а именно – для красоты визуализации. В итоге графики выглядят так

Цвет здесь не то, что не функционален – он откровенно отвлекает за счёт того, что представлен градиентом, заставляет думать над вопросом «а что вообще показывает цвет на этом графике?». Это сбивает с толку и отвлекает. Запомните: цвет несёт смысловую нагрузку. Этому графику хватило бы одного цвета для всех столбцов.

Вернёмся к содержанию курса. Помимо перечисленного выше, студен также:

  • Научится читать ошибки интерпретатора Python;
  • Познакомится с базовыми типами данных: str, int, float, и – несколько позже – boolean;
  • Узнает, какие операции можно проводить с каждым типом данных и познакомится с логическими операторами;
  • Познакомится со списками в Python;
  • Познакомится с циклом for и условной конструкцией if – elif – else;
  • Научится уточнять задачи и формулировать гипотезы, требующие проверки; кроме того, познакомится со стандартным подходом к аналитическим задачам:
    • Постановка задачи;
    • Получение данных;
    • Предобработка данных;
    • Исследовательский анализ данных;
    • Подготовка прототипа решения;
    • Проверка результатов;
    • Доработка решения;
    • Оформление результатов;
    • Проверка реальностью.
  • Решит несколько кейсов, представленных в игровой форме.

Довольно большой набор, где технические навыки не доминируют – значительная часть из оценочных 29 часов посвящена именно обзору образа мышления аналитика и структуре стандартного аналитического проекта.

DataCamp

Курс – Introduction to Data Science in Python. Примерно 4 часа на освоение, 13 видео, 44 упражнения.

Курс охватывает следующие темы:

  • Импорт библиотек (включая aliases, пропущенные в Практикуме).
  • Переменные: правила объявления переменных, типы данных.
  • Функции и аргументы функций.
  • Обзор функционала библиотеки Pandas.
  • Методы head и info.
  • Фильтры данных в таблицах (дата фреймах) – без злоупотребления циклом for.
  • Различные типы графиков:
    • Линейные графики**;
    • Диаграммы рассеяния (scatterplots);
    • Столбчатые диаграммы (bar charts);
    • Гистограммы.
  • Стилизация графиков – легенда, заголовок, подписи осей, оформление элементов графика.
**Дискретные данные (дни недели) плохо подходят для линейных графиков. Взгляните: здесь есть простор для ошибок в интерпретации. Столбчатая диаграмма подошла бы намного лучше.

Сравнение

Как уже отмечал в первом материале, программа Яндекс.Практикума ставит своей целью не только (и, вероятно, не столько) познакомить студентов с инструментами, используемыми аналитиком в повседневной работе, сколько с основами профессии. Первые 29 часов это подтверждают – DataCamp за 4 часа даёт больше вводной информации о языке Python, чем ознакомительный курс от Практикума, но практически ничего не сообщает о том, с чем работает «Аналитик данных на Пайтоне».

Стоит также сделать оговорку: все 29 часов Практикума доступны бесплатно, в то время как DataCamp предлагает для ознакомления только первую главу (~1 час).

В обоих введениях есть спорные решения – по крайней мере, на мой взгляд. Поэтому совет: вне зависимости от того, какую платформу выберете лично вы, оставайтесь критично настроенными по отношению к той информации, которую вам дают. Какими бы авторитетными ни казались источники.

P.S. к первому материалу – пара мыслей о сертификатах

В обеих программах обучающийся получит подтверждение прохождения курса в виде сертификата. DataCamp на них щедр – за каждый мини-курс, требующий на прохождение около 4-х часов, вы получите сертификат. Яндекс выдаст только один сертификат – за полное прохождение программы.

Важно понимать, что сертификат не является подтверждением ваших навыков. Это именно подтверждение прохождения курса – того, что вы готовы тратить своё время и деньги на обучение. Сертификаты не дают вам особого преимущества при приёме на работу, но могут быть рассмотрены HR’ом. Конечно, не нужно прикреплять к резюме каждый сертификат, полученный на DataCamp, особенно за совсем уж вводные курсы.

Будьте готовы к тому, чтобы подтвердить свои навыки. Стоит завести репозиторий на github и сделать несколько самостоятельных проектов, желательно – с публикацией результатов (это позволит ответственному менеджеру оценить не только код, но и то, как вы выражаете свои мысли). Обе рассматриваемые платформы также предлагают вам проекты – в случае с Практикумом, они обязательные и служат проверке усвоения вами навыков курса, на DataCamp – это отдельный функционал. Если самостоятельно находить идеи тяжело – обязательно воспользуйтесь этой функцией. И всегда помните, что сертификат – это лишь приятное дополнение к тому, что вы умеете, а не конечная цель обучения (если, конечно, у вас нет странной потребности в коллекционировании сертификатов).