Школы

Рейтинг на основе отзывов, авторитетности и популярности

Подборки

Полезные и актуальные курсы, отобранные вручную

Основы Pandas для начинающих

Сложность
Сложность
Начинающий
Тип обучения
Тип обучения
Курс
Сертификат
Сертификат
Есть

Стоимость курса

990 ₽
Нет рассрочки

Цель курса - не просто рассказать, а научить вас работе с библиотеками Numpy и Pandas.

За кадром сидит не скучный лектор, а специалист по анализу данных, который каждый день работает с этими библиотеками. В формате живого общения (автор как-бы общается с вами через камеру) мы будем учиться работать в Pandas.  

Мы ставим цель научить вас вещам, которые обязательно будут на вашем пути:

  • основы Numpy
  • основы Pandas: структуры данных, базовый функционал, описательная статистика
  • Pandas в действии: взаимодействие с источниками данных; чистка данных и предобработка; сведение данных из разных источников; визуализация данных; агрегация; time series;

Что вы получите после обучения

Навыки
1
Основы Numpy
2
Основы Pandas
3
Работа с источниками данных
4
Чистка и подготовка данных к анализу
5
Объединение данных и преобразование формы

Школа

Stepik — образовательная платформа и конструктор онлайн-курсов.

Мы разрабатываем алгоритмы адаптивного обучения, сотрудничаем с авторами MOOC, помогаем в проведении олимпиад и программ переподготовки.

Наша цель — сделать образование открытым и удобным.

Stepik — широко известная российская образовательная платформа, основанная в 2013 году. На Stepik зарегистрировано более миллиона пользователей из России и стран СНГ. В настоящее время на Stepik представлены несколько тысяч учебных курсов на самые разные темы.

Платформа Stepik включает в себя конструктор бесплатных занятий и уроков. Создать интерактивный обучающий курс может любой зарегистрированный пользователь. При этом авторы обучающих материалов сохраняют авторские права. Сервис не имеет ограничений по числу обучающихся на курсе.

Stepik имеет обширные возможности по созданию онлайн-курсов, обучающих занятий и уроков с использованием текстов, видео, картинок, тестовых задач, в процессе выполнения которых можно вести обсуждения с остальными обучающимися, а также с преподавателем. Всего в Stepik присутствует 20 типов заданий, проверка которых может осуществляться как в автоматическом, так и в ручном режиме.

Большим преимуществом данной платформы является возможность встраивать созданные материалы на сторонние сайты, например, Moodle и Canvas.

Кроме того, Stepik может использоваться в качестве площадки для проведения разнообразных мероприятий, таких как олимпиады и конкурсы.

Интерфейс платформы полностью русскоязычный, достаточно дружественный и интуитивно понятный. Платформа полностью бесплатна.

За каждый пройденный курс в Stepik обучающийся получает сертификат о прохождении. Получение сертификата также бесплатно.

Преподаватели

Работаю аналитиком данных в Центре налоговых доходов (Правительство города Москвы) Проходил обучение в аспирантуре Института космических исследований РАН.

Программа курса

О курсе
1. Информация
Основы Numpy
1. Зачем при изучении Pandas нужен Numpy? 
2. Практика: shape, dtype, ndim, zeros, ones, arange 
3. Типы данных и их преобразование, арифметика, доступ к элементам 
4. Практика: арифметика, преобразование типов, доступ к элементам
5. Двумерные и трехмерные массивы. Учимся применять индексы 
6. Практика: закрепляем работу с индексами 
7. Маска и слайсинг вместе, прихотливая индексация, а еще reshape 
8. Практика: учимся изменять форму массива 
9. Еще о reshape, транспонирование, унарные и бинарные функции 
10. Практика: закрепляем знания про унарные и бинарные функции 
11. Логические функции и функция в функции, а еще where и статистика 
12. Практика: доводим до мастерства работу с полезными функциями 
13. Функции any, all, sort, unique, in1d. Обзор линейной алгебры 
14. Функции permutation и shuffle. Сохранение массива в файл 
Введение в Pandas
1. Первое знакомство с Series 
2. Практика: проверяем свои знания о серии 
3. Поподробнее про серии: идексы, сложение, проверка на NaN 
4. Практика: тонкости при работе с сериями 
5. Первое знакомство с DataFrame 
6. Поподробнее про DataFrame: индексы, вложенные словари, del и .T 
7. Практика: особенности индексации 
8. Функции reindex, drop и индексация в датафрейме 
9. Практика: вытягиваем нужное, удаляем ненужное 
10. Операторы loc, iloc, at, iat. Сложение нескольких датафреймов 
11. Сложение датафреймов, сортировки, арифметика с пропусками 
12. Описательные статистики. Уникальные значения 
13. Контрольная работа 
14. Контрольная работа (продолжение) 
Pandas: работа с источниками данных
1. Что такое формат CSV и как его приручить?
2. Поподробнее про обработку пропусков 
3. Учимся читать большие файлы кусочками 
4. Кто такой JSON и как с ним подружиться? 
5. Знакомимся с форматами HTML, XML, PICKLE, HDF5 
6. Старый добрый Excel и немного про базы данных
Pandas: чистка и подготовка данных к анализу
1. Учимся обрабатывать пропуски 
2. Проверяем данные на дубликаты и избавляемся от них 
3. Про замену значений и дискретизацию 
4. Определяем выбросы и грамотно устраняем их 
5. Создаём матрицы фиктивных переменных 
6. Работа со строками - проще чем кажется!
Pandas: объединение данных и преобразование формы
1. Знакомство с иерархической индексацией
2. Действия с мультииндексами в датафреймах
3. Учимся соединять датафреймы с помощью merge
4. Аналог merge; конкатенация датафреймов через concat
5. Комбинирование данных и преобразование формы

Рейтинг курса

4
Может быть интересно
Основы Pandas для начинающих
На сайт курса

Основы Pandas для начинающих