Модуль 1. Ввод/вывод данных (4 ак. ч.)
- Ввод/вывод данный в текстовый файл
- Работа с файлами Excel
- Чтение и запись таблиц баз данных
Практика: Работа с СУБД MSSQL
Модуль 2. Генерация отчётов – R Markdown (4 ак. ч.)
- Введение в R Markdown
- Основы синтаксиса
- Включение кода на R в отчёт
- Использование фигур/графиков и таблиц в отчёте
- Создание параметризованных отчётов
Практика: Создание отчёта R Markdown на примере задачи регрессионного анализа данных
ДЗ: Создать отчёт по анализу данных из набора ggplot2::diamonds
Модуль 3. Визуализация данных – библиотека ggplot2 (8 ак. ч.)
- Введение в многоуровневую визуализацию данных (Layered Grammar)
- Использование атрибутов (координат X, Y, цвета, размера и формы) для создания пятимерных графиков
- Виды графиков: распределения, гистограммы, круговые диаграммы, временные ряды и т.д.
- Уровни (Layers) их задание и настройка в ggplot2
- Задание масштабов, координатных осей и легенды
- Группировка и разбиение данных на подмножества при визуализации (Facetting)
- Создание интерактивных графиков
Практика: Использование библиотеки ggplot2 и ggvis для анализа и визуализации данных
ДЗ: Создать графический отчёт по анализу данных из набора ggplot2::diamonds
Модуль 4. Интерактивная работа с данными – Shiny App (8 ак. ч.)
- Обзор архитектуры Web Shiny приложения
- Элементы пользовательского ввода-вывода
- Управление внешним видом страницы
- Реактивное программирование и его поддержка в Shiny
- Интерактивная графика
- Реализация обратной связи с пользователем (user feedback)
- Отладка Shiny приложений
Практика: Создание Web Shiny приложения на примере задачи построения классификатора
ДЗ: Создать Web Shiny приложение для анализа данных из набора ggplot2::diamonds