1. Библиотеки языка программирования Python.
Основные назначения и функции библиотек;
Виды библиотек для анализа данных: Pandas, Numpy, Statsmodels, Sklearn, Seabourne;
Виды библиотек для визуализации данных;
2. Типы и структуры данных в Python.
Разновидности типов данных: Integer, float, bool, srting, object;
Разновидности структур данных: Dataframe, series, массив, кортежи, списки и др.;
3. Загрузка данных в программу и предварительный анализ.
Загрузка данных разного формата (xlsx, csv, html и др.);
Выявления количества строк и колонок;
Выявление пропущенных значений;
Выявление типов данных в матрице;
4. Функции Python для анализа данных.
Функции для получения описательной статистики (нахождение max, min, среднее, медианное значение, квартили);
Функции для визуализации плотности распределения данных(Нормальное Гауссово распределение);
Функции для создания бинарных переменных (dummies var);
Функции алгоритмов машинного обучения для построения моделей( Метод наименьших квадрат, метод опорных векторов, случайных лес, логистическая регрессия, временные ряды);
5. Построение регрессионных моделей.
Цель построения линейных регрессий по методу МНК;
Выдвижение гипотез и постановка задачи (на основе рабочих данных);
Построение регрессионной модели в Python;
Оценка значимости полученных коэфф и модели в целом(t-статистика, F-статистика);
Оценка качества модели (R2);
Проверка предпосылок Гаусса-Маркова;
Интерпретация полученных результатов;
6. Построение моделей классификации.
Алгоритм Random Forest;
Логистическая регрессия;
Метод опорных векторов;