Python для работы с данными
После курса вы сможете автоматизировать свою рутинную работу в Python и научитесь обрабатывать большие объемы информации без администрирования и баз данных.
Освойте основной инструмент в мире аналитики и машинного обучения.
Преподаватели

Руководитель бюро планирования и управления в АО "НПО автоматики"

Аналитик-разработчик "Яндекс".

Старший аналитик-моделист Bi.zone, эксперт по кибербезопасности.

Специалист по анализу данных ОЦРВ.
Содержание курса
- Вводные видео-уроки по установке, синтаксису и функциям Python;
- Основы Python и Git;
- Базовые типы данных и циклы;
- Функции и классы;
- Продвинутые типы данных: массивы, множества, словари.
- numpy и scipy;
- pandas;
- Визуализация данных: seaborn, plotly, matplotlib;
- Получение данных с внешних сайтов и API;
- Data mining и парсинг.
Статистика в Python (10 часов теории и 20 часов практики)
- Основы описательной статистики, виды распределений в Python;
- Центральная предельная теорема и статистический анализ данных в Python;
- Основные статистические тесты и проверка гипотез;
- Кейс-стади. Статистические показатели в Python.
Feature engineering и предобработка данных (18 часов теории и 25 часов практики)
- Проверка и очистка данных с помощью pandas и numpyПроведение анализа и рекурсивного feature selection и на базе моделей;
- Методы оценки значимости и отбора признаков и их использование;
- «Проклятие размерности», основные алгоритмы и принципы их работы;
- Использование алгоритмов sklearn.
Лабораторные работы (10 часов практики)
- С помощью статистики изучите данные небольшого датасета на 200+ автомобилей по 26 параметрам, с помощью визуализаций выведете закономерности и протестируете несколько статистических гипотез.
- Вместе с преподавателем подготовите датасет на 1500 строк к анализу, оцените и выберете из 80 признаков нужные и спрогнозируете стоимостную категорию дома.
Диплом (20 часов практики)
В рамках дипломного проекта вы будете работать с датасетом на медицинскую тематику. Вы не только самостоятельно подготовите данные для анализа в Python, но и напишете алгоритм, который предсказывает вероятность болезни у пациента по разным признакам.
Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
Кому подойдет данный курс
- Разработчикам;
- Продакт-менеджерам;
- Аналитикам.
Приобретенные навыки
Вы научитесь работать со следующими инструментами:
- pandas;
- SkLearn;
- matplotlib;
- Seaborn;
- Git.
В результате обучения вы освоите профессию аналитика Python и сможете устроиться в одну из ведущих компаний (Рамблер, Mail.ru Group, Kaspersky и др.)