Python для работы с данными
-10%

Python для работы с данными

После курса вы сможете автоматизировать свою рутинную работу в Python и научитесь обрабатывать большие объемы информации без администрирования и баз данных.

Освойте основной инструмент в мире аналитики и машинного обучения.

Организатор
Университет интернет‑профессий «Нетология»

Преподаватели

Олег Булыгин
Олег Булыгин
Руководитель бюро планиров
Константин Башевой
Константин Башевой
Аналитик-разработчик "Янде
Константин Гусев
Константин Гусев
Старший аналитик-моделист B
Юстина Иванова
Юстина Иванова
Специалист по анализу данн
Уровень
Средний
Длительность
3 месяца
Дата начала
7 октября 2020
Документ
Удостоверение о повышении квалификации
Стоимость
29 250 ₽ 45 000 ₽
45 000 ₽
29 250 ₽

Содержание курса

Основы Python для работы с данными (8 часов теории и 10 часов практики)

  • Вводные видео-уроки по установке, синтаксису и функциям Python;
  • Основы Python и Git;
  • Базовые типы данных и циклы;
  • Функции и классы;
  • Продвинутые типы данных: массивы, множества, словари.
Знакомство с основными библиотеками для анализа данных (14 часов теории и 20 часов практики)

  • numpy и scipy;
  • pandas;
  • Визуализация данных: seaborn, plotly, matplotlib;
  • Получение данных с внешних сайтов и API;
  • Data mining и парсинг.

Статистика в Python (10 часов теории и 20 часов практики)

  • Основы описательной статистики, виды распределений в Python;
  • Центральная предельная теорема и статистический анализ данных в Python;
  • Основные статистические тесты и проверка гипотез;
  • Кейс-стади. Статистические показатели в Python.

Feature engineering и предобработка данных (18 часов теории и 25 часов практики)

  • Проверка и очистка данных с помощью pandas и numpyПроведение анализа и рекурсивного feature selection и на базе моделей;
  • Методы оценки значимости и отбора признаков и их использование;
  • «Проклятие размерности», основные алгоритмы и принципы их работы;
  • Использование алгоритмов sklearn.

Лабораторные работы (10 часов практики)

  • С помощью статистики изучите данные небольшого датасета на 200+ автомобилей по 26 параметрам, с помощью визуализаций выведете закономерности и протестируете несколько статистических гипотез.
  • Вместе с преподавателем подготовите датасет на 1500 строк к анализу, оцените и выберете из 80 признаков нужные и спрогнозируете стоимостную категорию дома.

Диплом (20 часов практики)

В рамках дипломного проекта вы будете работать с датасетом на медицинскую тематику. Вы не только самостоятельно подготовите данные для анализа в Python, но и напишете алгоритм, который предсказывает вероятность болезни у пациента по разным признакам.

Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

Кому подойдет данный курс

  • Разработчикам;
  • Продакт-менеджерам;
  • Аналитикам.

Приобретенные навыки

Вы научитесь работать со следующими инструментами:

  • pandas;
  • SkLearn;
  • matplotlib;
  • Seaborn;
  • Git.

В результате обучения вы освоите профессию аналитика Python и сможете устроиться в одну из ведущих компаний (Рамблер, Mail.ru Group, Kaspersky и др.)

Узнать больше о курсе
Python для работы с данными школа Нетология
Уровень
Средний
Длительность
3 месяца
Дата начала
7 октября 2020
Документ
Удостоверение о повышении квалификации
45 000 ₽
29 250 ₽

Вам могут понравиться

Похожие курсы