Python для работы с данными
 
-30%

Python для работы с данными

После курса вы сможете автоматизировать свою рутинную работу в Python и научитесь обрабатывать большие объемы информации без администрирования и баз данных.

Освойте основной инструмент в мире аналитики и машинного обучения.

Организатор
Университет интернет‑профессий «Нетология»

Преподаватели

Олег Булыгин
Олег Булыгин

Руководитель бюро планирования и управления в АО "НПО автоматики"

Константин Башевой
Константин Башевой

Аналитик-разработчик "Яндекс".

Константин Гусев
Константин Гусев

Старший аналитик-моделист Bi.zone, эксперт по кибербезопасности.

Юстина Иванова
Юстина Иванова

Специалист по анализу данных ОЦРВ.

Уровень
Средний
Длительность
3 месяца
Дата начала
22 января 2021
Документ
Удостоверение о повышении квалификации
Стоимость
56 940 ₽ 94 900 ₽
94 900 ₽
56 940 ₽

Содержание курса

Основы Python для работы с данными (8 часов теории и 10 часов практики)

  • Вводные видео-уроки по установке, синтаксису и функциям Python;
  • Основы Python и Git;
  • Базовые типы данных и циклы;
  • Функции и классы;
  • Продвинутые типы данных: массивы, множества, словари.
Знакомство с основными библиотеками для анализа данных (14 часов теории и 20 часов практики)

  • numpy и scipy;
  • pandas;
  • Визуализация данных: seaborn, plotly, matplotlib;
  • Получение данных с внешних сайтов и API;
  • Data mining и парсинг.

Статистика в Python (10 часов теории и 20 часов практики)

  • Основы описательной статистики, виды распределений в Python;
  • Центральная предельная теорема и статистический анализ данных в Python;
  • Основные статистические тесты и проверка гипотез;
  • Кейс-стади. Статистические показатели в Python.

Feature engineering и предобработка данных (18 часов теории и 25 часов практики)

  • Проверка и очистка данных с помощью pandas и numpyПроведение анализа и рекурсивного feature selection и на базе моделей;
  • Методы оценки значимости и отбора признаков и их использование;
  • «Проклятие размерности», основные алгоритмы и принципы их работы;
  • Использование алгоритмов sklearn.

Лабораторные работы (10 часов практики)

  • С помощью статистики изучите данные небольшого датасета на 200+ автомобилей по 26 параметрам, с помощью визуализаций выведете закономерности и протестируете несколько статистических гипотез.
  • Вместе с преподавателем подготовите датасет на 1500 строк к анализу, оцените и выберете из 80 признаков нужные и спрогнозируете стоимостную категорию дома.

Диплом (20 часов практики)

В рамках дипломного проекта вы будете работать с датасетом на медицинскую тематику. Вы не только самостоятельно подготовите данные для анализа в Python, но и напишете алгоритм, который предсказывает вероятность болезни у пациента по разным признакам.

Дипломная работа выполняется самостоятельно под руководством экспертов курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.

Кому подойдет данный курс

  • Разработчикам;
  • Продакт-менеджерам;
  • Аналитикам.

Приобретенные навыки

Вы научитесь работать со следующими инструментами:

  • pandas;
  • SkLearn;
  • matplotlib;
  • Seaborn;
  • Git.

В результате обучения вы освоите профессию аналитика Python и сможете устроиться в одну из ведущих компаний (Рамблер, Mail.ru Group, Kaspersky и др.)

Узнать больше о курсе
Python для работы с данными школа Нетология
Уровень
Средний
Длительность
3 месяца
Дата начала
22 января 2021
Документ
Удостоверение о повышении квалификации
94 900 ₽
56 940 ₽

Вам могут понравиться

Похожие курсы