Машинное
обучение
Получите прикладной опыт разработки
Machine Learning-проектов: от сбора данных
до построения моделей и их оптимизации.
Формат:
Длительность:
Старт:
Онлайн
5 месяцев
6 сентября
Почему стоит изучить машинное обучение?
За два года спрос на Data Scientist-ов вырос в два раза*. С помощью методов машинного обучения они строят прогнозы и повышают эффективность бизнес-процессов в любой отрасли. Получите востребованную профессию и зарабатывайте
от 100 000 рублей в месяц.
Более 600 вакансий на HeadHunter
Зарплата от 100 до 200 тыс. руб. / мес.
Работа в сферах от IT до ритейла
*по данным
HeadHunter
Что полезного в курсе?
Много практики
Вы решите пять проектных задач с применением ML: предсказание цены на недвижимость, модель кредитного скоринга и другие.
Живые занятия
В курсе 90% вебинаров с преподавателями: вы сможете задать любые вопросы по теме и получить обратную связь.
Материалы
После занятий у вас останутся записи, методические материалы и готовый код, доступные в любое время.
Удостоверение
Мы проводим обучение на основании лицензии
№ 040485. Вы получите удостоверение о повышении квалификации, подтверждающее полученные знания.
Кому точно
стоит участвовать
Начинающим Data Scientist-ам
Систематизируете и углубите знания, пообщаетесь с экспертами и пополните резюме практическими проектами
Аналитикам
Сможете не ограничиваться базовой аналитикой и внедрять модели Machine Learning, прогнозирующие различные показатели
Разработчикам
Перейдете в сферу Data Science, повысите уровень дохода и будете решать интересные задачи
Математикам
Примените знания к новым задачам и освоите востребованную профессию
Программа
30+ онлайн-уроков, более 65 часов обучающего контента и практика после каждого занятия
Теория вероятностей и математическая статистика
  • Случайные события. Условная вероятность. Формула Байеса. Независимые испытания

  • Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона

  • Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных

  • Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема

  • Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование

  • Взаимосвязь величин. Параметрические и непараметрические показатели корреляции. Корреляционный анализ

  • Многомерный статистический анализ. Линейная регрессия

  • Дисперсионный анализ. Логистическая регрессия

Курсовой проект

Разведочный анализ данных (EDA) на основе выбранного датасета: визуализация, корреляционный, дисперсионный и факторный анализ
Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
  • Введение в курс. Вебинар

  • Вычисления с помощью Numpy. Работа с данными в Pandas. Видеоурок

  • Вычисления с помощью Numpy. Работа с данными в Pandas. Вебинар

  • Визуализация данных в Matplotlib. Видеоурок

  • Визуализация данных в Matplotlib. Вебинар

  • Обучение с учителем в Scikit-learn. Видеоурок

  • Обучение с учителем в Scikit-learn. Вебинар

  • Обучение без учителя в Scikit-learn. Видеоурок

  • Обучение без учителя в Scikit-learn и введение в итоговый проект. Вебинар

  • Консультация по итоговому проекту. Вебинар

Курсовой проект

Соревнование на платформе Kaggle по предсказанию цены на недвижимость, решение задачи регрессии
Библиотеки Python для Data Science: продолжение
  • Введение в задачу классификации. Постановка задачи и подготовка данных

  • Анализ данных и проверка статистических гипотез

  • Построение модели классификации

  • Оценка и интерпретация полученной модели. Обсуждение курсового проекта

Курсовой проект

Соревнование на платформе Kaggle по кредитному скорингу, решение задачи классификации
Алгоритмы анализа данных
  • Алгоритм линейной регрессии. Градиентный спуск

  • Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск

  • Логистическая регрессия. Log Loss

  • Алгоритм построения дерева решений

  • Случайный лес

  • Градиентный бустинг (AdaBoost)

  • Классификация с помощью KNN. Кластеризация K-means

  • Снижение размерности данных

Курсовой проект

Участие в одном или двух соревнованиях на Kaggle: предсказать средний балл на экзамене по математике, который получают ученики репетиторов (задача регрессии); предсказать, подойдет ли репетитор для подготовки к экзамену по математике (задача классификации)
Системы машинного обучения в Production
  • Введение в задачу предсказания оттока. Формализация задачи и сбор сырых данных

  • Загрузка данных и построение обучающей выборки. Анализ и предобработка датасета. Балансировка классов

  • Выбор и обучение модели на отобранных признаках. Сравнение качества и оценка модели

  • Оценка потенциального влияния на бизнес. Масштабирование решения

  • Подготовка к продакшену. Планировщик задач и перенос проекта из Jupyter в PyCharm

Курсовой проект

Оценка потенциального влияния на бизнес ML-решения, построение модели оттока клиентов в игровых проектах и подготовка кода для Production в PyCharm
Для успешного освоения программы потребуются знания Python и SQL
Новичок в анализе данных?

Рекомендуем обучение на Факультете Искусственного интеллекта Geek University c гарантированным трудоустройством


Преподаватели
Отправляя заявку, вы принимаете условия договора-оферты и даете согласие на обработку своих персональных данных в соответствии с политикой конфиденциальности.
80 000 ₽
48 000 ₽ (- 40%)
Старт — 6 сентября
Записаться на курс и получить бесплатную карьерную консультацию
%

Стоимость обучения
Рассрочка без первого взноса и переплат
Скидка 40%
для первых 20 студентов
4000 ₽
/ месяц
Одним платежом
Скидка действует до 31 августа
Вы можете вернуть 13% стоимости через налоговый вычет. Оставьте заявку и спросите об этом менеджера.
Сэкономьте еще 13%
Часто задаваемые вопросы
Как проходит обучение?
Занятия пройдут в формате онлайн-трансляций в вечернее время по Москве, с перерывами. Преподаватель объясняет темы, все его действия отображаются на экране. Студенты задают вопросы и обсуждают материал в чате.
    Что делать, если я пропустил online-трансляцию?
    Для тех, кто не смог вовремя присутствовать на занятии, мы записываем каждое занятие. Видеозаписи всегда доступны в разделе обучения.
      Какие знания необходимы для прохождения курса?
      Для успешного освоения программы потребуются знания:
      Python: базовый синтаксис (циклы, ветвления, функции, списки, кортежи, словари, строки, файлы, модули, классы, генераторы, декораторы); базовое понимание парадигмы ООП
      SQL: основы проектирования базы данных (нормальные формы, первичный ключ, отношения); базовые SQL - команды (CREATE, INSERT, SELECT, DISTINCT, ORDER BY, LIMIT, DELETE и UPDATE); сложные запросы (JOIN, UNION); агрегирующие функции; индексы; транзакции
      Какие минимальные требования к оборудованию и программному обеспечению?
      Anaconda для Python 3.7 и выше.
      Операционная система: Windows 7 или новее, 64-битная macOS 10.10+ или Linux, включая Ubuntu, RedHat, CentOS 6+ и другие.
      Архитектура системы: Windows - 64-битная x86, 32-битная x86; MacOS - 64-битная x86; Linux - 64-битная x86, 64-битная Power8 / Power9.
      RAM: 3+ GB; CPU: 2+ cores


      Как я могу вернуть 13% стоимости через налоговый вычет?
      Подробности о возврате 13% стоимости через налоговый вычет вы можете прочитать в этой статье или узнать подробности у нашего менеджера.