Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
Машинное обучение: из грязи в Kaggle-князи
Rating: 4.4 out of 5(113 ratings)
798 students

Машинное обучение: из грязи в Kaggle-князи

Регрессия, классификация, ансамбли и глубокие нейросети
Last updated 6/2021
Russian

What you'll learn

  • Процесс и модели машинного обучения
  • Ансамбли бэггинга, бустинга, стекинга
  • Обучение с учителем: 3 больших задачи Kaggle-соревнований
  • Линейная и нелинейная регрессия
  • Кластеризация и классификация
  • Регрессия и предсказание данных
  • Распознавание и сегментация изображений

Course content

22 sections121 lectures21h 32m total length
  • Задачи машинного обучения9:51

    Разберем, что такое машинное обучение, и посмотрим на его задачи

  • Задачи машинного обучения
  • Модель и процесс машинного обучения7:47

    Разберем, как получается финальный результат машинного обучения

  • Что такое ETL6:09

    Разберем вопросы обогащения, очистки и загрузки данных

  • Процесс машинного обучения
  • Что такое EDA7:18

    Разберем, зачем нужен разведочный анализ данных

  • Подготовка данных13:06

    Разберем нормирование данных

  • Подготовка данных
  • Разбиение выборки9:53

    Посмотрим, зачем нужно разделять выборку, и как это делать

  • Оптимизация гиперпараметров12:40

    Разберем обучение модели и оптимизацию гиперпараметров

  • Латинский квадрат (гиперкуб)7:20
  • Оптимизация гиперпараметров через Парзеновские деревья11:33
  • Недообучение и переобучение10:55

    Разберем оптимальное качество обучения модели

  • Смещение, разброс и ошибка данных10:25
  • Обучение модели
  • Использование HDF6:53

    Разберем, как работает экспорт и импорт данных в задачах машинного обучения

Requirements

  • Основы машинного обучения
  • Основы математической статистики
  • Продвинутый Python

Description

Внимание: для доступа к курсам ITtensive на Udemy напишите, пожалуйста, на support@ittensive.com с названием курса или группы курсов, которые хотите пройти.


Большой практический курс по всем аспектам машинного обучения на Python в решении задач соревнования Kaggle. Курс состоит из 4 больших частей:

Введение в машинное обучение

Последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную и логистическую регрессии.

Регрессия и предсказание данных

Рассмотрим базовые линейные модели и все практические аспекты применения линейной регрессии для предсказания числовых показателей энергопотребления ASHRAE.

  • Особенности процесса анализа данных (ETL): загрузка, очистка, объединение наборов данных с pandas.

  • Проведение исследовательского анализа данных для поиска зависимостей: EDA.

  • Использование sklearn для линейной регрессии.

  • Интерполяция и экстраполяция данных.

  • Расчет метрики качества RMSLE для моделей линейной регрессии.

  • Оптимизация линейной регрессии: выбор наилучших параметров и гиперпараметров.

  • Оптимизация потребления памяти при работе с большими данными.

  • Запасные модели линейной регрессии.

  • Ансамбли линейной регрессии для уточнения предсказания.

  • Экспорт и импорт данных, включая промежуточные.

Классификация и ансамбли

Разберем метрики и модели классификации, а затем отработаем прикладные подходы к классификации данных с помощью моделей и ансамблей машинного обучения для страхового скоринга Prudential.

  • Метрики классификации: точность, полнота, F1, квадратичная каппа и матрица неточностей.

  • Очистка данных и оптимизация потребления памяти.

  • Кластеризация данных и метод ближайших соседей.

  • Простая и иерархическая логистическая регрессия.

  • Метод ближайших соседей и поиск оптимальной модели.

  • Метод опорных векторов: SVM.

  • Дерево принятия решения и случайный лес (бэггинг).

  • XGBoost и градиентный бустинг.

  • LightGBM и CatBoost

  • Ансамбль стекинга для голосования и выбора лучшего результата.

Нейросети и глубокое обучение

Разберем сегментацию и классификацию изображений облаков с помощью сверточных, пирамидальных, остаточных и полносвязных нейронных сетей.

  • Метрики точности: оценка F1 и коэффициент Дайса.

  • Очистка данных и обработка изображений.

  • Загрузка и сохранение моделей и данных в HDF5.

  • Двухслойный и многослойный перцептрон.

  • Нейросети со сверточными слоями и слоями подвыборки.

  • Функции активации, инициализация и оптимизаторы нейросетей.

  • Преобразование и дополнение (аугментация) бинарных данных.

  • LeNet, AlexNet, GoogLeNet.

  • VGG, Inception, ResNet, DenseNet.

  • Сегментация изображений с MobileNet, Unet, PSPNet и FPN.

  • Ансамбль нейросетей.

Who this course is for:

  • Аналитики Python, изучающие машинное обучение
  • Программисты больших данных
  • Исследователи больших данных