Udemy
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
Development
Web Development Data Science Mobile Development Programming Languages Game Development Database Design & Development Software Testing Software Engineering Development Tools No-Code Development
Business
Entrepreneurship Communications Management Sales Business Strategy Operations Project Management Business Law Business Analytics & Intelligence Human Resources Industry E-Commerce Media Real Estate Other Business
Finance & Accounting
Accounting & Bookkeeping Compliance Cryptocurrency & Blockchain Economics Finance Finance Cert & Exam Prep Financial Modeling & Analysis Investing & Trading Money Management Tools Taxes Other Finance & Accounting
IT & Software
IT Certification Network & Security Hardware Operating Systems Other IT & Software
Office Productivity
Microsoft Apple Google SAP Oracle Other Office Productivity
Personal Development
Personal Transformation Personal Productivity Leadership Career Development Parenting & Relationships Happiness Esoteric Practices Religion & Spirituality Personal Brand Building Creativity Influence Self Esteem & Confidence Stress Management Memory & Study Skills Motivation Other Personal Development
Design
Web Design Graphic Design & Illustration Design Tools User Experience Design Game Design Design Thinking 3D & Animation Fashion Design Architectural Design Interior Design Other Design
Marketing
Digital Marketing Search Engine Optimization Social Media Marketing Branding Marketing Fundamentals Marketing Analytics & Automation Public Relations Advertising Video & Mobile Marketing Content Marketing Growth Hacking Affiliate Marketing Product Marketing Other Marketing
Lifestyle
Arts & Crafts Beauty & Makeup Esoteric Practices Food & Beverage Gaming Home Improvement Pet Care & Training Travel Other Lifestyle
Photography & Video
Digital Photography Photography Portrait Photography Photography Tools Commercial Photography Video Design Other Photography & Video
Health & Fitness
Fitness General Health Sports Nutrition Yoga Mental Health Dieting Self Defense Safety & First Aid Dance Meditation Other Health & Fitness
Music
Instruments Music Production Music Fundamentals Vocal Music Techniques Music Software Other Music
Teaching & Academics
Engineering Humanities Math Science Online Education Social Science Language Teacher Training Test Prep Other Teaching & Academics
AWS Certification Microsoft Certification AWS Certified Solutions Architect - Associate AWS Certified Cloud Practitioner CompTIA A+ Cisco CCNA Amazon AWS CompTIA Security+ AWS Certified Developer - Associate
Graphic Design Photoshop Adobe Illustrator Drawing Digital Painting InDesign Character Design Canva Figure Drawing
Life Coach Training Neuro-Linguistic Programming Mindfulness Personal Development Meditation Personal Transformation Life Purpose Coaching Neuroscience
Web Development JavaScript React CSS Angular PHP WordPress Node.Js Python
Google Flutter Android Development iOS Development Swift React Native Dart Programming Language Mobile Development Kotlin SwiftUI
Digital Marketing Google Ads (Adwords) Social Media Marketing Google Ads (AdWords) Certification Marketing Strategy Internet Marketing YouTube Marketing Email Marketing Retargeting
SQL Microsoft Power BI Tableau Business Analysis Business Intelligence MySQL Data Analysis Data Modeling Data Science
Business Fundamentals Entrepreneurship Fundamentals Business Strategy Online Business Business Plan Startup Freelancing Blogging Home Business
Unity Game Development Fundamentals Unreal Engine C# 3D Game Development C++ 2D Game Development Unreal Engine Blueprints Blender
2021-01-07 21:21:21
30-Day Money-Back Guarantee

This course includes:

  • 7 hours on-demand video
  • Full lifetime access
  • Access on mobile and TV
  • Assignments
Development Data Science Python

Машинное обучение: выделение факторов на Python

Выигрываем хакатон по выделению факторов: линейная регрессия, взаимная информация, PCA, ICA, NMF, MDS, t-SNE
New
Rating: 0.0 out of 50.0 (0 ratings)
1 student
Created by Центр digital-профессий ITtensive
Last updated 1/2021
Russian
30-Day Money-Back Guarantee

What you'll learn

  • Процесс и модель машинного обучения
  • Заполнение пропусков в данных
  • Линейная регрессия и L1/L2 регуляризация
  • Решающие деревья и ансамбли стекинга
  • Корреляция и взаимная информация
  • Метод главных компонент (PCA)
  • Сингулярное разложение (SVD)
  • Анализ независимых компонент (ICA)
  • Многомерное шкалирование (MDS)
  • t-SNE, UMAP, LargeVis

Course content

10 sections • 50 lectures • 6h 53m total length

  • Preview01:18
  • Preview09:45
  • Обучение без учителя
    01:38
  • Задачи машинного обучения
    3 questions

  • Модель и процесс машинного обучения
    07:41
  • Что такое ETL
    06:03
  • Процесс машинного обучения
    3 questions
  • Что такое EDA
    07:12
  • Подготовка данных
    13:00
  • Подготовка данных
    3 questions
  • Разбиение выборки
    09:47
  • Оптимизация гиперпараметров
    12:34
  • Недообучение и переобучение
    10:49
  • Смещение, разброс и ошибка данных
    10:25
  • Обучение модели
    3 questions

  • Метод максимального правдоподобия
    15:30
  • Метод наименьших квадратов
    05:47
  • Метод наименьших квадратов
    3 questions
  • Аппроксимация пропусков в данных
    05:43
  • Аппроксимация данных
    3 questions
  • Среднеквадратичная ошибка
    06:27
  • Метрики и расстояния
    08:06
  • Метрики и расстояния
    3 questions
  • Линейная регрессия и L1/L2-регуляризация
    13:55
  • Линейная регрессия
    3 questions
  • BIC и AIC
    05:15

  • Ансамблевые модели
    11:29
  • Дерево принятия решения
    10:14
  • Случайный лес
    06:06
  • Сверхслучайные деревья
    09:03
  • Ансамбль стекинга
    10:50

  • Линейная регрессия для понижения размерности
    13:12
  • Выделение факторов с помощью деревьев решений
    08:08
  • "Правило локтя" и GMM BIC
    10:16
  • Оберточные методы
    09:16
  • Взаимная информация
    08:33
  • Понижение размерности
    3 questions

  • Preview12:01
  • Заполнение пропусков экстраполяцией
    07:27
  • Согласованность данных
    06:18
  • Корреляция данных
    09:17
  • Важность признаков
    08:28
  • Ансамбль понижения размерности
    1 question

  • Метод главных компонент (PCA)
    04:12
  • Сингулярное разложение (SVD)
    12:45
  • Принцип максимума энтропии
    03:28
  • Анализ независимых компонент (ICA)
    05:54
  • Матричные методы понижения размерности
    3 questions

  • Метод главных компонент
    08:29
  • Сингулярное разложение
    03:50
  • Независимые компоненты
    05:35
  • Матричная факторизация
    05:38
  • Ансамбль матричных методов
    1 question

  • Многомерное шкалирование (MDS)
    06:16
  • Расстояние Кульбака-Лейблера
    05:35
  • t-SNE
    11:00
  • UMAP
    05:50
  • LargeVis
    05:35
  • Нелинейное понижение размерности
    3 questions

  • Многомерное шкалирование
    08:41
  • t-SNE
    06:32
  • UMAP
    06:08
  • Случайный ансамбль
    13:05
  • Выделение факторов и предсказание
    1 question

Requirements

  • Продвинутый Python
  • Основы математической статистики

Description

Мы разберем задачу хакатона 2020 года по выделению факторов, в наибольшей степени влияющих на продолжительность жизни в России, с точки зрения фундаментальных и прикладных подходов к понижению размерности данных. В заключении построим ансамбль моделей для предсказания продолжительности жизни, базируясь на выделенных факторах.

Курс разбит на 4 части. В первой части мы последовательно пройдем все этапы работы с данными: от видов задач и их постановки до работы с моделями машинного обучения для минимизации предсказательной ошибки. Дополнительно рассмотрим фундаментальные основы построения моделей машинного обучения, базовые метрики и наиболее простые модели - линейную регрессии, решающие деревья и случайный лес. А также ансамбли машинного обучения.

Во второй части на практике разберем:

  • Очистку и предобработку данных - ETL

  • Линейную регрессию для экстраполяции данных

  • Линейную регрессию с регуляризацией для выделения факторов

  • Информационные критерии понижения размерности

В заключении создадим ансамбль стекинга из простых моделей понижения размерности.

Третья часть посвящена матричным методам:

  • Метод главных компонент (PCA)

  • Сингулярное разложение (SVD)

  • Анализ независимых компонент (ICA)

  • Положительно-определенные матрицы (NMF)

Уточним решение задачи обучения без учителя через матричные методы.

В четвертой части рассмотрим нелинейные подходы:

  • Многомерное шкалирование (MDS).

  • t-SNE

  • UMAP

  • LargeVis

Стабилизируем ансамбль понижения размерности и используем его для предсказания продолжительности жизни в России, основываясь на наиболее важных макроэкономических показателях.

Who this course is for:

  • Аналитики Python, изучающие машинное обучение
  • Программисты больших данных
  • Исследователи больших данных

Instructor

Центр digital-профессий ITtensive
Технические специальности
Центр digital-профессий ITtensive
  • 4.0 Instructor Rating
  • 144 Reviews
  • 967 Students
  • 18 Courses

ITtensive - первый центр digital-профессий в России, обучающий техническим и маркетинговым специальностям: программированию, проектированию, тестированию, созданию и продвижению продуктов.

Возможно обучение как с нуля (включая изучения Основ программирования), так и уже на базе имеющихся навыков.

Программы курсов включают работу с PHP, Python, SQL, Git, сетевые технологии, машинное обучение и нейронные сети для решения прикладных задач.

Преподаватели центра:

Ведущий методист: Мациевский Николай, МФТИ (прикладная математика и физика). Специализируется на автоматизации и оптимизации процессов. Увлекается путешествиями и авангардизмом.

Методист по автоматизации: Мария Шугурова, МГУ и НИУ ВШЭ (бизнес-планирование). Помогает внедрять анализ данных в бизнес-процессы и извлекать дополнительную пользу из данных. Хобби: телерадио ведущая.

Методист по Python: Евгений Бойченко, НГУ (математика и компьютерные науки). Разрабатывает решения на Python для автоматизации прикладных задач. Нравится писать чат-ботов.

Методист по машинному обучению: Алена Селезнева, МГУ (прикладная математика и информатика). Использует модели машинного обучения для решения задач реального бизнеса. В свободное время поет и рисует миниатюры.

Победы в конкурсах и хакатонах:

Август 2020, финалист Digital Superhero Security, лучшее техническое решение детектирования DNS туннелей в трафике

Июнь 2020, 31 место (топ 5%) в международном хакатоне Prohack от McKinsey

Июнь 2020, 4 место в Цифровом Прорыве по задаче распознавания и предобработки неполного почтового адреса, самая высокая точность работы алгоритма

Май 2020, лучшее техническое решение по предсказанию ожидаемой продолжительности жизни, Digital Superhero

  • Udemy for Business
  • Teach on Udemy
  • Get the app
  • About us
  • Contact us
  • Careers
  • Blog
  • Help and Support
  • Affiliate
  • Terms
  • Privacy policy
  • Cookie settings
  • Sitemap
  • Featured courses
Udemy
© 2021 Udemy, Inc.