Машинное зрение: локализация объектов на Python
What you'll learn
- Графические фильтры и операторы
- Детектор границ Канни
- Контуры и ориентация изображения
- Направляющие и эллипсы Хафа
- Примитивы и каскады Хаара
- Локальные бинарные шаблоны
- Направленные градиенты
- Дескрипторы ключевых точек
- SIFT и SURF
- ORB, FAST, BRIEF
- Панорамное изображение
- Моменты изображения
- Глубокие нейросети
- YOLO
- Mask R-CNN
- MobileNet-SSD
- Сегментационные нейросети
Requirements
- Уверенное владение Python
- Знакомство с методами машинного обучения
Description
Внимание: для доступа к курсам ITtensive на Udemy напишите, пожалуйста, на support@ittensive.com с названием курса или группы курсов, которые хотите пройти.
Второй курс из серии Машинное зрение посвящен локализации объекта на изображениях с помощью OpenCV на Python. Для работа по курсу необходимо установить модули numpy pandas sklearn keras tensorflow pillow opencv-python opencv-contrib-python scikit-image cmake face_recognition mrcnn.
Курс состоит из 4 больших частей:
Выделение форм
Разберем базовые подходы к фильтрации изображений и освоим авто-поворот изображений:
Графические фильтры: четкость, размытие, наращивание и эрозия.
Восстановление резкости: адаптивные гистограммы, Ричардсон-Люси, маска нечеткости и устранение шума.
Выделение границ по Собелю, Щару и Канни.
Сбор контуров из границ, ограничивающие прямоугольники и поворот изображения.
Преобразования Хафа и выделение окружностей.
В заключении соберем простой сканер штрих-кодов на изображении.
Выделение объектов
Применим общие подходы к обнаружению различных форм на изображении на примере человеческих лиц.
Примитивы Хаара и каскады Виолы-Джонса.
Гистограммы направленных градиентов.
Глубокие нейросети.
Локальные бинарные шаблоны гистограмм.
Для закрепления материала обнаружим лица на фотографиях и распознаем их.
Выделение признаков
Используем дескрипторы ключевых точек для масштабно-инвариантных преобразований.
SIFT и SURF.
ORB, FAST и BRIEF.
Моменты изображения.
Трехмерная трансформация и повороты.
Объединение изображений в панораму.
Объединим несколько изображений в панораму, используя ключевые точки.
Сегментация изображений
В заключении разберем нейросетевые подходы для локализации классов объектов на изображении.
YOLO: You Only Look Once.
Mask R-CNN: Regions CNN.
MobileNet-SSD: Single Shot Detection.
Сегментационные нейросети.
В качестве курсового проекта обработаем набор реальных фотографий для подготовки их к задаче распознавания или классификации.
Who this course is for:
- Разработчики систем машинного зрения
- Инженеры по работе с графическими данными
- Научные работники и исследователи данных
Instructor
ITtensive - первый центр digital-профессий в России, обучающий техническим и маркетинговым специальностям: программированию, проектированию, тестированию, созданию и продвижению продуктов.
Возможно обучение как с нуля (включая изучения Основ программирования), так и уже на базе имеющихся навыков.
Программы курсов включают работу с PHP, Python, SQL, Git, сетевые технологии, машинное обучение и нейронные сети для решения прикладных задач.
Преподаватели центра:
Ведущий методист: Мациевский Николай, МФТИ (прикладная математика и физика). Специализируется на автоматизации и оптимизации процессов. Увлекается путешествиями и авангардизмом.
Методист по автоматизации: Мария Шугурова, МГУ и НИУ ВШЭ (бизнес-планирование). Помогает внедрять анализ данных в бизнес-процессы и извлекать дополнительную пользу из данных. Хобби: телерадио ведущая.
Методист по Python: Евгений Бойченко, НГУ (математика и компьютерные науки). Разрабатывает решения на Python для автоматизации прикладных задач. Нравится писать чат-ботов.
Методист по машинному обучению: Алена Селезнева, МГУ (прикладная математика и информатика). Использует модели машинного обучения для решения задач реального бизнеса. В свободное время поет и рисует миниатюры.
Победы в конкурсах и хакатонах:
Октябрь 2020, финалист HackTheRealty, топ5 по прогнозу срока экспозиции объявлений об аренде недвижимости
Август 2020, финалист Digital Superhero Security, лучшее техническое решение детектирования DNS туннелей в трафике
Июнь 2020, 31 место (топ 5%) в международном хакатоне Prohack от McKinsey
Июнь 2020, 4 место в Цифровом Прорыве по задаче распознавания и предобработки неполного почтового адреса, самая высокая точность работы алгоритма
Май 2020, лучшее техническое решение по предсказанию ожидаемой продолжительности жизни, Digital Superhero