
Разберем преобразование данных с помощью NumPy
Разберем, зачем нужен pandas для данных
Разберем, как импортировать файлы Excel
Разберем, как назначать индексы в фрейме
Разберем множественные индексы
Разберем, как создавать объединенный фрейм из данных из нескольких источников
Разберем, как фильтровать данные
Разберем, как изменять данные во фреймах
Разберем, как работать с lambda в pandas
Разберем использование групповых функций в pandas
Разберем, как проводить очистку значений при группировке
Разберем, как работать с линейной регрессией
Поработаем с получением данных по API из JSON формата
Разберем GET и POST запросы с параметрами
Получим данные по SOAP в XML
Разберем получение неструктурированных данных
Научимся собирать табличные данные
Разберем получение и очистку данных
Разберем работу робота-паука
Научимся запускать парсинг в параллельных процессах
Разберем основы этичного парсинга страниц
Разберем установку SQLite и создание базы данных
Разберем работу с SQL в Python
Разберем, как работать с базой данных при парсинге данных
Разберем основные элементы графиков в matplotlib
Рассмотрим, как строить линии, области, столбчатые и круговые диаграммы
Рассмотрим совместное представление наборов данных на одном графике
Рассмотрим графики "ящик с усами" в форме "ульев" и "скрипок"
Построим график рассеяния и регрессии с помощью Seaborn
Разберем визуализацию корреляции данных
Внимание: для доступа к курсам ITtensive на Udemy напишите, пожалуйста, на support@ittensive.com с названием курса или группы курсов, которые хотите пройти.
Курс состоит из 4 больших частей.
1. Анализ данных
Вы изучите работу с импортом, объединением, преобразованием, фильтрацией данных на pandas, а также научитесь предсказывать тренды.
Вы сможете самостоятельно загружать данные в формате CSV, TSV, Excel, извлекать из них значения, находить взаимосвязи между разными наборами данных, преобразовывать и усекать наборы данных. В заключении вы освоите математический аппарат линейной регрессии для поиска линейной связи между данными и эффективно примените его для предсказания значений в будущем.
2. Парсинг данных
Вы изучите получение данных в Python, используя библиотеку requests API и форматы JSON и XML (включая SOAP).
Научитесь работать с неструктурированными данными в HTML, собирать их и преобразовывать в фреймы данных.
Научитесь собирать данные целиком с сайта в несколько потоков: создадите мультипроцессного робота-паука.
В завершении установите SQLite и загрузите все собранные данные в базу, а также научитесь выбирать из базы данных непосредственно в фреймы данных.
3. Визуализация данных
Вы изучите анатомию matplotlib и типы визуализации различных данных: линии, области, столбцы, круговые диаграммы.
Научитесь визуализировать зависимости между данными и линейную регрессию с помощью seaborn: построите ящичковые и парные диаграммы, диаграммы распределения.
Изучите визуализацию временных (хронологических) данных: ряды, скользящие средние, отклонения и "японские свечи".
В завершении разберете работу с гео-данными и построение фоновых картограмм по нескольким наборам данных, используя geopandas.
4. Генерация отчетов и автоматизация
В этом курсе вы научитесь создавать и преобразовывать PDF документы, генерировать их из HTML кода, используя шаблонизатор, отправлять отчеты по e-mail и автоматизировать работу.
В курсе используются библиотеки reportlab, pypdf2, pdfkit, jinja2, smtplib, email, binascii, io, а также бинарный файл wkhtmltopdf. Решаем задачи по созданию PDF документа через холст, разбору PDF документа, объединению PDF документов, созданию HTML и PDF документов из HTML, шаблонизации HTML через jinja2, преобразованию бинарных данных в base64-кодировку. В заключении разберем отправку e-mail, включая HTML-письма и вложенные PDF отчеты.