
Descrição do conteúdo da seção.
Nesta aula você aprenderá os conceitos de web scraping.
Nesta aula você aprenderá sobre páginas web.
Nesta aula você aprenderá um pouco mais sobre HTML.
Descrição do conteúdo da seção.
Nesta aula explico qual versão do Python você deve utilizar. (Esta aula faz parte do curso Python para Todos)
Nesta aula mostro como instalar o Python no Windows 10. (Esta aula faz parte do curso Python para Todos)
Nesta aula ensino como baixar e compilar o código-fonte da versão 3.6.1 no Debian 8.8. Comandos utilizados:
Build-essential é um pacote que reúne várias aplicações para compilar sistemas à partir de seu código-fonte:
sudo apt-get install build-essential
Para descompactar o código-fonte do Python use:
tar -Jxf Python-3.6.1.tar.xz
Comandos para compilar o Python:
./configure
make
sudo make install
(Esta aula faz parte do curso Python para Todos)
Nesta aula ensino a utilizar o pyenv para gerenciar versões do Python instaladas na máquina. (Esta aula faz parte do curso Python para Todos)
Nesta aula você aprenderá a criar ambientes virtuais com o virtualenv.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a buscar informações sobre tecnologias utilizadas em um Website utilizando a biblioteca builtwith.
Nesta aula você aprenderá a buscar informações sobre o proprietário de um Website utilizando a biblioteca python-whois.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a criar expressões regulares para busca de padrão de informação dentro de textos.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a criar um Web Scraper.
Nesta aula vamos utilizar o conhecimento adquirido até agora.
Descrição do conteúdo da seção.
Nesta aula você terá informações atualizadas sobre a próxima aula.
Nesta aula você aprenderá a instalar a biblioteca BeautifulSoup.
Nesta aula você aprenderá a utilizar um servidor Web com Python.
Esta aula é uma introdução à biblioteca BeautifulSoup.
Nesta aula você aprenderá a tratar erros ao usar urlopen e ao tratar os dados retornados com BeautifulSoup.
Correção do exercício da próxima aula.
Nesta aula você vai explorar um pouco mais a biblioteca BeautifulSoup.
Esta aula contém observações importantes sobre a próxima aula.
Nesta aula você aprenderá a utilizar expressões regulares com a biblioteca BeautifulSoup.
OBSERVAÇÃO: No exemplo 2, o site não está mais respondendo as requisições, sendo assim, o bsregex2.py foi ajustado para bsregex2_novo.py que usa uma página inserida no meu blog com o mesmo conteúdo da página citada no exemplo.
OBSERVAÇÃO 2: No exemplo 3, onde foi usado o site www.folha.uol.com.br, utilizei o ano 2017 e mês 11. Com o passar dos meses, estes mês e ano não retornará nenhum resultado. Use o mês e ano do dia que estiver executando o exemplo, ou outro mais recente.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a instalar e utilizar a biblioteca LXML para trabalhar com arquivos XML. Esta biblioteca pode substituir o analisador padrão do BeautifulSoup desta forma:
BeautifulSoup(html.read(), "lxml")
Nesta aula você aprenderá a instalar e utilizar a biblioteca LXML para trabalhar com arquivos XML. Esta biblioteca pode substituir o analisador padrão do BeautifulSoup desta forma:
BeautifulSoup(html.read(), "lxml")
Junto aos materias da aula está um arquivo denominado ler_xml_camara.py que deverá ser utilizado como exercício. Este arquivo contém um programa exemplo para ler o xml da Câmara dos Deputados para análise posterior.
Nesta aula você realizará uma tarefa.
Nesta aula você realizará um desafio utilizando LXML.
Nesta aula você realizará um desafio utilizando LXML.
Nesta aula você aprenderá a utilizar a biblioteca LXML com XPath.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a instalar o Scrapy Framework no Windows 10 e no Linux Mint 18.3.
*A instalação do Visual C++ Build Tools necessária para o funcionamento do Scrapy no Windows está adicionada nos materiais para download.
Nesta aula você aprenderá a utilizar o framework Scrapy para criar um crawler (Spider).
Nesta aula você aprenderá a utilizar o framework Scrapy para criar um crawler (Spider).
Nesta aula você aprenderá a utilizar o framework Scrapy para criar um crawler (Spider).
Nesta aula você aprenderá a utilizar o framework Scrapy para criar um crawler (Spider) e aprenderá a navegar em links dentro de um site.
Nesta aula apresento os caminhos para análise de um site e escrita do spider usando como exemplo o site da Telelista. Teremos um programa real.
Nesta aula você aprenderá um pouco mais sobre Selector XPath e CSS.
Descrição do conteúdo da seção.
Nesta aula será feita uma introdução ao uso de APIs.
Nesta aula foram abordados os seguintes assuntos: Respostas de APIs, Chamadas às APIs, API do Twitter, biblioteca twitter.
Descrição do conteúdo da seção.
Nesta aula você aprenderá a baixar imagens e arquivos diversos e aprenderá a trabalhar com arquivos CSV.
Artigo sobre instalação do MySQL no Windows e no Linux.
Esta é uma aula do curso Python para Todos.
Nesta aula você aprenderá um pouco sobre banco de dados e como instalar o MySQL no Windows.
Esta é um aula do curso Python para Todos.
Nesta aula você aprenderá a instalar o MySQL no Linux Mint.
Esta é uma aula do curso Python para Todos.
Nesta aula você aprenderá a utilizar o MySQL Workbench para criar um esquema de banco de dados e uma tabela visualmente.
Aprenderá sobre alguns tipos de dados básicos oferecidos pelo MySQL para criar os campos das tabelas.
Aprenderá também a utilizar comandos em linguagem SQL para criar uma tabela, inserir, alterar, excluir e consultar dados.
Esta é um aula do curso Python para Todos.
Nesta aula você aprenderá a utilizar o driver MySQL Connector/Python para conectar-se ao banco MySQL.
Esta é uma aula do curso Python para Todos.
Nesta aula você aprenderá a executar instruções SQL usando MySQL Connector/Python.
Nesta aula vamos armazenar o resultado de um scraping realizado no site Wikipedia em uma tabela de um banco de dados MySQL.
AVISO: O CURSO ESTÁ EM ANDAMENTO, SEMPRE TEREMOS NOVAS AULAS!!!!
Neste curso você aprenderá técnicas de web scraping e web crawling com Python para acessar dados à partir de qualquer fonte na Web e em qualquer formato.
Aprenderá a criar scripts em Python e a usar APIs para coletar e processar dados de milhares de páginas Web ao mesmo tempo.
Aprenderá a analisar páginas HTML, armazenar os dados coletados, rastrear formulários e logins, identificar informações e tecnologias utilizadas em um site.
Aprenderá sobre expressões regulares.
Aprenderá sobre bibliotecas que vão lhe auxiliar nas tarefas de scraping como BeautifulSoup, LXML e Scrapy.
Aprenderá a criar programas para ler diversos tipos de documentos como CSV, PDF, DOCX, XLSX, JSON e ODT.
Aprenderá a realizar limpeza dos dados.
Aprenderá a utilizar o Selenium WebDriver.