Machine Learning para Competições Kaggle - Curso 1
What you'll learn
- Como trabalhar com bases de dados reais de classificação e regressão, aplicado em competições reais (KDD e Kaggle)
- Desenvolva insights que permitam construir modelos de Machine Learning aplicados em problemas reais
- Aprenda exploração de dados, feature engineering, treinamento e fine-tuning de modelos voltados para desafios reais
- Crie vários tipos de gráficos para ajudar na compreensão e análise dos dados
- Faça a previsão de cancelamento de conta, tendência de usar novos produtos e propensão para comprar upgrades; aplicado em uma base real de empresa de telecomunicações
- Faça a previsão da tarifa de preços de corridas de táxi da cidade de Nova Iorque
Requirements
- Familiaridade com os conceitos básicos e algoritmos de Machine Learning
- Lógica de programação, principalmente estruturas condicionais e de repetição
- Programação básica em Python
Description
As competições de Ciência de Dados como aquelas postadas na plataforma Kaggle são uma ótima maneira de testar as habilidades adquiridas em cursos iniciais, e ainda aprender novas habilidades necessárias para resolver problemas reais. Entretanto, fazer essa transição entre um ambiente educacional e aquele que encontramos no Kaggle, que imita os desafios que devemos encontrar no mercado de trabalho, tende a ser um degrau muito grande, pois a natureza dos dados e dos problemas propostos aumenta de complexidade num nível que os cursos básicos não contemplam.
Pensando nisso, este curso tem o objetivo de preencher essa lacuna na formação dos cientistas de dados, mostrando detalhadamente como abordar os desafios, passando pelas fases de exploração e tratamento de dados, escolha de abordagem de solução, construção de um modelo, treinamento e validação; até a entrega de um resultado inicial em formato que pode ser submetido às competições. O entendimento desse processo é o primeiro passo para que os competidores possam desenvolver melhorias e começar sua escalada rumo ao topo dos rankings.
Neste curso focaremos em duas das principais tarefas da aprendizagem de máquina: classificação e regressão.
Com relação a classificação, vamos trabalhar com uma base de dados real de uma empresa de telecomunicações do KDD Cup 2009, na qual o objetivo é modelar o comportamento do consumidor analisando três características: cancelamento da conta, tendência de usar novos produtos e serviços e a propensão para comprar upgrades ou adicionais com maior margem de lucro
No que se refere a regressão, vamos trabalhar com uma base de dados real das corridas de táxi no Nova Iorque do Kaggle 2018! O objetivo é prever o valor da tarifa para uma corrida de táxi nesta cidade
Vamos desenvolver todos os códigos utilizando a linguagem Python e linha por linha, de forma que você entenda todas as análises necessárias para participar dessas competições!
Who this course is for:
- Pessoas que já estejam num nível intermediário de sua formação em Ciência de Dados, e que agora estejam procurando aprender a usar suas habilidades em desafios reais
- Analistas de dados que queiram aumentar seu conhecimento na área de Machine Learning
- Alunos de graduação que estão estudando disciplinas ligadas a área de Inteligência Artificial
- Qualquer pessoa interessada em Inteligência Artificial
Instructors
Olá! Meu nome é Jones Granatyr e já trabalho em torno de 10 anos com Inteligência Artificial (IA), inclusive fiz o meu mestrado e doutorado nessa área. Atualmente sou professor, pesquisador e fundador do portal IA Expert, um site com conteúdo específico sobre Inteligência Artificial. Desde que iniciei na Udemy criei vários cursos sobre diversos assuntos de IA, como por exemplo: Deep Learning, Machine Learning, Data Science, Redes Neurais Artificiais, Algoritmos Genéticos, Detecção e Reconhecimento Facial, Algoritmos de Busca, Mineração de Textos, Buscas em Textos, Mineração de Regras de Associação, Sistemas Especialistas e Sistemas de Recomendação. Os cursos são abordados em diversas linguagens de programação (Python, R e Java) e com várias ferramentas/tecnologias (tensorflow, keras, pandas, sklearn, opencv, dlib, weka, nltk, por exemplo). Meu principal objetivo é desmistificar a área de IA e ajudar profissionais de TI a entenderem como essa tecnologia pode ser utilizada na prática e que possam visualizar novas oportunidades de negócios.
Sou formado em Engenharia de Bioprocessos, com experiência em gestão de processos industriais e implementação de sistema formal de gestão. Tenho mestrado e doutorado em Bioquímica, com ênfase em bioinformática. Atualmente estou dedicando minha carreira à área de Ciência de Dados/Inteligência Artificial, tendo completado recentemente duas especializações, em R e Python. Tenho uma enorme paixão pelas possibilidades que essa área proporciona para aumentar a qualidade de vida das pessoas.
Olá! Meu nome é Fabio Spak trabalho há muito tempo no setor de tecnologia da informação no setor privado e também como professor de ensino, sou formado em Ciência da Computação com especialização em Business Intelligence. Considero-me um entusiasta na área de Inteligência Artificial e minha missão é difundir do conhecimento aprendido para meus alunos.
A plataforma IA Expert tem o objetivo de trazer cursos teóricos e práticos de fácil entendimento sobre sobre Inteligência Artificial e Ciência de Dados, para que profissionais de todas as áreas consigam entender e aplicar os benefícios que a IA pode trazer para seus negócios, bem como apresentar todas as oportunidades que essa área pode trazer para profissionais de tecnologia da informação. Também trazemos notícias atualizadas semanais sobre a área em nosso portal.