Python e Mineração de Dados com WEKA
What you'll learn
- Python básico
- Contexto da Mineração de Dados - Descoberta de conhecimento em banco de dados, Aplicações práticas
- Entender o impacto da mineração de dados, Quais são os dados de entrada e saída na Mineração de Dados
- Aprender as técnicas de Mineração de Dados (Conceitos Básicos, Aprendizado de Máquina)
- Trabalhar com as técnicas: CLASSIFICAÇÃO, INDUÇÃO DE REGRAS, REGRAS DE ASSOCIAÇÃO, AGRUPAMENTO(CLUSTER) , REDES NEURAIS
- Utilizar os algoritmos: ÁRVORES DE DECISÃO, APRIORI, KMEANS,ETC
- Aprendizado Bayesiano (Operacionalização do conhecimento minerado e sua interpretação)
- Validação do conhecimento descoberto
- Aprendendo a utilizar o WEKA: uma ferramenta Java para Classificação, Associação, Clustering e Previsão
- Explanação de Interfaces Visuais para interpretação e divulgação do conhecimento (Mineração Visual)
- Entendimento e apresentação sobre MINERAÇÃO VISUAL- uso da biblioteca D3js
Requirements
- Não é necessário conhecimento em nenhuma ferramenta
Description
As grandes empresas estão em busca de profissionais que saibam tratar e trabalhar dados, permitindo que novos insights sejam descobertos e aplicados ao seu negócio.
Atualmente, a mineração de dados se mostra fundamental para a descoberta de novas informações e conhecimento, formatados em regras e padrões, a partir de grandes bases de dados. Nesta perspectiva, torna-se importante o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados à área de mineração de dados. Esta abordagem visa uma sintonia com as tendências empregadas atualmente no mercado no uso desta tecnologia de modo a preparar o futuro profissional a avaliar e, sobretudo, facilitar seu entendimento no emprego de metodologias e tecnologias avançadas.
O curso aborda o tema Mineração de Dados, através de aulas práticas e teóricas, utilizando-se de técnicas avançadas de descoberta de conhecimento, os quais provém a capacidade de descobrir novas informações, formatadas em regras e padrões, oriundas da análise de grandes bases de dados. Nesta perspectiva, o desenvolvimento de um raciocínio crítico acerca dos principais conceitos, problemas e algoritmos relacionados a área de Mineração de Dados é a principal habilidade adquirida por quem conclui o curso.
O conteúdo visto é praticado na ferramenta WEKA, que é gratuita e de fácil entendimento.
São 6 laboratórios totalmente práticos que você pode realizar durante o curso, detalhados e explicados passo a passo.
Você entenderá os algoritmos e poderá praticar com suas bases de dados, seja arquivo texto ou banco de dados.
Contará com um Framework integrado que apresenta os resultados estatísticos.
Neste curso você também verá Python. Python é uma linguagem de programação de alto nível que vem sendo adota em todas as grandes universidades do mundo todo. Neste curso você aprenderá conceitos básicos da linguagem Python, como estruturas condicionais e de repetição, manipulação de strings, listas e arquivos. Tudo isso apresentado com uma metodologia simples, direta e sem enrolação.
Who this course is for:
- Estudantes, Profissionais da área de dados, Estatísticos
Instructors
Quem sou
Fui escolhido como um dos 50 profissionais mais influentes em dados no ano de 2023 pela Gama Academy, uma organização que estabelece um Rank dos profissionais com mais destaque na área de Dados/BI.
Por que estudar na área de dados comigo?
Sou profissional da área com diversos projetos desenvolvidos, tanto na área privada como na área pública, tenho um skill muito forte em atender meus alunos com alguma dúvida no máximo em 24 horas. Procuro alinhar conhecimento teórico e prático.
O que trago em meus cursos?
Acho que a área de dados é bem rica e vasta, mas ter um direcionamento do que deve ser estudado com cursos passo a passo é o que busco nas minhas aulas, fiz um mestrado na área de educação para criar aulas sob medida aos meus alunos. Estou diariamente aprimorando e trazendo novidades na área, afinal criar + de 100 cursos envolve dedicação e foco.
O que faço hoje
Sou professor das pós-graduações das universidades UNIFACS, CATÓLICA DO SALVADOR e ISL Wyden. Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC). Possui Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente sou editor do blog BI com Vatapá. Autor do Livro: BI COMO DEVE SER - professor EAD de diversos cursos de BI na Aprenda Virtual. Idealizador do BI PRO - O maior e mais completo conteúdo sobre BI da internet.
Diego Mariano é analista de sistemas, pesquisador e professor de programação, banco de dados e bioinformática.
Doutor em Bioinformática pela Universidade Federal de Minas Gerais com atuação na área de ciência de dados e aprendizado de máquina aplicados ao aperfeiçoamento de enzimas usadas na produção de biocombustíveis. Mestre em Bioinformática, também pela UFMG, atuando na área de desenvolvimento de sistemas Web para montagem de genomas. Atualmente realiza estágio pós-doutoral no Departamento de Ciência da Computação da UFMG com foco em desenvolvimento de sistemas Web para Bioinformática, análise exploratória e visualização de dados. Tem conhecimentos nas linguagens: PHP, JavaScript, Python, R, Perl, HTML, CSS e SQL.
***
English: Diego Mariano is a systems analyst and instructor of online courses about Programming Languages, Database Management Systems, and Bioinformatics (some courses are free). He is a postdoctoral researcher at the Federal University of Minas Gerais and a Professional Degree student at HarvardX. Also, he has majored in Information Systems and he has a master's degree and a Ph.D. in Bioinformatics.
***
Español: Dr. Diego Mariano es analista de sistemas, investigador y docente de cursos en línea sobre lenguajes de programación, bases de datos y bioinformática (algunos cursos son gratuitos). Actualmente es post-doc de la Universidad Federal de Minas Gerais y estudiante de grado profesional en HarvardX. Además, se graduó en sistemas de información y tiene una maestría en bioinformática.