Text Mining no R: extração, informação, análise, documento
What you'll learn
- Processo de obtenção de informações importantes de um texto
- Recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional
- Agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos
- Nuvem de Palavras
- Corpus
- Tokenização
- Tokens
- Frequência de Palavras
- Stopwords
- Processo de Text Mining
- Utilização de pacotes: BiocManager, rvest, stringr,lexiconPT,widyr, ggraph, igraph, tibble
- Utilização de pacotes: TM, tidyr, ggplot2, SnowballC, dplyr, tidytext, wordcloud, RColorBrewer
- Ajustes e transformação nos textos: radicais, eliminação de espaços em branco, palavras indesejadas
- Criação de Matriz Termo Documento
- Correlação entre textos, palavras mais ditas, associação entre palavras
- Análise de Sentimento
- Web scraping
- Comandos: VCorpus, inspect, meta, lapply, tm_map, stopwords, documentTermMatrix, findFreqTerms
- Comandos: FindAssocs, bind_tf_idf, count, arrange, filter, geom_col, unnest_tokens, anti_join, pairwise_cor
- Comandos: Inner_join, group_by, summarize, mutate, barchart, str_c, str_detect, str_subset, str_which, str_count, str_replace_all
- Comandos: Tolower, removePunctuation, removeNumbers, stripWhitespace, stemDocument
- Estudo de Ngrams, em especial Bigrams
Requirements
- Conhecimento básico em Linguagem R
Description
Os dados não estruturados representam mais de 80% de tudo que circula na internet. A disponibilização de dados nesta nova forma de armazenamento é cada dia mais crescente em todas as organizações mundiais. Um grande desafio é entender o que textos, sites, arquivos em formatos word, pdf, etc podem nos trazer de informações relevantes e qual seria esta amplitude.
Pensando nisso, foi criado o curso Text Mining no R: extração, informação, análise, documento que visa entender o processo de obtenção de informações importantes de um texto com base na recuperação de informações, extração de dados, aprendizado de máquina, estatísticas e linguística computacional que são tarefas típicas de mineração de texto, que incluem categorização e agrupamento de texto, extração de conceito/entidade, produção de taxonomias granulares, análise de sentimentos.
O curso é trabalhado com diversos práticas em arquivos texto, inclusive com o uso de web scrapping, ou seja, coleta de dados web ou raspagem web, é uma forma de mineração que permite a extração de dados de sites da web convertendo-os em informação estruturada para posterior análise.
Para isso você conta:
· Acesso total vitalício ao conteúdo do curso;
· Certificado de conclusão do curso oferecido pela Udemy;
· Acesso no seu dispositivo móvel e TV ou Computador;
· Acesso 24h / 7 dias por semana aos instrutores usando a seção de Perguntas e Respostas.
SEJA MAIS UM ALUNO DESTE CLUBE QUE NÃO PARA CRESCER!
Who this course is for:
- Estudantes de BI, Estatística, Computação, Informática, Gestores de Empresas (RH, Administração, Economia, dentre outros)
- Pessoas interessadas em aprender os conceitos mais aprofundados sobre técnicas de Text Mining para estudo de textos diversos
Instructor
Por que estudar na área de dados comigo?
Sou profissional da área com diversos projetos desenvolvidos, tanto na área privada como na área pública, tenho um skill muito forte em atender meus alunos com alguma dúvida no máximo em 24 horas. Procuro alinhar conhecimento teórico e prático.
O que trago em meus cursos?
Acho que a área de dados é bem rica e vasta, mas ter um direcionamento do que deve ser estudado com cursos passo a passo é o que busco nas minhas aulas, fiz um mestrado na área de educação para criar aulas sob medida aos meus alunos. Estou diariamente aprimorando e trazendo novidades na área, afinal criar + de 100 cursos envolve dedicação e foco.
O que faço hoje
Sou professor das pós-graduações das universidades UNIFACS, CATÓLICA DO SALVADOR e ISL Wyden. Mestre pela Universidade do Estado da Bahia (UNEB) no Curso de Mestrado Profissional Gestão e Tecnologias Aplicadas à Educação (GESTEC). Possui Especialização em Análise de Sistemas pela Faculdade Visconde de Cairu e Bacharelado em Estatística pela Universidade Federal da Bahia. Atua profissionalmente como consultor há mais de 15 anos nas áreas de Data Warehouse, Mineração de Dados, Ferramentas de Tomada de Decisão e Estatística. Atualmente sou editor do blog BI com Vatapá. Autor do Livro: BI COMO DEVE SER - professor EAD de diversos cursos de BI na Aprenda Virtual. Idealizador do BI PRO - O maior e mais completo conteúdo sobre BI da internet.