Corso completo per Data Science e machine learning con R
What you'll learn
- Ripasso delle basi di R e delle sue strutture dati
- Ambienti di programmazione per il Data Science
- Importazione di dataset in R
- Creazione grafici ed esplorazione dataset
- Manipolazione e gestione dataset
- Preprocessing e pulizia dei dati per l'analisi
- Introduzione al machine learning con R
- Teoria e algoritmi di machine learning, metodi supervisionati e non supervisionati
- Metodi ensemble: bagging, boosting
- Validazione e valutazione dei modelli
- Pulizia e analisi testi
- Metodi per la Sentiment Analysis
Requirements
- Conoscenza base di R
Description
Questo corso sul Data Science con R nasce per essere un percorso completo su come si è evoluta l'analisi dati negli ultimi anni a partire dall'algebra e dalla statistica classiche. L'obiettivo è accompagnare uno studente che ha qualche base di R in un percorso attraverso le varie anime del Data Science.
Cominceremo con un ripasso delle basi di R, a partire dallo scaricamento e installazione, all'impostazione dell'ambiente di lavoro, passando per le strutture, la creazione di funzioni, l'uso degli operatori e di alcune funzioni importanti.
Passeremo poi a vedere come manipolare e gestire un dataset, estrarne dei casi oppure delle variabili, generare dei dataset casuali, calcolare delle misure statistiche di base, creare grafici con i pacchetti Matplotlib e Seaborn.
Nelle sezioni successive cominciamo a entrare nel cuore del Data Science con R, a cominciare dal preprocessing: vediamo infatti come ripulire e normalizzare un dataset, e come gestire i dati mancanti.
La sezione successiva ci permette di cominciare a impostare dei modelli di machine learning con Python: vedremo tutti gli algoritmi più comuni, sia supervisionati che non supervisionati, come la regressione, semplice, multipla e logistica, il k-nearest neighbors, il Support Vector Machines, il Naive Bayes, gli alberi di decisione e il clustering.
Passeremo poi ai più comuni metodi ensemble, come il Random Forest, il Bagging e il Boosting, e all'analisi del linguaggio naturale e al suo utilizzo nel machine learning per la catalogazione dei testi.
Nelle ultime sezioni vedremo alcuni rudimenti di analisi temporale, sistemi di raccomandazione e social media mining.
Who this course is for:
- Chi conosce già un po' di programmazione R e vuole cominciare un percorso nel data science
- Chi cerca un percorso completo per farsi un'idea delle tante anime del Data Science con R
Instructor
I'm a computer geek, data mining and research passionate, with a Ph.D in communication and complex systems and years of experience in teaching in Universities in Italy, France and Morocco, and online, of course!
I work in the field of data science and machine learning and I like writing about new technologies and data mining.
I spent the last 16 years working in the field of data analysis, social media analysis, benchmark analysis and web scraping for database building, in particular in the field of natural language processing for universities, startups and web agencies across UK, France, US and Italy.