Coding in R per l'analisi dati: da principiante a esperto
What you'll learn
- Le basi della programmazione con R
- Impostare una sessione di lavoro
- Creare oggetti e funzioni su R
- Creare vettori, matrici, array, liste, fattori e dataframe
- Convertire oggetti in R
- Usare gli operatori logici
- Usare le istruzioni condizionali o strutture di controllo
- Esplorare i tuoi dati
- Installare e richiamare i pacchetti per l'estensione delle funzionalità di R
- Generare sequenze casuali su R
- Estrarre degli elementi da un oggetto o da un dataset
- Manipolare vettori, matrici, dataset
- Gestire valori mancanti e dati duplicati
- Manipolare le date
- Importare file in vari formati, .csv, Excel, .txt e altri
- Manipolare dataset, riorganizzandoli e aggregandoli
- Ristrutturare e aggregare i dati
- Creare grafici con le funzioni base e con i pacchetti più comuni
- Creare ed esportare dei report in vari formati
- Capire le basi della statistica con R
Requirements
- Un computer, una connessione a internet
- R e RStudio, che installeremo insieme
Description
Questo corso di base di programmazione con R per aspiranti data analyst nasce per accompagnare un principiante nella programmazione, dalle basi del linguaggio di programmazione (uno dei più conosciuti e utilizzati nel campo dell'analisi dati) fino all'utilizzo della statistica descrittiva.
Al termine di questo corso lo studente sarà in grado di creare, importare, manipolare e gestire dei dataset. Il corso parte dall'impostazione dell'ambiente di lavoro: vedremo come scaricare, installare e utilizzare alcuni dei più importanti strumenti per l'utilizzo di R, come RStudio.
Passeremo poi alla creazione degli oggetti: R si basa su alcune strutture che è necessario conoscere, come vettori, matrici, liste e dataframe. Una volta che avremo capito come creare e manipolare queste strutture dati, estrarne degli elementi e salvarle in locale sul computer, passeremo all'utilizzo di loop e alla creazione di funzioni.
Nella sezione successiva vedremo una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test e ottenere aiuto su una funzione.
Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. Vedremo quindi come importare un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel, il .csv, il .txt o il JSON.
Vedremo poi come manipolare i dati, creare nuove variabili, aggregare i dati, ordinarli in maniera orizzontale e longitudinale, unire due dataset. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr, tidyr o reshape2. Vedremo anche brevemente come interfacciarci a un database e utilizzare altri pacchetti per snellire la gestione di dataset un po' più grandi.
R è un linguaggio molto importante anche nell'ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche più comuni nell'ambito della statistica descrittiva, come media, mediana, moda, la deviazione standard, la visualizzazione della distribuzione e altro ancora.
Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2.
Nelle ultime lezioni del corso vedremo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo il materiale di supporto.
Who this course is for:
- Chi non ha conoscenze pregresse di R e vuole imparare direttamente in italiano
- Chi cerca uno strumento semplice per imparare a programmare con uno dei linguaggi più utilizzati nell'analisi dati
- *** Attenzione, R è un linguaggio utilizzato per l'analisi dati
Instructor
I'm a computer geek, data mining and research passionate, with a Ph.D in communication and complex systems and years of experience in teaching in Universities in Italy, France and Morocco, and online, of course!
I work in the field of data science and machine learning and I like writing about new technologies and data mining.
I spent the last 16 years working in the field of data analysis, social media analysis, benchmark analysis and web scraping for database building, in particular in the field of natural language processing for universities, startups and web agencies across UK, France, US and Italy.