Coding in R per l'analisi dati: da principiante a esperto
What you'll learn
- Installare R e RStudio
- Impostare una sessione di lavoro
- Creare oggetti e funzioni di base su R
- Riconoscere e creare le strutture di base, oggetti e funzioni
- Creare vettori, matrici, array, liste, fattori e dataframe
- Convertire oggetti in R
- Usare gli operatori logici
- Usare le istruzioni condizionali o strutture di controllo
- Creare funzioni
- Caricare files su R
- Installare e richiamare i pacchetti per l'estensione delle funzionalità di R
- Impostare una directory di lavoro
- Generare sequenze casuali su R
- Estrarre degli elementi da un oggetto o da un dataset
- Manipolare vettori, matrici, dataset
- Gestire i valori mancanti
- Gestire i dati duplicati
- Manipolare le date
- Importare file in vari formati
- Manipolare dataset, riorganizzandoli e aggregandoli
- Esplorare la struttura dei dataset
- Ristrutturare e aggregare i dati
- Utilizzare alcune funzioni per la statistica di base
- Creare grafici semplici con le funzioni base
- Creare grafici con ggplot2
- Creare ed esportare dei report in vari formati
- Capire le basi della statistica con R
Course content
- Preview04:24
- Preview02:55
- 02:36Scaricare e installare RStudio
- 09:46Personalizzare e utilizzare RStudio
- 09:07Utilizzare altri IDE con R
- 3 questionsUtilizzare R con RStudio
- 00:17Codice del corso
Requirements
- Un computer, una connessione a internet
- R e RStudio, che installeremo insieme
Description
Questo corso di base di programmazione con R per aspiranti data analyst nasce per accompagnare un principiante nella programmazione, dalle basi del linguaggio di programmazione (uno dei più conosciuti e utilizzati nel campo dell'analisi dati) fino all'utilizzo della statistica descrittiva.
Una volta finito questo corso lo studente sarà in grado di creare, importare, manipolare e gestire dei dataset. Il corso parte dall'impostazione dell'ambiente di lavoro: vedremo come scaricare, installare e utilizzare alcuni dei più importanti tool per l'utilizzo di R.
Passeremo poi alla creazione degli oggetti: R si basa su alcune strutture che è necessario conoscere, come vettori, matrici, liste e dataframe. Una volta che avremo capito come creare e manipolare queste strutture dati, estrarne degli elementi e salvarle in locale sul computer, passeremo all'utilizzo di loop e alla creazione di funzioni.
Nella sezione successiva vedremo una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test e ottenere aiuto su una funzione.
Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. Vedremo quindi come importare un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel, il .csv, il .txt o il JSON.
Vedremo poi come manipolare i dati, creare nuove variabili, aggregare i dati, ordinarli in maniera orizzontale e longitudinale, unire due dataset. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr, tidyr o reshape2. Vedremo anche brevemente come interfacciarci a un database e utilizzare altri pacchetti per snellire la gestione di dataset un po' più grandi.
R è un linguaggio molto importante anche nell'ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche più comuni nell'ambito della statistica descrittiva.
Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2.
Nelle ultime lezioni del corso vedremo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo il materiale di supporto.
Who this course is for:
- Chi non ha conoscenze pregresse di R e vuole imparare direttamente in italiano
- Chi cerca uno strumento semplice per imparare a programmare con uno dei linguaggi più utilizzati nell'analisi dati
- *** Attenzione, R è un linguaggio utilizzato per l'analisi dati
Instructor
I'm a computer geek, data mining and research passionate, with a Ph.D in communication and complex systems and years of experience in teaching in Universities in Italy, France and Morocco, and online, of course!
I work as consultant in the field of data mining and machine learning and I like writing about new technologies and data mining.
I spent the last 12 years working as freelance and researcher in the field of social media analysis, benchmark analysis and web scraping for database building, in particular in the field of buzz analysis and sentiment analysis for universities, startups and web agencies across UK, France, US and Italy.