KNIME Analytics Platform per Data Scientists, corso base
What you'll learn
- Conoscere KNIME Analytics Platform e le sue caratteristiche principali.
- Analizzare i dati, visualizzarli e ricavarne conoscenza, salvare le elaborazioni e creare dei report per presentare la sintesi del tuo lavoro.
- Imparare le principali tecniche di machine learning e utilizzarle con KNIME senza scrivere codice.
- Imparare ad accedere ai dati con KNIME, in qualsiasi posizione si trovino (file, rete, database)
Requirements
- Avere un computer con almeno uno dei seguenti sistemi operativi: Windows, macOS, Linux; potrebbe essere necessario un profilo di amministratore, per l'installazione
- Conoscenza delle principali tecniche utilizzate nel machine learning: Supervised e Unsupervised Classification, Clustering
- Non serve conoscere alcun linguaggio di programmazione
Description
Questo corso di rivolge alle persone che manipolano i dati per la loro attività (studenti, professionisti) e vorrebbero utilizzare gli algoritmi di machine learning per il data mining ma non hanno voglia o tempo di imparare un linguaggio di programmazione, come R o Python.
Fortunatamente ci sono strumenti che permettono di raggiungere gli stessi obiettivi, senza utilizzare una riga di codice (a meno che non si voglia proprio farlo).
Tra questi, sicuramente, KNIME Analytics Platform, o più semplicemente KNIME® è il più conosciuto e utilizzato in questo ambito.
KNIME® è un ambiente completo e Open Source per l'analisi dei dati e il machine learning, che permette l'uso degli algoritmi di data mining più diffusi all'interno di un Workbench visuale, grazie all'utilizzo di componenti software, detti nodi, che combinati in maniera opportuna, permettono di elaborare qualsiasi base di dati.
Il corso si compone di sei sezioni:
Introduzione all'applicativo KNIME Analytics Platform, i nodi, il Workflow, l'accesso ai dati memorizzati in files, in rete e su un database
Manipolazione e trasformazione dei dati e tecniche di aggregazione
Visualizzazione dei dati, creazione di viste interattive per l'analisi dei dati
Algoritmi di data mining con KNIME: classificazione supervisionata, regressione lineare, clustering
Salvataggio dei risultati delle proprie elaborazione su files o su databases e generazione di report
Materiale Extra
In tutte le sezioni si utilizzerà prevalentemente KNIME®, mostrando alcune implementazioni di data mining con dati pubblici.
NOTE dell'autore:
KNIME® è un marchio registrato e il logo e il marchio OPEN FOR INNOVATION® sono utilizzati da KNIME AG su licenza di KNIME GmbH e sono registrati negli Stati Uniti. KNIME® è anche registrato in Germania.
L'autore non é collegato in alcun modo all'azienda.
Il corso è stato sviluppato sulla traccia del corso self paced [L1-DS] KNIME Analytics Platform for Data Scientists: Basics, disponibile, in lingua inglese, sul sito di KNIME.
Gli esempi mostrati durante le lezioni sono tutti disponibili sul sito KNIME Hub, cui si rimanda nelle risorse presenti alla fine di ogni lezione del corso.
Who this course is for:
- Studenti di Ingegneria, Statistica, Matematica
- Professionisti che nel lavoro hanno a che fare con i dati e che finora hanno utilizzato Excel o MS Access per le loro analisi
- Curiosi e appassionati di data mining, che non vogliono impare un linguaggio di programmazione per usare le tecniche di machine learning.
Instructor
Sono laureato in Ingegneria Informatica, indirizzo Big Data e lavoro da molti anni in una importante azienda di Telecomunicazioni.
Sono membro della IAML (Italian Association for Machine Learning) e di ILS (Italian Linux Society) e seguo appassionatamente tutto quanto gira attorno al machine learning, i Big Data, il data analytics, l'AI.
Ho diverse certificazione su KNIME e sono KNIME Certified Trainer.
Ho pubblicato diversi interventi per il Linux Day, dove racconto sempre qualcosa sugli strumenti Open Source a supporto dal Data Mining (R, KNIME).
Ho un mio Blog dove cerco di riportare articoli o informazioni (principalmente su KNIME) che possono essere utili per un data scientist: potete trovarlo con un motore di ricerca, digitando 'data science facile'.
Nel mio lavoro ho a che fare con i dati e, negli ultimi anni, sempre più spesso e in quantità sempre maggiore.
Ho adottato KNIME, perché mi ha permesso di aumentare la produttività, semplificando e velocizzando le analisi dei dati, grazie alla possibilità di provare e sperimentare varie soluzioni senza dovere imparare o usare un linguaggio di programmazione.