KNIME Analytics Platform per Data Scientists, intermediate
What you'll learn
- Conoscere aspetti avanzati di KNIME Analytics Platform
- Gestire e manipolare i valori di data e ora presenti nei dataset
- Costruire dei cicli per iterare rami di un Workflow in base ad una feature, o una sua porzione , un certo numero di volte, fino al verificarsi di una condizione
- Trasformare le feature di un dataset in variabili per modificare il comportamento di un Workflow o effettuare manipolazioni
- Conoscere tecniche avanzate di machine learning, come l'ensemble e le reti neurali profonde
- Approfondire i nodi per le gestione dei database
- Approfondire i nodi per la visualizzazione
- Inviare i dati elaborati verso Power BI
- Implementare una soluzione di RAG, con un LLM locale, usando KNIME Analytics Platform
Requirements
- Avere un computer con almeno uno dei seguenti sistemi operativi: Windows, macOS, Linux; potrebbe essere necessario un profilo di amministratore, per l'installazione
- Conoscenza delle principali tecniche utilizzate nel machine learning: Supervised e Unsupervised Classification, Clustering
- Non serve conoscere alcun linguaggio di programmazione
- Avere seguito il corso KNIME Analytics Platform per Data Scientists, corso base o conoscere le basi di KNIME
Description
Questo corso di rivolge alle persone che manipolano i dati per la loro attività (studenti, professionisti) e vorrebbero utilizzare gli algoritmi di machine learning per il data mining ma non hanno voglia o tempo di imparare un linguaggio di programmazione, come R o Python.
Fortunatamente ci sono strumenti che permettono di raggiungere gli stessi obiettivi, senza utilizzare una riga di codice (a meno che non si voglia proprio farlo).
Tra questi, sicuramente, KNIME Analytics Platform, o più semplicemente KNIME® è il più conosciuto e utilizzato in questo ambito.
KNIME® è un ambiente completo e Open Source per l'analisi dei dati e il machine learning, che permette l'uso degli algoritmi di data mining più diffusi all'interno di un Workbench visuale, grazie all'utilizzo di componenti software, detti nodi, che combinati in maniera opportuna, permettono di elaborare qualsiasi base di dati.
Il corso, di livello intermedio, copre aspetti avanzati di KNIME, che consentono di migliorare l'esperienza di uso e di utilizzo e si compone di 9 sezioni:
Flow variables: consentono di rendere dinamica l'esecuzione di un workflow sulla base di come evolvono certe informazioni al suo interno
Gestione di Date & Time: verranno trattati i nodi che permettono la manipolazione di data e ora, il calcolo di durate, la gestione dei dati su medie mobili
Controllo del flusso: Loop, If, Case, Break, gestione degli errori.
Gestire i dati in un DBMS: collegarsi ad un DBMS, creare o modificare tabelle, inserire, modificare, cancellare righe su una tabella tutto senza conoscere l'SQL (ma anche conoscendolo)
Aspetti avanzati di Machine Learning: Ensemble (Bagging, Bootstrap, Boosting), Cross Validation), Reti Neurali FFNN, CNN, RNN
Component: creare ed adoperare un Component all'interno di KNIME Server
Visualizzazione dei dati: utilizzare i nodi di visualizzazione Plotly e KNIME views (Labs)
Esportare i dati: inviare i dati di un'elaborazione da KNIME a Power BI®
Implementare una soluzione RAG (Retrieval Augmented Generation), con un LLM (Large Language Model) locale, all'interno di KNIME
In tutte le sezioni si utilizzerà prevalentemente KNIME®, mostrando alcune implementazioni di data mining con dati pubblici e fornendo numerosi esempi tratti dal sito Hub di KNIME.
NOTE dell'autore:
KNIME® è un marchio registrato e il logo e il marchio OPEN FOR INNOVATION® sono utilizzati da KNIME AG su licenza di KNIME GmbH e sono registrati negli Stati Uniti. KNIME® è anche registrato in Germania.
L'autore non é collegato in alcun modo all'azienda.
Il corso è stato sviluppato sulle tracce dei corsi self paced [L2-DS] KNIME Analytics Platform for Data Scientists: Advanced e [L2-DW] KNIME Analytics Platform for Data Wranglers: Advanced, disponibili, in lingua inglese, sul sito di KNIME.
Gli esempi mostrati durante le lezioni sono per lo più disponibili sul sito KNIME Hub, cui si rimanda nelle risorse presenti alla fine di ogni lezione del corso.
La main version di KNIME utilizzata negli esempi è la 4.6 o 4.7 , le lezioni della sezione che spiega come implementare soluzioni che utilizzano i LLM, in KNIME, sono state create utilizzando la versione 5.2.3, che implementa i nodi per l'AI generativa.
Gli esempi che utilizzano KNIME Server sono stati creati con la versione 4.5
Who this course is for:
- Studenti di Ingegneria, Statistica, Matematica
- Professionisti che nel lavoro hanno a che fare con i dati e che finora hanno utilizzato Excel o Microsoft Access per le loro analisi
- Curiosi e appassionati di data mining, che non vogliono imparare un linguaggio di programmazione per usare le tecniche di machine learning.
- Chi pensa di poter usare un LLM locale nel proprio lavoro, o nella propria attività, senza accedere alle soluzioni proprietarie (e a pagamento)
Instructor
Ho una laurea magistrale in Ingegneria Informatica, indirizzo Big Data e lavoro da molti anni in una importante azienda di Telecomunicazioni.
Sono membro della IAML (Italian Association for Machine Learning) e di ILS (Italian Linux Society) e seguo appassionatamente tutto quanto gira attorno al machine learning, i Big Data, il data analytics, l'AI e, di recente, i LLM.
Ho diverse certificazione su KNIME e sono KNIME Certified Trainer.
Ho pubblicato diversi interventi per il Linux Day, dove racconto sempre qualcosa sugli strumenti Open Source a supporto dal Data Mining (R, KNIME).
Sono un membro attivo della community di KNIME e ho partecipato e gestito diversi Data Connect, eventi in cui si possono incontrare le persone di KNIME e utilizzatori di tutto il mondo, che presentano un problema che riguarda la loro attività, che hanno risolto con l'uso di KNIME.
Ho un mio Blog dove cerco di riportare articoli o informazioni (principalmente su KNIME) che possono essere utili per un data scientist: potete trovarlo con un motore di ricerca, digitando 'data science facile'.
Nel mio lavoro ho a che fare con i dati e, negli ultimi anni, sempre più spesso e in quantità sempre maggiore.
Ho adottato KNIME, perché mi ha permesso di aumentare la produttività, semplificando e velocizzando le analisi dei dati, grazie alla possibilità di provare e sperimentare varie soluzioni senza dovere imparare o usare un linguaggio di programmazione.