Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
Apache Spark 3+ pour les débutants: la base du big data !
Highest Rated
Rating: 4.7 out of 5(20 ratings)
106 students

Apache Spark 3+ pour les débutants: la base du big data !

Spark en Java, même principe que Scala/python. Création dataframe, RDD, sparkSQL, streaming et utilisation de databricks
Created byMaxime Gillot
Last updated 1/2026
French

What you'll learn

  • Comprendre l'architecture des applications Spark.
  • Manipuler des données via des DataFrames, RDD, Datasets et vérifier vos connaissances via des exercices.
  • Lire et écrire des données dans tout type de format ( CSV, Parquet, ORC ...).
  • Comprendre l'IHM web SparkUI.
  • Utiliser les actions et les transformations de base.
  • Développer des UDFs (User Defined Functions)
  • Utiliser des fonctions avancées de Spark (Persistance, Accumulators, ...)
  • Développer des tests unitaires dans un contexte Spark.

Course content

14 sections48 lectures4h 36m total length
  • Introduction3:02

    Je me présente et nous allons voir les points clés présent dans cette formation et les différents prérequis.

Requirements

  • Aucune expérience en Spark ou big data n'est requise.

Description

Bienvenue dans la formation en français de apache Spark 3.5 !

Saviez-vous que des centaines de grandes entreprises utilisent apache Spark ? Parmi les contributeur nous retrouvons intel, Facebook, IBM, Netflix...

Si vous souhaitez apprendre Spark, étape par étape, vous êtes dans à la bonne formation. Aucune connaissance Spark ou Scala n'est préalablement requise, nous allons voir ensemble la théorie pour ensuite la mettre en pratique.

A la fin de la formation vous connaitrez :

  • Les concepts importants : DataFrame, Distribution, Transformations, Actions, Plan d’exécution...

  • Comment installer et tester nos développement Spark en local.

  • Manipuler les DataFrame en utilisant les fonctions de base et aussi avancés.

  • Lire et écrire des fichiers de tout type: CSV, JSON, parquet, ORC...

  • Utiliser Spark SQL.

  • Comprendre l'UI Spark.

  • Utiliser le structured streaming (Spark streaming)

  • Utiliser Spark sur Databricks


J'intervient moi-même dans des grandes entreprises en tant qu'expert Spark depuis plusieurs années,  cela me permet d'être critique sur les bonnes pratiques à avoir et d'enrichir la formation avec mes propres expériences.


PS: Le cours utilise Java comme langage de programmation principal, mais n'ayez aucune inquiétude, tous les concepts abordés dans ce cours sont aussi applicables aux autres langages de programmation: Scala et Python


Vous souhaitez utiliser Kafka ou Nifi ? d'autres de mes formations en Français sont disponibles (code de réduction disponible sur mon site internet) :

  • Kafka : Apache Kafka pour débutant

  • Nifi 1.0 : Apache Nifi De A à Z - le Guide complet

  • Nifi 2.0 : Apache Nifi 2 : de Zéro à Héros

Who this course is for:

  • Développeurs intéressés par Apache Spark
  • Data engineer
  • Data scientist intéressés par Apache Spark
  • Développeurs big data