Spark und Python für Big Data und Data Science mit PySpark
4.2 (90 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
1,075 students enrolled

Spark und Python für Big Data und Data Science mit PySpark

Lerne Apache Spark 2.3 mit Python einzusetzten (mit Machine Learning und Streaming)
Bestseller
4.2 (90 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
1,075 students enrolled
Last updated 6/2020
German
Current price: $126.99 Original price: $194.99 Discount: 35% off
7 hours left at this price!
30-Day Money-Back Guarantee
This course includes
  • 12.5 hours on-demand video
  • 8 articles
  • 9 downloadable resources
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
Training 5 or more people?

Get your team access to 4,000+ top Udemy courses anytime, anywhere.

Try Udemy for Business
What you'll learn
  • Verwende Python und Spark zusammen, um Big Data zu analysieren.
  • Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
  • Arbeite an Consulting-Projekten, die reale Situationen nachahmen
  • Kundenabwanderung mit Logistischer Regression klassifizieren
  • Spark mit Entscheidungsbäumen für die Klassifizierung verwenden
  • Lernen, wie Sparks Gradient Boosted Trees verwendet wird
  • Verwende MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
  • Einrichtung von Amazon Web Services EC2 für Big Data-Analyse
  • Erfahren, wie Du AWS Elastic MapReduce Service verwenden kannst
  • Erstelle einen Spam-Filter mit Spark und Natural Language Processing
  • Verwende Spark Streaming, um Tweets in Echtzeit zu analysieren
Course content
Expand all 89 lectures 12:43:20
+ Einführung in den Kurs
7 lectures 28:08

Herzlich Willkommen in diesem Kurs!

In dieser Lektion erhältst du wichtige Hinweise rund um den Kurs! Bitte überspringe diese Lektion nicht, wenn dies dein erster Kurs mit uns ist!

Hinweise zum Kurs
02:57
Kurs Übersicht
05:29

Hier kannst du schon mal die Materialien zum Kurs (Notebooks, Merkblätter) herunterladen, um sie später für den Kurs zur Verfügung zu haben. :-)

Kursmaterialien
01:01
Häufig gestellte Fragen
01:01
Big Data Übersicht
07:32
Spark Übersicht
09:12
+ Alternative 1: Lokale Spark + Python Installation
6 lectures 34:53
Willkommen zur lokalen PySpark Einrichtung
00:43

So kannst du PySpark, Jupyter Notebook, Anaconda und Python auf deinem Windows Computer installieren.

!!! MAC und Linux Nutzer können diese Lektion überspringen !!!

Windows - PySpark Installation
10:54
Mac + Linux - Häufige Probleme bei der Installation mit Mac und Linux
00:23

So könnt ihr die Jupyter Notebooks, Anaconda und Python auf eurem MAC oder Linux  Computer installieren.

!!! Windows Nutzer können diese Lektion überspringen !!!

MAC- Lokale Python Installation
15:15
MAC - Lokale PySpark Installation
07:28
Linux - Lokale PySpark Installation
00:09
+ Python Crashkurs
8 lectures 01:20:43
Python Crashkurs
00:18
Einführung in den Python Crashkurs
02:12
Jupyter Notebook Übersicht
06:36
Python Crashkurs Teil 1
17:26
Python Crashkurs Teil 2
14:10
Python Crashkurs Teil 3
13:53
Python Crashkurs Übungen
06:22
Python Crashkurs Übungen - Lösungen
19:46
+ Spark DataFrame Grundlagen
8 lectures 01:28:56
Willkommen zu den DataFrames
00:42
Einführung in DataFrame Grundlagen
03:46
Spark DataFrame Grundlagen Teil 1
14:10
Spark DataFrame Grundlagen Teil 2
11:55

Learn some basic operations with Spark 2.0

Spark DataFrame Operationen
13:40
GroupBy
18:18
Timestamps
12:19
+ Spark DataFrame Projekt Übung
5 lectures 53:55
DataFrame Projekt Aufgabe
04:01
DataFrame Projekt Lösungen
28:22
Spark DataFrames Beratungsprojekt - Aufgabe
05:33
Spark DataFrames Beratungsprojekt - Lösungen
15:32
+ Einführung in Machine Learning mit MLlib
4 lectures 32:15
Willkommen zum Machine Learning Abschnitt
00:33
Machine Learning Einführung
16:21
Einführung in Machine Learning und ISLR
02:30
Machine Learning mit Spark und Python mit MLlib
12:51
Machine Learning Quiz
4 questions
+ Lineare Regression
6 lectures 01:09:51
Lineare Regression Dokumentation Beispiel
17:18
Regression Evaluierung
07:00
Lineare Regression Beispiel Code Along
17:54
Lineare Regression Beratungsprojekt Aufgabe - Lösungen
19:29
+ Logistische Regression
5 lectures 01:01:54
Logistische Regression Theorie
08:56
Logistische Regression Dokumentation Beispiel
14:18
Logistische Regression Code Along
20:56
Logistische Regression Beratungsprojekt - Lösungen
13:29
+ Entscheidungsbäume und Random Forests
6 lectures 50:53
Entscheidungsbäume Einführung
06:25
Baum Methoden Dokumentationsbeispiel
13:10
Baum Methoden Code Along - Teil 1
10:21
Baum Methoden Code Along - Teil 2
08:11
Baum Methoden Beratungsprojekt Aufgabe - Lösung
09:13
+ K-means Clustering
5 lectures 44:23
K-Means-Clustering Einführung
05:38
K-Means-Clustering Dokumentationsbeispiel
09:35
K-Means-Clustering Code Along
13:35
K-Means-Clustering Beratungsprojekt - Aufgabe - Lösungen
12:21
Requirements
  • Allgemeine Programmierkenntnisse in jeder Sprache (vorzugsweise Python)
  • 20 GB freier Speicherplatz auf Deinem lokalen Computer (oder alternativ eine starke Internetverbindung für AWS)
Description

Lerne die neueste Big Data Technologie - Spark! Und lerne es mit einer der beliebtesten Programmiersprachen, Python!

Eine der wertvollsten technologischen Kompetenzen ist die Fähigkeit, große Datenmengen zu analysieren. Dieser Kurs wurde speziell dafür entwickelt, Dich auf eine der besten Technologien für diese Aufgabe, Apache Spark, vorzubereiten! Die Top-Technologie-Unternehmen wie Google, Facebook, Netflix, Airbnb, Amazon, NASA und mehr verwenden alle Spark, um ihre Big-Data-Probleme zu lösen! Spark kann bis zu 100x schneller als Hadoop MapReduce ausgeführt werden, was zu einer Explosion der Nachfrage nach dieser Fähigkeit geführt hat!

Dieser Kurs vermittelt die Grundlagen mit einem Crash-Kurs in Python und lehrt weiterhin, wie man Spark DataFrames mit der  Spark 2.0-Syntax verwendet! Sobald wir das besprochen haben, werden wir sehen, wie man die MLlib Machine Library mit der DataFrame-Syntax und Spark verwendet. Während jeder Lektion bekommst Du Übungen und simulierte Beratungs-Projekte, die Dich direkt in eine reale Situation bringen, in der Du deine neuen Fähigkeiten einsetzen kannst, um ein echtes Problem zu lösen!

Wir befassen uns auch mit den neuesten Spark-Technologien, wie Spark SQL, Spark Streaming und erweiterten Modellen wie Gradient Boosted Trees!


    "Der Kurs hat ein sehr gutes Level und als Anfänger in Big Data komme ich sehr gut mit. Der Kursleiter erklärt alles sehr genau und man kann ihm sehr gut folgen." (★★★★★ W. Surala)


Nachdem Du diesen Kurs absolviert hast, kannst Du selbstbewusst Spark und PySpark in Deinen Lebenslauf schreiben! Dieser Kurs hat auch eine volle 30 Tage Geld-zurück-Garantie!

Wenn Du bereit bist, in die Welt von Python, Spark und Big Data einzutauchen, dann ist dies der richtige Kurs für Dich!

Who this course is for:
  • Jemand, der Python kennt und gerne die Verwendung für Big Data lernen würde
  • Jemand, der mit einer anderen Programmiersprache vertraut ist und Spark lernen möchte