Data Science, Apache Spark & Python: Analysiere echte Daten!
4.6 (86 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
1,277 students enrolled
Wishlisted Wishlist

Please confirm that you want to add Data Science, Apache Spark & Python: Analysiere echte Daten! to your Wishlist.

Add to Wishlist

Data Science, Apache Spark & Python: Analysiere echte Daten!

Erlebe Spark, indem du echte Daten analysierst - Geburtsstatistiken, Gletscherdaten, Taxibestellungen, ...
4.6 (86 ratings)
Instead of using a simple lifetime average, Udemy calculates a course's star rating by considering a number of different factors such as the number of ratings, the age of ratings, and the likelihood of fraudulent ratings.
1,277 students enrolled
Created by Jannis Seemann
Last updated 8/2017
German
Curiosity Sale
Current price: $10 Original price: $120 Discount: 92% off
30-Day Money-Back Guarantee
Includes:
  • 7.5 hours on-demand video
  • 6 Articles
  • 1 Supplemental Resource
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
What Will I Learn?
  • Analysiere riesige Datenmengen mit ein paar Zeilen Code in Apache Spark
  • Werte "Big Data" mit einfachem Python Code aus
  • Analysiere echte Daten nicht nur auf deinem Computer, sondern (optional) auch auf einem ganzen Rechencluster
  • Verwende den Beispielcode des Kurses für deine eigenen Projekte
  • Miete dir unzählige Computer in der Amazon-Cloud an, und werte noch größere Datenmassen aus (optional)
  • Fordere dich mit Übungsaufgaben heraus und festige spielerisch dein Wissen
  • Erstelle systematische Auswertungen, die das Potential haben, dein Business zu optimieren
View Curriculum
Requirements
  • Du brauchst einen eigenen Computer. Im Kurs zeige ich dir, wie du alle benötigten Tools unter Windows installierst, die Beispiele funktionieren aber 1:1 auch auf Mac und Linux
  • Du solltest schonmal was programmiert haben. Irgendeine Programmiersprache reicht - am Anfang des Kurses gibt's einen kleinen Python Crashkurs, wo du die wichtigsten Features von Python nochmal wiederholen kannst.
Description

Neu: Für Spark 2.1!

Auswertungen von "Big Data" werden immer wichtiger, Experten werden händeringend gesucht. Du lernst in diesem Kurs die heißeste Technologie, Apache Spark kennen. Dieses wird bereits von unzähligen Unternehmen verwendet, darunter Amazon, eBay, Groupon, TripAdvisor! Lerne jetzt Apache Spark - ganz bequem auf deinem eigenen Computer.

In diesem Kurs wertest du echte Daten aus. Dadurch macht dieser Kurs nicht nur richtig viel Spaß, die Beispiele sind auch besonders anschaulich und bereiten dich perfekt vor - sei es weil du selbst ein paar Daten auswerten möchtest, oder du dich für einen Job als Data Scientist bewerben möchtest!

✓ Verstehe die Spark Basics: Das Resilient Distributed Dataset
✓ Entwickle Spark - Programme in Python
✓ Fordere dich mit Übungsaufgaben heraus und festige nebenher dein Wissen
✓ Analysiere auf deinem Computer riesige Datenmengen mit ein paar Zeilen Code in Apache Spark
✓ Lasse ein echtes Spark - Cluster auf der Amazon Cloud (Elastic Map Reduce) laufen (optional)
✓ Ändere den Beispielcode aus diesem Kurs ab und analysiere noch schneller deine eigenen Daten

Nach Abschluss dieses Kurses kannst Datensätze eigenständig auswerten und visualisieren - und hast das schon zig mal gemacht. Du hast Gletscherstatistiken analysiert, Taxi - Daten visualisiert, Häufigkeit von Wörter in einem eBook bestimmt, sowie Geburtsstatistiken der USA ausgewertet. Dadurch bist du perfekt für eigenständige Auswertungen vorbereitet, und kannst z.B. deinen Chef mit aussagekräftigen Analysen beeindrucken!

Who is the target audience?
  • Software-Entwickler, die sich weiterbilden möchten und große Datenmengen auswerten möchten
  • Wenn du noch nie was programmiert hast, ist dieser Kurs noch nichts für dich. Schau dir dann z.B. meinen Python - Kurs an!
  • Wenn du im Job größere Datenmengen verarbeiten musst, ist Spark da einfach das beste Tool für. Schau dir dann auf jeden Fall diesen Kurs an!
  • Wenn du dich auf eine Karriere als Data-Scientist vorbereiten möchtest, ist dieser Kurs ein gutes Training dafür
Students Who Viewed This Course Also Viewed
Curriculum For This Course
64 Lectures
07:30:36
+
Hier starten
3 Lectures 12:35

Download der Kursmaterialien
00:07

+
Grundlagen
5 Lectures 47:00

Einführung: Jupyter Notebook
11:12

Refresher: Python
13:31

Grafiken zeichnen mit Matplotlib (+ Aufgabe)
11:50

Grafiken zeichnen mit Matplotlib (Lösung)
03:06
+
Spark & RDD (Teil 1)
11 Lectures 01:14:14
Du bekommst einen Fehler beim Erstellen vom SparkContext()?
00:11

Einführung: Resilient Distributed Dataset
10:07

Exkurs: Python und Lambda - Funktionen
12:23

Map, Union und .collect()
09:25

Daten filtern, Daten zählen
03:29

CSV - Datei einlesen und verarbeiten
14:00

Aufgabe: Auswerten von Flughafen - Daten
00:17

Auswerten von Flughafendaten
2 questions

Bonus: Airport - Daten als Diagramm visualisieren
06:58

Aufgabe: Auswerten von Flughafendaten (Lösung)
04:33

Daten weiterverarbeiten (map, sum)
06:19

Berechnungen beschleunigen: Caching verwenden
06:32
+
Spark & RDD (Teil 2)
10 Lectures 54:19
Refresher: Tupel in Python
04:21

Daten aggregieren (reduceByKey)
12:19

Beispiel: Daten aggregieren (+ Aufgabe)
10:25

Beispiel: Daten aggregieren (Lösung)
02:44

Daten sortieren (sortByKey)
05:37

Airport: Aufgabe
00:14

Airport: Aufgabe
1 question

Airport: Aufgabe (Musterlösung)
04:22

flatMap() vs. map()
06:34

Aufgabe: Goethe Faust
00:31

Aufgabe: Goethe Faust
1 question

Aufgabe: Goethe Faust (Lösung)
07:12
+
Spark SQL
13 Lectures 01:31:14
Einführung: Spark SQL
06:25

Exkurs: Operatoren überladen + Spark
07:10

DataFrames typisieren und Summe berechnen
10:08

Aufgabe: Wie viele Babys mit dem Vornamen "Lucia" gibt es?
05:43

Aufgabe: Wie viele Babys mit dem Vornamen "Lucia" gibt es?
3 questions

Lösung: Wie viele Babys mit dem Vornamen "Lucia" gibt es?
06:58

Spalten auswählen und umbenennen
07:23

Daten gruppieren
10:55

Projekt: Gletscher Daten einlesen
09:18

Projekt: Gletscher Daten aggregieren
06:25

Gletscher Daten visualisieren (+Aufgabe)
07:17

Gletscher Daten visualisieren (Aufgabe)
1 question

Gletscher Daten visualisieren (Lösung)
03:17

DataFrames & RDD
05:53

Spark SQL per SQL ansteuern
04:22
+
Projekt Spark SQL: Taxi - Daten aus New York
9 Lectures 01:06:59
Projekt: Einführung
01:38

Einlesen der Daten
11:22

Frage: Zu welcher Uhrzeit werden am meisten Taxis benötigt?
10:49

Aufgabe: An welchem Wochentag werden am meisten Taxis benötigt?
00:17

Aufgabe: An welchem Wochentag werden am meisten Taxis benötigt?
1 question

Lösung: An welchem Wochentag werden am meisten Taxis benötigt?
03:57

Daten auf Karte visualisieren: Einlesen und filtern
09:54

Daten auf Karte visualisieren: Pixel generieren
10:31

Daten auf Karte visualisieren: Karte zeichen
15:22

Daten visualisieren
1 question

Lösung: Was ist das auf der Karte?
03:09
+
Spark in der Cloud
7 Lectures 59:32
Einführung
10:34

Script vorbereiten
08:47

Registrierung & erste Schritte
09:05

Spark auf AWS ausführen
09:58

Spark auf AWS ausführen
12:20

Performance im Cluster
06:13

Schlussworte: Cloud
02:35
+
Bonus: Wie kannst du an unbekannte Daten rangehen?
5 Lectures 41:36
Wie gehst du an unbekannte Daten ran?
06:36

Konzept: Standardabweichung
19:30

Lösung: Übung Standardabweichung berechnen
02:18

Gletscher Daten auswerten
04:26

Gletscher Daten visualisieren (Histogramm)
08:46
+
Schlussworte
1 Lecture 03:10
Wie geht es jetzt weiter?
03:10
About the Instructor
Jannis Seemann
4.5 Average rating
3,250 Reviews
18,104 Students
21 Courses
unterrichtet 21 Kurse auf Udemy

Online-Lehrer und erfahrener Webprogrammierer aus Überzeugung

Hi, ich bin Jannis! Mit 14 habe ich meine ersten Webseiten entwickelt. Programmierung ist seitdem meine absolute Leidenschaft.

Begeisterter Programmierer seit der Jugend
Nach dem Abitur und der Teilname an zwei Endrunden im Bundeswettbewerb Informatik habe ich als Volljähriger mein erstes Praktikum in einem großen IT-Konzern in den USA absolviert.

Eigene Firma für professionelle Webentwicklung
Als mittlerweile studierter Informatiker und selbstständiger Unternehmer setze ich erfolgreich Webprojekte für meinen Kunden um und teile mein Wissen und meine Erfahrung in aktuell zwölf Kursen.

Dozent mit breitem Verständnis
Ruhig, verständlich, gründlich und nachvollziehbar möchte ich erklären ich, was auf den ersten Blick sehr kompliziert erscheint. Ich lehre einsteigerfreundliche Sprachen wie Python, bekannte Frameworks wie jQuery und NodeJS für die Entwicklung komplexer, interaktiver Webseiten.

Tiefes Verständnis von Programmierkonzepten
Mir macht es Freude, euch Programmiersprachen beizubringen. Dabei ist mir wichtig, dass ihr die Konzepte dahinter versteht. Dann erklärt sich auch fast von selbst, warum an der einen oder anderen Stelle euer Programm so oder anders geschrieben wird.