Spark und Python für Big Data und Data Science mit PySpark
What you'll learn
- Verwende Python und Spark zusammen, um Big Data zu analysieren.
- Lerne, wie Du die neue Spark 2.0 DataFrame-Syntax verwenden
- Arbeite an Consulting-Projekten, die reale Situationen nachahmen
- Kundenabwanderung mit Logistischer Regression klassifizieren
- Spark mit Entscheidungsbäumen für die Klassifizierung verwenden
- Lernen, wie Sparks Gradient Boosted Trees verwendet wird
- Verwende MLlib von Spark, um leistungsstarke Machine Learning-Modelle zu erstellen
- Einrichtung von Amazon Web Services EC2 für Big Data-Analyse
- Erfahren, wie Du AWS Elastic MapReduce Service verwenden kannst
- Erstelle einen Spam-Filter mit Spark und Natural Language Processing
- Verwende Spark Streaming, um Tweets in Echtzeit zu analysieren
Requirements
- Allgemeine Programmierkenntnisse in jeder Sprache (vorzugsweise Python)
- 20 GB freier Speicherplatz auf Deinem lokalen Computer (oder alternativ eine starke Internetverbindung für AWS)
Description
Lerne die neueste Big Data Technologie - Spark! Und lerne es mit einer der beliebtesten Programmiersprachen, Python!
Eine der wertvollsten technologischen Kompetenzen ist die Fähigkeit, große Datenmengen zu analysieren. Dieser Kurs wurde speziell dafür entwickelt, Dich auf eine der besten Technologien für diese Aufgabe, Apache Spark, vorzubereiten! Die Top-Technologie-Unternehmen wie Google, Facebook, Netflix, Airbnb, Amazon, NASA und mehr verwenden alle Spark, um ihre Big-Data-Probleme zu lösen! Spark kann bis zu 100x schneller als Hadoop MapReduce ausgeführt werden, was zu einer Explosion der Nachfrage nach dieser Fähigkeit geführt hat!
Dieser Kurs vermittelt die Grundlagen mit einem Crash-Kurs in Python und lehrt weiterhin, wie man Spark DataFrames mit der Spark 2.0-Syntax verwendet! Sobald wir das besprochen haben, werden wir sehen, wie man die MLlib Machine Library mit der DataFrame-Syntax und Spark verwendet. Während jeder Lektion bekommst Du Übungen und simulierte Beratungs-Projekte, die Dich direkt in eine reale Situation bringen, in der Du deine neuen Fähigkeiten einsetzen kannst, um ein echtes Problem zu lösen!
Wir befassen uns auch mit den neuesten Spark-Technologien, wie Spark SQL, Spark Streaming und erweiterten Modellen wie Gradient Boosted Trees!
"Der Kurs hat ein sehr gutes Level und als Anfänger in Big Data komme ich sehr gut mit. Der Kursleiter erklärt alles sehr genau und man kann ihm sehr gut folgen." (★★★★★ W. Surala)
Nachdem Du diesen Kurs absolviert hast, kannst Du selbstbewusst Spark und PySpark in Deinen Lebenslauf schreiben! Dieser Kurs hat auch eine volle 30 Tage Geld-zurück-Garantie!
Wenn Du bereit bist, in die Welt von Python, Spark und Big Data einzutauchen, dann ist dies der richtige Kurs für Dich!
* Dieser Kurs erfordert, dass du dir Docker-Desktop bzw. die Toolbox und evtl. Anaconda herunterlädst. Wenn du Udemy-Business-Nutzer bist, kläre bitte vor dem Herunterladen mit deinem Arbeitgeber, ob die Installation erlaubt ist.
Who this course is for:
- Jemand, der Python kennt und gerne die Verwendung für Big Data lernen würde
- Jemand, der mit einer anderen Programmiersprache vertraut ist und Spark lernen möchte
Instructors
In einer Welt der Veränderung gibt es keine Ressource, die wertvoller ist als Bildung. Sie befähigt die Menschen, auch in einer komplexen Umwelt selbstbestimmt ihren Weg zu gehen. Wichtig ist, was jeder einzelne kann. Die Digitalisierung steckt voller Chancen für bessere Bildung: individuelleres Lernen, innovative Lehrmethoden und aktuellere Lehrmittel. Daher möchte ich nicht länger zuschauen, sondern an besserer Bildung für Jeden Mitwirken! Dabei sind die folgenden 3 Punkte mein konkreter Beitrag:
1. Verfügbarkeit von individuellem Lernen, innovativen Lehrmethoden und aktuellere Lehrmittel durch einen günstigen Zugang auf Udemy für jeden zu schaffen, mit Kursen, die normalerweise mehrere hundert oder tausend Euro kosten!
2. Studierende an der Hochschule fit für die Digitale Zukunft zu machen und ein Bewusstsein für die Datenanalyse zu schaffen.
3. Mit dem Datamics Team Firmen beraten und strategisch wohlbedacht zu positionieren.
Für mehr Informationen gerne auf unserer Datamics Webseite vorbeischnuppern. Von unserem Data Science Podcast, über aktuelle Blogposts, bis hin zu Karriere-vorranbringendem Karriereguide, Du wirst sicher fündig.
Lebenslauf:
Dr. René Brunner hat als Big Data Scientist und Engineer schon seit über 15 Jahre (damals hatte Big Data Science noch andere Bezeichnungen) zahlreiche Big Data Projekte und Workshops bei Unternehmen wie IBM, SAP, Audi, Bosch, Daimler, Havas Media, GFK, Philip Morris, Sony und Vodafone gemacht.
Während seiner Promotion hat er dezentrale und skalierende Marktplätze aufgebaut und mit der Hilfe von Machine Learning Algorithmen wie zum Beispiel Clustering und Decision Trees optimiert. Die Ergebnisse konnte er in zahlreichen Artikeln in führenden Fachzeitschriften und auf internationalen Konferenzen veröffentlichen. Dabei hat er mehrere Auszeichnungen und Stipendien erhalten. Du kannst ihn gerne auf Linkedin oder Xing direkt kontaktieren sowie seine Veröffentlichungen unter Google Scholar einsehen.
Als Head of Study Programs für Digital Technologies and coding an der Macromedia Hochschule für Medien und Kommunikation freut er sich seit 8 Jahren (zunächst als Dozent und später als Professor) den Studierenden den digitalen Wandel in Form von Programmierung, Analysen, Best Practice Case Studies und Anwendungsbeispiele beizubringen. Davor hat er schon mehrere Jahre an verschiedenen Universitäten im Bereich Computer Science unterrichtet.
Er hat ein Diplom in Wirtschaftsinformatik an der Universität Mannheim, einen Master in Wirtschaftsinformatik an der französischen Université Nice Sophia-Antipolis, eine Promotion in Computer Science an der Technischen Universität Kataloniens sowie an der Cardiff University im Bereich Big Data Science und Machine Learning.
Außerdem kannst du ihn auch gerne nach persönlichen Trainings, Gruppentrainings in München oder als Sprecher auf Konferenzen anfragen.
Wir sind Datamics...
...und wir sind deine kompetente Anlaufstelle für fundiertes Online-Lernen im Bereich Data Science. Unsere breitgefächerten Online-Kurse decken eine breite Palette von Themen ab, darunter Python-Programmierung, SQL, Bewerbungstraining, Datenvisualisierung mit Dash, Business Analytics und vieles mehr.
Unsere Kooperation mit unserem amerikanischen Partner Jose Portilla ermöglicht es uns, stets topaktuelle Informationen aus der globalen Data Science-Szene in unsere Kurse einzubringen. Es ist auch diese enge Zusammenarbeit, die gewährleistet, dass unsere Kursteilnehmer Zugang zu den neuesten Entwicklungen und bewährten Methoden haben.
Hinter Datamics stehen kompetente Persönlichkeiten, allen voran Dr. René Brunner, ein ausgewiesener Experte mit über 15 Jahren Erfahrung auf dem Gebiet der Data Science. René ist nicht nur in der Praxis erfolgreich tätig, sondern teilt sein Wissen auch als Autor und Dozent an verschiedenen Hochschulen.
Unser Team setzt sich aus vielseitigen Experten zusammen, die aus verschiedenen Fachbereichen stammen und ihre Erfahrungen in die Entwicklung unserer Kurse einfließen lassen. Die Kombination aus tiefgreifendem Fachwissen und praktischer Erfahrung gewährleistet, dass unsere Kurse nicht nur theoretisch fundiert sind, sondern auch reale Anwendungen und Herausforderungen abbilden.
Unsere obersten Ziele sind:
Individuelles Lernen und innovative Lehrmethoden für alle zugänglich machen: Wir sind bestrebt, hochwertige Bildung zu erschwinglichen Preisen anzubieten, um Menschen auf der ganzen Welt zu ermöglichen, ihre Fähigkeiten im Bereich Data Science zu erweitern.
Förderung der digitalen Transformation: In einer zunehmend datengetriebenen Welt möchten wir Bewusstsein für die Datenanalyse schaffen und so viele Menschen wie möglich fit für die Anforderungen der digitalen Ära machen.
Verantwortung: Wir wollen dass du erfolgreich wirst. Wir möchten eine Verbindung mit dir herstellen, um deine berufliche Laufbahn erfolgreich zu gestalten. Lass uns gemeinsam an deinen Zielen arbeiten!
Du kannst uns auf Udemy, über unsere Webseite, LinkedIn, Facebook, YouTube, Medium oder direkt erreichen.
Darüber hinaus steht Prof. Dr. René Brunner für interessante Vorträge oder als Sprecher auf Konferenzen zur Verfügung.
Wir laden dich herzlich ein, Teil der Datamics-Community zu werden und gemeinsam die Welt der Data Science zu erkunden.
Pierian Training stands as a premier provider in the realms of Data Science and Machine Learning education, offering both in-person and virtual instructor-led training tailored for enterprises. Explore our comprehensive profile to discover a wide range of courses designed to enhance your professional skills and organizational capabilities. Feel free to contact us if you have any questions in the link on our profile!