Einführung in Business Intelligence und Big Data
What you'll learn
- Speicherstrukturen
- Multidimensionale Cubes & OLAP
- Data Mining
- Hadoop
- MapReduce
- HBase
- Hive
Requirements
- Sicherer Umgang mit dem PC
- Installation von Software (Beherrschung und Berechtigung)
- SQL-Statements mit Gruppenklauseln lesen können!
- Erfahrung mit dem SQL Server als Benutzer und für einfache Administrationsaufgaben
- Etwas Erfahrung mit Softwareenwicklung ist kein Nachteil
- Wichtig ist nur der Wunsch, sich das Thema zu erschließen!
Description
Der Kurs bietet eine erste Heranführung an Big Data-Themen. Dabei werden zwei Hauptthemenbereiche angerissen:
Business Intelligence
Die Erzeugung und Auswertung von Analysedaten aus operativen Datenbeständen: Erstellen eines multidimensionalen Würfels (›Cube‹). Dieser Würfel wird dann einerseits mit OLAP ad hoc ausgewertet (›Browsen‹) und zum zweiten aus den Daten des Data Warehouse (DWH) im Sinne eines gezielten, proaktiven Marketings, anhand der vorhandenen Daten über bestehende Kunden eine Vorhersage getroffen, welche Empfänger aus einer zugekauften Adressliste mit größter Wahrscheinlichkeit ein Fahrrad kaufen würden (›Data Mining‹).
Dazu dient die AdventureWorksDW-Datenbank, die als Beispiel für ein Data Warehouse fungiert und auf der die Beispiele abgearbeitet werden können.
Eine virtuelle Maschine kann zur Verfügung gestellt werden, die alle nötigen Komponenten vorinstalliert hat.
Hadoop
Der zweite Kursteil betrifft das Big Data Ökosystem ›Apache Hadoop‹ mit Hadoop und seinem Dateisystem HDFS sowie dem Dienst Yarn selbst, einerseits. Darauf wird ein MapReduce Prozess aufgesetzt, der ein Problem verteilt abarbeitet. Zum anderen werden ausgewählte Produkte aus dem Ökosystem einführend vorgestellt, wie Hbase und Hive.
Ziel des gesamten Kurses ist es, erste Einblicke und Eindrücke zu verschaffen, eine Vorstellung zu entwickeln, worum es sich bei Big Data handelt. Ziel ist es nicht, Expertenstatus in einem der genannten Gebiete zu erlangen!
Verwendete Software:
MS SQL Server Analysis Services
Visual Studio Data Tools
Multidimensionales Projekt
AdventureWorksDW
Hadoop
HBase
Hive
ev. Pig, Sqoop & Spark
Über den Autor:
Matthias Wolf ist seit über 30 Jahren selbständig im IT-Bereich und erstellt und betreut vornehmlich Client/Server-Datenbanksysteme und allgemeine Softwareentwicklungen. Er begleitet und berät Kunden bei Eigenprojekten und übernimmt Netzwerkbetreuungen. Außerdem unterrichtet Wolf diese Themen auch seit über 20 Jahren an 2 österreichischen Fachhochschulen und ist Honorarprofessor (FH).
Who this course is for:
- Alle, die an einer ersten Einführung in Business Intelligence und Big Data-Techniken interessiert sind.
- (Insbesondere TN des Kurses VDB des PIT-Studiengangs der FH des BFI Wien)
Instructor
Matthias Wolf ist seit über 30 Jahren selbständiger Datenbank- und Softwareentwickler sowie Sachbuchautor. Er unterrichtet diese Themen und allgemeines Software Design seit bald 20 Jahren an zwei österreichischen Fachhochschulen. Seit jeher ist es ihm dabei ein Anliegen, auch Anfängern die Methoden und Konzepte näherzubringen, die hinter den konkreten Problemlösungen stehen, denn nur das ermöglicht jenes tiefere Verständnis, das zu eigenständiger Lösungskompetenz führt.
Udemy betrachtet er als online Akademie, die die Möglichkeit eröffnet, den eigenen Studenten eine Abrundung und Erweiterung zu Präsenzveranstaltungen zu bieten und gleichzeitig high-quality Inhalte einer breiteren Öffentlichkeit zugänglich zu machen.
Wolf ist Honorarprofessor (FH) und hält einen MSc in Geowissenschaften sowie einen BSc in Physik.