Einführung in Business Intelligence und Big Data

Name: Einführung in Business Intelligence und Big Data
Rating: 4.7 (56 reviews)

OLAP am Beispiel MS SQL Server und Big Data mit Hadoop

Highest Rated

Created byMatthias Wolf

Last updated 2/2024

German

German [Auto],

What you'll learn

Speicherstrukturen
Multidimensionale Cubes & OLAP
Data Mining
Hadoop
MapReduce
HBase
Hive

Course content

5 sections • 29 lectures • 10h 34m total length

1.1 – Der Kurs12:41

4.1 – Hadoop Core Services29:16
4.2 – Dienste11:43
4.3 – Exkurs Linux45:29
8:42 pwd
9:06 ls
10:00 ls -l
10:43 Eigentümer und Gruppe des Ordnereintrags
12:02 Security-String (rwx)
17:00 cd
17:28 ..
18:40 chmod
19:03 Tab: Autoexpansion
20:07 Command histroy
20:54 Chmod mit Oktalzahl
22:45 Wildcard *
23:47 cp
24:16 chown
24:58 sudo
27:10 chgrp
29:53 mkdir
30:21 mv
31:00 .
32:22 rmdir
34:01 rm
35:00 rm -r
35:45 sudo halt
36:38 sudo reboot
36:44 sudo bash
38:20 ^D
39:18 Pamac/Pacman
41:57 Niederfahren
43:23 Shutdown kann hängen bleiben
4.4 – HDFS25:45
4.5 – HDFS-Commands23:51
4.5b – Weitere HDFS-Befehle19:42
4.7 – MapReduce20:02
4.7b – MapReduce: Codebesprechung19:48
4.7c – MapReduce: Der laufende Job9:18
4.8 – HBase17:32
4.8b – HBase Shell20:53

9.1 – Zur Arbeitsumgebung (MS SQL Server Analysis Services; Hadoop & co.)1:03
Business Intelligence
Für den BI-Teil benötigen Sie Zugang zu einem MS SQL Server Standard-, Enterprise- oder DataCenter-Edition mit installierten Analysis Services und AdventureWorksDW-Datenbank. (Die OLTP-Datenbank AdventureWorks empfehle ich zusätzlich, aber nur, um Details zum besseren Verständnis nachschauen zu können. Notwendig ist sie nicht.)
Falls Sie eine Datenbank-Umgebung lokal selbst installieren müssen, empfehle ich die Developer-Edition des MS SQL Server (die gratis zur Verfügung steht und technisch der Enterprise Edition entspricht, ohne das Recht, Produktionsdatenbanken darauf zu betreiben.)
Weiters benötigen Sie Microsofts Entwicklungsumgebung Visual Studio und die Multidimensional Analysis-Erweiterung. (Ein Installations-Video für diese Komponente folgt in Kürze.)
Sollten Sie Schwierigkeiten mit der Installation haben, zögern Sie bitte nicht, mich zu kontaktieren!
Big Data
Für den Big Data-Teil kommen Produkte aus dem Hadoop-Ökosystem zum Einsatz.
Diese entstammen der Unix-/Linux-Welt. Eine Installation unter Windows ist zwar prinzipiell möglich, aber sehr aufwändig (und darüber hinaus nicht sehr stabil), sodass es sich als vorteilhaft erwiesen hat, eine virtuelle Maschine zur Verfügung zu stellen.
Dazu benötigen Sie eine Virtualisierungsumgebung, die Appliances im ova-Format (1.0) importieren kann; empfohlen ist Oracles VirtualBox (mit der die Appliance erstellt wurde). Es handelt sich um eine gewöhnliche Software-Installation.
Die zu importierende ova-Datei finden Sie im Repository aller downloadbaren Materialien. Laden Sie die Datei BIBD.ova herunter und importieren Sie sie im Oracle VM VirtualBox Manager (mit File – Import Appliance).
Die virtuelle Linux-Maschine läuft unter Manjaro-Linux mit XFCE-Desktop und hat alle Komponenten (Hadoop, Hive, HBase, pig etc.) vorinstalliert. Das Userkonto zum Abarbeiten des Kurses heißt ›user‹ (Kennwort ›userpw‹), das Administrationskonto ist ›admin‹ (›adminpw‹).
9.2 – Installation von Visual Studio1:25
Bonuslektion0:07
Udemy-Kurs: Einführung in Datenbanken und SQL
Wolf Online Training, Matthias Wolf
Textbook: Einführung in Datenbanken und SQL
Wolf Online Training, Matthias Wolf
Udemy-Kurs: Programmieren, Java & NetBeans
Wolf Online Training, Matthias Wolf

Requirements

Sicherer Umgang mit dem PC
Installation von Software (Beherrschung und Berechtigung)
SQL-Statements mit Gruppenklauseln lesen können!
Erfahrung mit dem SQL Server als Benutzer und für einfache Administrationsaufgaben
Etwas Erfahrung mit Softwareenwicklung ist kein Nachteil
Wichtig ist nur der Wunsch, sich das Thema zu erschließen!

Description

Der Kurs bietet eine erste Heranführung an Big Data-Themen. Dabei werden zwei Hauptthemenbereiche angerissen:

Business Intelligence

Die Erzeugung und Auswertung von Analysedaten aus operativen Datenbeständen: Erstellen eines multidimensionalen Würfels (›Cube‹). Dieser Würfel wird dann einerseits mit OLAP ad hoc ausgewertet (›Browsen‹) und zum zweiten aus den Daten des Data Warehouse (DWH) im Sinne eines gezielten, proaktiven Marketings, anhand der vorhandenen Daten über bestehende Kunden eine Vorhersage getroffen, welche Empfänger aus einer zugekauften Adressliste mit größter Wahrscheinlichkeit ein Fahrrad kaufen würden (›Data Mining‹).

Dazu dient die AdventureWorksDW-Datenbank, die als Beispiel für ein Data Warehouse fungiert und auf der die Beispiele abgearbeitet werden können.

Eine virtuelle Maschine kann zur Verfügung gestellt werden, die alle nötigen Komponenten vorinstalliert hat.

Hadoop

Der zweite Kursteil betrifft das Big Data Ökosystem ›Apache Hadoop‹ mit Hadoop und seinem Dateisystem HDFS sowie dem Dienst Yarn selbst, einerseits. Darauf wird ein MapReduce Prozess aufgesetzt, der ein Problem verteilt abarbeitet. Zum anderen werden ausgewählte Produkte aus dem Ökosystem einführend vorgestellt, wie Hbase und Hive.

Ziel des gesamten Kurses ist es, erste Einblicke und Eindrücke zu verschaffen, eine Vorstellung zu entwickeln, worum es sich bei Big Data handelt. Ziel ist es nicht, Expertenstatus in einem der genannten Gebiete zu erlangen!

Verwendete Software:

MS SQL Server Analysis Services
Visual Studio Data Tools
Multidimensionales Projekt
AdventureWorksDW

Hadoop
HBase
Hive

ev. Pig, Sqoop & Spark

Über den Autor:

Matthias Wolf ist seit über 30 Jahren selbständig im IT-Bereich und erstellt und betreut vornehmlich Client/Server-Datenbanksysteme und allgemeine Softwareentwicklungen. Er begleitet und berät Kunden bei Eigenprojekten und übernimmt Netzwerkbetreuungen. Außerdem unterrichtet Wolf diese Themen auch seit über 20 Jahren an 2 österreichischen Fachhochschulen und ist Honorarprofessor (FH).

Who this course is for:

Alle, die an einer ersten Einführung in Business Intelligence und Big Data-Techniken interessiert sind.
(Insbesondere TN des Kurses VDB des PIT-Studiengangs der FH des BFI Wien)

Einführung in Business Intelligence und Big Data

What you'll learn

Explore related topics

Course content

Einleitung1 lecture • 13min

Business Intelligence / OLAP9 lectures • 4hr 23min

3 – Data Mining5 lectures • 1hr 53min

4 – Big Data11 lectures • 4hr 3min

9 – Extras3 lectures • 3min

Requirements

Description

Who this course is for: