
8:42 pwd
9:06 ls
10:00 ls -l
10:43 Eigentümer und Gruppe des Ordnereintrags
12:02 Security-String (rwx)
17:00 cd
17:28 ..
18:40 chmod
19:03 Tab: Autoexpansion
20:07 Command histroy
20:54 Chmod mit Oktalzahl
22:45 Wildcard *
23:47 cp
24:16 chown
24:58 sudo
27:10 chgrp
29:53 mkdir
30:21 mv
31:00 .
32:22 rmdir
34:01 rm
35:00 rm -r
35:45 sudo halt
36:38 sudo reboot
36:44 sudo bash
38:20 ^D
39:18 Pamac/Pacman
41:57 Niederfahren
43:23 Shutdown kann hängen bleiben
Business Intelligence
Für den BI-Teil benötigen Sie Zugang zu einem MS SQL Server Standard-, Enterprise- oder DataCenter-Edition mit installierten Analysis Services und AdventureWorksDW-Datenbank. (Die OLTP-Datenbank AdventureWorks empfehle ich zusätzlich, aber nur, um Details zum besseren Verständnis nachschauen zu können. Notwendig ist sie nicht.)
Falls Sie eine Datenbank-Umgebung lokal selbst installieren müssen, empfehle ich die Developer-Edition des MS SQL Server (die gratis zur Verfügung steht und technisch der Enterprise Edition entspricht, ohne das Recht, Produktionsdatenbanken darauf zu betreiben.)
Weiters benötigen Sie Microsofts Entwicklungsumgebung Visual Studio und die Multidimensional Analysis-Erweiterung. (Ein Installations-Video für diese Komponente folgt in Kürze.)
Sollten Sie Schwierigkeiten mit der Installation haben, zögern Sie bitte nicht, mich zu kontaktieren!
Big Data
Für den Big Data-Teil kommen Produkte aus dem Hadoop-Ökosystem zum Einsatz.
Diese entstammen der Unix-/Linux-Welt. Eine Installation unter Windows ist zwar prinzipiell möglich, aber sehr aufwändig (und darüber hinaus nicht sehr stabil), sodass es sich als vorteilhaft erwiesen hat, eine virtuelle Maschine zur Verfügung zu stellen.
Dazu benötigen Sie eine Virtualisierungsumgebung, die Appliances im ova-Format (1.0) importieren kann; empfohlen ist Oracles VirtualBox (mit der die Appliance erstellt wurde). Es handelt sich um eine gewöhnliche Software-Installation.
Die zu importierende ova-Datei finden Sie im Repository aller downloadbaren Materialien. Laden Sie die Datei BIBD.ova herunter und importieren Sie sie im Oracle VM VirtualBox Manager (mit File – Import Appliance).
Die virtuelle Linux-Maschine läuft unter Manjaro-Linux mit XFCE-Desktop und hat alle Komponenten (Hadoop, Hive, HBase, pig etc.) vorinstalliert. Das Userkonto zum Abarbeiten des Kurses heißt ›user‹ (Kennwort ›userpw‹), das Administrationskonto ist ›admin‹ (›adminpw‹).
Udemy-Kurs: Einführung in Datenbanken und SQL
Wolf Online Training, Matthias Wolf
Textbook: Einführung in Datenbanken und SQL
Wolf Online Training, Matthias Wolf
Udemy-Kurs: Programmieren, Java & NetBeans
Wolf Online Training, Matthias Wolf
Der Kurs bietet eine erste Heranführung an Big Data-Themen. Dabei werden zwei Hauptthemenbereiche angerissen:
Business Intelligence
Die Erzeugung und Auswertung von Analysedaten aus operativen Datenbeständen: Erstellen eines multidimensionalen Würfels (›Cube‹). Dieser Würfel wird dann einerseits mit OLAP ad hoc ausgewertet (›Browsen‹) und zum zweiten aus den Daten des Data Warehouse (DWH) im Sinne eines gezielten, proaktiven Marketings, anhand der vorhandenen Daten über bestehende Kunden eine Vorhersage getroffen, welche Empfänger aus einer zugekauften Adressliste mit größter Wahrscheinlichkeit ein Fahrrad kaufen würden (›Data Mining‹).
Dazu dient die AdventureWorksDW-Datenbank, die als Beispiel für ein Data Warehouse fungiert und auf der die Beispiele abgearbeitet werden können.
Eine virtuelle Maschine kann zur Verfügung gestellt werden, die alle nötigen Komponenten vorinstalliert hat.
Hadoop
Der zweite Kursteil betrifft das Big Data Ökosystem ›Apache Hadoop‹ mit Hadoop und seinem Dateisystem HDFS sowie dem Dienst Yarn selbst, einerseits. Darauf wird ein MapReduce Prozess aufgesetzt, der ein Problem verteilt abarbeitet. Zum anderen werden ausgewählte Produkte aus dem Ökosystem einführend vorgestellt, wie Hbase und Hive.
Ziel des gesamten Kurses ist es, erste Einblicke und Eindrücke zu verschaffen, eine Vorstellung zu entwickeln, worum es sich bei Big Data handelt. Ziel ist es nicht, Expertenstatus in einem der genannten Gebiete zu erlangen!
Verwendete Software:
MS SQL Server Analysis Services
Visual Studio Data Tools
Multidimensionales Projekt
AdventureWorksDW
Hadoop
HBase
Hive
ev. Pig, Sqoop & Spark
Über den Autor:
Matthias Wolf ist seit über 30 Jahren selbständig im IT-Bereich und erstellt und betreut vornehmlich Client/Server-Datenbanksysteme und allgemeine Softwareentwicklungen. Er begleitet und berät Kunden bei Eigenprojekten und übernimmt Netzwerkbetreuungen. Außerdem unterrichtet Wolf diese Themen auch seit über 20 Jahren an 2 österreichischen Fachhochschulen und ist Honorarprofessor (FH).