
Wstęp do szkolenia, czego się można nauczyć i plan szkolenia.
Definicje danych, analizy danych a także ogólny opis każdego z etapów procesu analizy.
Cztery przykłady zastosowań analizy danych - optymalizacja marketingu, analiza zasobów ludzkich, analiza portfolio klientów, analiza ryzyka
Struktura definicji danych z podziałem na źródłą zewnętrzne i wewnętrzne i format ustrukturyzowany jak i nieustrukturyzowany. Do tego pięć rodzajów analizy: opisowa, diagnostyczna, predykcyjna, nakazowa i adaptacyjna
Szczegóły pięciu etapów w procesie analizy danych wspomagającym decyzje: definicji pytań, ustalenia wymagań, zbierania danych, analizy danych i interpretacji wyników
Wykład na temat znaczenia analizy danych dla biznesu: Pozyskanie właściwych informacji dla organizacji. Udowodnienie wartości w technologii dla biznesu. Istota właściwej analizy dla biznesu. Zbliżenie IT i biznesu. Analiza dużych danych i jej duże znaczenie. Znaczenie analizy big data.
Prognozy rozwoju rynku analizy danych według IDC i Gartner a także opis czynników wpływających na rynek i najnowszych trendów
Metody statystyczne, cele analizy statystycznej, statystyka opisowa a wnioskowanie statystyczne.
Dominanta, Kwartyle, Mediana i Średnia Arytmetyczna
Rozstęp, Wariancja i Odchylenie Standardowe,
Definicja i metody analizy skupień, analizy wariancji i analizy korelacji z przykładami
Definicja prawdopodobieństwa, warunki funkcji prawdopodobieństwa, rozkład normalny - wzory i przykłady
Definicja regresji, modelu regresyjnego i opis regresji liniowej wraz z matematycznymi wzorami
Opis definicji i terminologii związanej z bazami danych i systemami ich zarządzania, a także zastosowania baz danych
Opis trzech modelów danych - koncepcyjnego, logicznego i fizycznego i powiązane trzy poziomy postrzegania danych
Teoria relacyjna, model ER i definicje bazy danych, relacji, atrybutu, schematu relacji, kroki i kluczy. Opis trzech głównych rodzajów powiązań pomiędzy tabelami - relacji: jeden do jeden, jeden do wielu i wiele do wielu.
Przegląd obiektowych i NoSQLowych baz danych, różnice pomiędzy bazą relacyjną a NoSQL. Spójność danych, zapytania i kiedy używać NoSQL?
Definicja i przykładowy proces ładowania hurtowni danych, a także definicja ETL i cele budowy hurtowni danych.
Wielowymiarowy model danych, różnica pomiędzy ROLAP a MOLAP, możliwe operacje na danych wielowymiarowych.
Skąd się biorą olbrzymie ilości danych, czym jest eksploracja danych i co można eksplorować?
Ogólny opis modelu procesu CRISP-DM (Cross-Industry Standard Process for Data Mining)
Opis zadań fazy 1 modelu procesu CRISP-DM: Zrozumienie biznesowe wraz ich rezultatami
Opis zadań fazy 2 i 3 modelu procesu CRISP-DM: Zrozumienie danych i przygotowanie danych wraz ich rezultatami
Opis zadań fazy 4. 5 i 6 modelu procesu CRISP-DM: Modelowanie, Ewaluacja i Wdrożenie wraz ich rezultatami
Definicja jakości danych i opis procesu czyszczenia danych i powiązanych konceptów.
Odkrywanie asocjacji, klasyfikacjia i predykcja, grupowanie, wykrywanie punktów osobliwych, analiza przebiegów czasowych, opisy klas oraz analiza trendów i odchyleń.
Opis dziewięciu praw eksploracji danych stworzonych przez Tom'a Khbaza
Zrozumienie istotności wizualizacji danych, odkrywanie kto wykorzystuje wizualizacje, rozpoznanie cech dobrej wizualizacji i zrozumienie różnic pomiędzy wizualizacjami a infografikami
Który wykres wykorzystać i kiedy? Od czego zacząć? Wybór prostych i efektywnych wykresów. Wskaźniki i karty wyników. Mniej popularne wykresy.
Zawartość i budowa scenorysu. Sekcja 1 - Stan Obecny, Sekcja 2 - Trendy, Sekcja 3 - Prognoza, Sekcja 4 - Co jeśli
Definicja i formy SQLa, Rodzaje poleceń,
Rodzaje danych: numeryczne, łańcuchowe, data/czas i boolean
Pliki i materiały do ćwiczeń
Ściągniecie i instalacja SQLiteStudio, bazy danych Chinook i przegląd struktury bazy danych
Wyciąganie danych z bazy, wyrażenia w zapytaniach SELECT, łączenie łańcuchów znaków
Wykorzystanie WHERE na zmiennych numerycznych i łańcuchach znaków, łączenie warunków AND, OR i IN oraz wartości null.
Agregacja rekordów, sortowanie, funkcje agregujące, wyrażenie HAVING, eliminacja duplikatów.
Łączenie dwóch tabel z INNER JOIN i LEFT JOIN, łączenie więcej niż dwóch tabel, funkcje agregujące w trakcie łączenia tabel.
Filtrowanie i sorrtowanie wierszy dla danych numerycznych, tekstowych i dat
Tworzenie i konfiguracja wykresów - liniowych, słupkowych i kołowych
Tworzenie tabeli przestawnych jednowymiarowych, dwuwymiarowych, filtrowanie i wykresy przestawne
Wykorzystanie menadżera scenariuszy, poszukiwania celu oraz narzędzia do optymalizacji modelu
Opis narzędzi Tableau, QlikView i Power BI i powrównanie ich funkcji w różnych kryteriach - wizualizacji, zaawansowanej analizy i łatwości użycia
Opis środowisk do analizy danych R, Python i SAS i porównanie kosztów, krzywej nauki, wsparcia, operowania danymi, wizualizacji, możliwości statystycznych i zastosowań Big Data
W dzisiejszych czasach różne systemy informatyczne gromadzą i przetwarzają ogromne ilości danych. Umiejętność ich wykorzystania jest koniecznością dla wielu organizacji nie tylko żeby utrzymać przewagę na rynku, ale żeby być w stanie zaspokoić potrzeby ich klientów, dostawców a nawet pracowników.
IDC - duża firma zajmująca się analizą rynku teleinformatycznego - oceniła wartość globalnego rynku zaawansowanej analizy danych w 2016 roku na 130 miliardów dolarów. Co więcej, prognozowany jest wzrost tej wartości do 200 miliardów w 2020 roku. Tworzenie i konsumpcja danych rośnie co roku skokowo, a wraz z tym wzrostem rośnie ilość inwestycji nie tylko w związany z tematem sprzęt, oprogramowanie i usługi, ale także w pracowników z odpowiednią wiedzą i doświadczeniem w dziedzinie analizy danych
Dlaczego potrzebna jest wiedza w dziedzinie analizy danych?
Analityk danych to osoba, której głównym zadaniem jest pozyskiwanie nowych, istotnych informacji i wiedzy z danych pochodzących z różnych źródeł.
Harvard Business Review określił zawód Data Scientist “najbardziej seksownym zawodem XXI wieku”. Żeby odnieść sukces w tej dziedzinie dobrze jest mieć nie tylko wyjątkowe zdolności analityczne i łatwość pracy z liczbami i danymi, ale także wysoka komunikatywność potrzebna w pracy z zespołami biznesowymi. Przydatne zwłaszcza na początku jest wykształcenie programistyczne i znajomość baz danych czy technik eksploracji danych, ale nie jest to konieczne i wielu znakomitych analityków przychodzi z wykształceniem biznesowym lub finansowym.
Zawartość kursu Analiza Danych - Podstawy, Teoria i Praktyka
Kurs jest podzielony na 8 osobnych sekcji zawierających ponad 40 lekcji z wiedzą potrzebną do opanowania podstaw związanych z analizą danych.
Na początku nauczysz się podstawowych definicji związanych z analizą danych a także potrzebnej podstawowej wiedzy z zakresu analizy statystycznej, baz danych i hurtowni danych. Następnie kurs omówi procesy związanie z pozyskaniem, przygotowaniem i czyszczeniem danych. Po tym przejdziemy do właściwych czynności związanych z analizą i eksploracją posiadanych danych. Przejrzymy też dwa najbardziej podstawowe narzędzia, które powinien znać każdy początkujący analityk danych – Excel i SQL. Dla obydwu narzędzi przejrzymy teorię jak i praktyczne zastosowanie. Następnie omówimy wybrane z wielu dostępnych innych narzędzi i programów o których warto wiedzieć. Na koniec zagłębimy się w pięć wybranych obszarów zastosowań analizy danych w dzisiejszych organizacjach.
Po zakończeniu kursu, uczestnik będzie w stanie wskazać gdzie analiza danych może zostać wykorzystania. Jak również zastosować proces i narzędzia w oparciu o Excel i SQL do podstawowej analizy danych w różnych dziedzinach. Nabyta wiedza powinna być wystarczająca, żeby rozpoznać dalsze potrzeby i jeśli potrzeba zaplanować dalszą naukę w oparciu o wybrane narzędzia lub technologię.