Data Science: Analiza danych w Python i PANDAS
4.8 (434 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
4,150 students enrolled

Data Science: Analiza danych w Python i PANDAS

Otwórz sobie drzwi do Data Science! Przenieś się na wyższy poziom i pracuj jak profesjonalny analityk danych!
4.8 (434 ratings)
Course Ratings are calculated from individual students’ ratings and a variety of other signals, like age of rating and reliability, to ensure that they reflect course quality fairly and accurately.
4,150 students enrolled
Created by Rafał Mobilo
Last updated 5/2020
Polish
Current price: $104.99 Original price: $149.99 Discount: 30% off
5 hours left at this price!
30-Day Money-Back Guarantee
This course includes
  • 14 hours on-demand video
  • 80 articles
  • 73 downloadable resources
  • Full lifetime access
  • Access on mobile and TV
  • Certificate of Completion
Training 5 or more people?

Get your team access to 4,000+ top Udemy courses anytime, anywhere.

Try Udemy for Business
What you'll learn
  • Samodzielnie zainstalujesz Anacode i Jupyter Notebook
  • Dasz radę rozwiązywać problemy dot. instalacji np. za pomocą linii komend i conda
  • Dowiesz się czym jest PANDAS
  • Będziesz bardzo dobrze znać obiekty PANDAS takie jak: Data Series, Data Frame
  • Będziesz umieć pracować z danymi i wykonywać na nich najważniejsze operacje
  • Będziesz importować i eksportować dane - również do EXCELA
  • Będziesz prezentować dane na wykresach
  • Dane będziesz indeksować, filtrować, wybierać, modyfikować...
  • Zbudujesz grupowania, agregacje i tabele przestawne
  • Będziesz przekształcać dane, modyfikować zawartość całych kolumn, będziesz łączyć dane z wielu kolumn
Course content
Expand all 158 lectures 14:14:27
+ Wprowadzenie
3 lectures 10:23

Kilka wskazówek o tym jak się uczyć na kursie e-learning

Jak się uczyć? (opcjonalne)
02:23
+ Przygotowanie środowiska do analizy danych
15 lectures 01:13:02
  • Pobranie i instalacja Anaconda
  • Testowanie instalacji
Preview 13:12
Instalacja środowiska Anaconda - QUIZ
3 questions
  • Jak pracować z Anaconda Navigator
  • Do czego służy Anaconda Navigator
  • Jak zarządzać pakietami
  • Jak pracować z Anaconda Prompt
  • Kiedy może się przydać Anaconda Prompt
  • Struktura plików i folderów wchodzących w skład instalacji Anaconda
Anaconda Navigator i Anaconda Propmpt - VIDEO
12:24
Anaconda Navigator i Anaconda Propmpt - QUIZ
3 questions
Anaconda Navigator i Anaconda Propmpt - LAB
00:28
  • Gdzie domyślnie Jupyter Notebook zapisuje sktypty
  • Jak wygenerować plik konfiguracyjny dla Jupyter Notebook
  • Jak modyfikować ten plik
  • Jak modyfikować skrót programu Jupyter Notebook
Konfiguracja Jupyter Notebook przez Anaconda Prompt - VIDEO
08:19
Konfiguracja Jupyter Notebook przez Anaconda Prompt - QUIZ
3 questions
Konfiguracja Jupyter Notebook przez Anaconda Prompt - LAB
00:17
GRATIS: Anaconda Prompt Cheat Sheet
00:15
  • Tryby pracy Jupyter Notebook
  • Skróty klawiaturowe trybu edycji
  • Skróty klawiaturowe trybu komend
  • Wyszukiwanie poleceń i help
Praca z Jupyter Notebook - skróty klawiaturowe - VIDEO
12:22
Praca z Jupyter Notebook - skróty klawiaturowe - QUIZ
3 questions
Praca z Jupyter Notebook - skróty klawiaturowe - LAB
00:16
  • Tworzenie eleganckich komentarzy w Jupyter Notebook
  • Korzystanie ze stylu H1, H2, listy punktowanej, listy numerowanej,, wyróżnianie fragmentu tekstu
  • Wstawianie ilustracji
  • Wstawianie odnośników
  • Wstawianie wzrorów zapisanych w LaTeX
Składnia Jupyter Notebook Markdown - VIDEO
09:10
Składnia Jupyter Notebook Markdown - QUIZ
3 questions
Składnia Jupyter Notebook Markdown - LAB
00:22

Jak Jupyter Notebook uruchamia sktypty Python

Jak resetować sesję

Problem z połączeniem do notebooka

Jupyter Notebook od środka - VIDEO
08:41
Jupyter Notebook od środka - QUIZ
3 questions
Jupyter Notebook od środka - LAB
00:26
  • Jak uruchomić conda
  • Jak zaktualizować pojedynczy pakiet, w tym conda
  • Jakie rzeczy są sprawdzane podczas aktualizacji lub instalacji pakietu
  • Jak zainstalować pakiet
  • Dlaczego praca z linią komend jest czasami lepsza od pracy z interfejsem graficznym
Zarządzanie pakietami z linii komend - conda - VIDEO
06:18
Zarządzanie pakietami z linii komend - conda - QUIZ
3 questions
Zarządzanie pakietami z linii komend - conda - LAB
00:10
+ Moduł PANDAS
5 lectures 20:54
Pliki ćwiczeniowe
01:28
  • Jak załadować moduł
  • Standardowo wykorzystywane aliasy
  • Korzystanie z funkcji modułu
  • Korzystanie z funkcji "magicznych"
Preview 10:08
Korzystanie z modułów - QUIZ
3 questions
  • Sposoby prezentacji danych
  • Częste pułapki w analizie danych
  • Narzędzia stosowane do analizy danych
  • Data Series i Data Frame
Preview 08:59
Analiza danych - wprowadzenie - QUIZ
3 questions
+ Data Series
33 lectures 02:26:10
  • Jak utworzyć Data Series z listy
  • Jak utworzyć Data Series z dictionary (hash table)
  • Indeks
Preview 07:17
Ręczne tworzenie Data Series - QUIZ
3 questions
  • Co to jest atrybut
  • Atrybuty size, nbytes, is_unique, is_monotonic, is_monotonic_increasing, is_monotonic_decreasing, dtype, index, values, shape, axes
Atrybuty Data Series - VIDEO
11:26
Atrybuty Data Series - QUIZ
3 questions
Atrybuty Data Series - LAB
00:01
Metody Data Series - Aktualizacja
00:11
  • Co to jest metoda
  • Przykłady prostych metod obiektu Series
  • Metody i podobnie działające indeksy
  • Przekazywanie parametrów do metod
  • Porównanie Data Series z Dictionary
  • Uzyskiwanie pomocy dla metod
Metody Data Series - VIDEO
11:44
Metody Data Series - QUIZ
3 questions
Metody Data Series - LAB
00:01
  • Filtrowanie danych metodą where()
  • Budowanie warunku filtrowania
  • Praca z kopią zwróconych danych
  • Eliminacja wartości NaN
  • Korzystanie z parametru inplace
  • Method chaining i błedy z nim związane
  • Filtrowanie danych wg wartości indeksu
Filtrowanie danych w serii - VIDEO
10:09
Filtrowanie danych w serii - QUIZ
3 questions
Filtrowanie danych w serii - LAB
00:01

Budowanie bardziej złożonych kryteriów filtrowania

Operator & - AND bitowy

Metoda between

Bardziej zaaawansowane filtrowanie - VIDEO
08:21
Bardziej zaaawansowane filtrowanie - QUIZ
3 questions

Zadania znajdują się w załączniku

Bardziej zaaawansowane filtrowanie - LAB
00:01
  • Import danych z pliku
  • Import danych ze schowka
  • Parametry usecols, i squeeze
  • Konwersja kolumny DataFrame do Series
  • Metody head() i tail()
  • Błędy związane z method chaining
Import danych do obiektu Series - VIDEO
15:23
Import danych do obiektu Series - QUIZ
3 questions
Import danych do obiektu Series - LAB
00:01
  • Standardowe metody w pracy z PANDAS
  • type
  • min max
  • len
  • sorter
  • list dict
  • atrybut name
Standardowe metody Pythona a obiekty PANDAS - VIDEO
07:00
Standardowe metody Pythona a obiekty PANDAS - QUIZ
3 questions
Standardowe metody Pythona a obiekty PANDAS - LAB
00:01
  • Sortowanie danych
  • Sortowanie indeksu
  • Parametr ascending
  • Parametr inplace
  • Wskazówki wydajnościowe dot. sortowania serii danych
Preview 07:42
Sortowanie danych w data series - QUIZ
3 questions
  • Działanie operatora in z listami
  • Działanie operatora in z seriami
  • Sprawdzanie czy wartość jest w indeksie lub wartościach serii
Sprawdzanie czy element jest w serii - VIDEO
04:37
Sprawdzanie czy element jest w serii - QUIZ
3 questions
Sprawdzanie czy element jest w serii - LAB
00:01
  • pobieranie wartości po indeksie
  • pobieranie wartości dla kilku wartości indeksu na raz
  • pobieranie zakresu danych
  • pobieranie indeksem ujemnym
Pobieranie wartości po indeksie - VIDEO
05:53
Pobieranie wartości po indeksie - QUIZ
3 questions
Pobieranie wartości po indeksie - LAB
00:01
  • operator [  ]
  • metoda get
  • metoda at[  ]
  • metoda iat[  ]
  • metoda loc[  ]
  • metoda iloc[  ]
  • metoda ix[  ]
Pobieranie wartości z serii - porównanie metod - VIDEO
14:50
Pobieranie wartości z serii - porównanie metod - QUIZ
3 questions

Zadania znajdziesz w załączniku

Pobieranie wartości z serii - porównanie metod - LAB
00:01
  • błędy powstające przy pobieraniu wartości z serii
  • metoda reindex
  • metoda intersection
  • wykorzystanie w/w metod przy wyszukiwaniu wartości w serii
Reindex i intersection - VIDEO
08:55
Reindex i intersection - QUIZ
3 questions
Reindex i intersection - LAB
00:01
  • określanie indeksu podczas importowania danych
  • parametry usecols i index_col
  • korzystanie z indeksu
Określanie indeksu podczas importu - VIDEO
07:07
Określanie indeksu podczas importu - QUIZ
3 questions
Określanie indeksu podczas importu - LAB
00:01
  • metody min max
  • metody idxmin idxmax
  • metody mean, median, std
Więcej metod Data Series - VIDEO
11:35
Więcej metod Data Series - QUIZ
3 questions
Więcej metod Data Series - LAB
00:01
  • Proste operacje arytmetyczne na serii danych
  • Operacje na danych tekstowych
  • Zaawansowane operacje na serii z wykorzystaniem metody apply
  • Metoda apply z wyrażeniem lambda
Modyfikacja serii danych - VIDEO
09:59
Modyfikacja serii danych - QUIZ
3 questions

Zadania znajdziesz w załączniku

Modyfikacja serii danych - LAB
00:01
  • Metoda map łącząca dane z dwóch serii
  • Metoda map łącząca dane z serii z danymi w słowniku
Metoda map - VIDEO
03:42
Metoda map - QUIZ
3 questions

Zadania znajdują się w pliku

Metoda map - LAB
00:01
+ Data Frame
27 lectures 02:36:47
  • Import DataFrame z pliku
  • Co to jest DataFrame
  • Metody head i tail
  • Korzystanie z parametrów usecols i index_col
Preview 06:32
Data Frame - wprowadzenie- QUIZ
3 questions
Metody i atrybuty Data Frame - Aktualizacja
00:08
Metody i atrybuty Data Frame -VIDEO
17:54
Metody i atrybuty Data Frame - QUIZ
3 questions
Metody i atrybuty Data Frame - LAB
00:01
  • Typ kolumny obiektu data frame
  • Wyszukiwanie wiersza po indeksie
  • Wybieranie danych po kolumnie
  • Wybieranie danych po indeksie wiersza i kolumny
  • Częste błędy w pobieraniu danych
  • Wybieranie podzbioru kolumn z obiektu Data Frame
Pobieranie danych z Data Frame - VIDEO
13:18
Pobieranie danych z Data Frame - QUIZ
3 questions
Pobieranie danych z Data Frame - LAB
00:01
  • dodawanie kolumn na końcu Data Frame
  • dodawanie kolumn w dowolnym miejscu
  • usuwanie kolumn poleceniem del
  • usuwanie kolumn i wierszy metodą drop
Dodawanie i usuwanie kolumn - VIDEO
09:18
Dodawanie i usuwanie kolumn - QUIZ
3 questions
Dodawanie i usuwanie kolumn - LAB
00:01
  • metody radzenia sobie z niekompletnymi danymi
  • usuwanie wierszy z brakującymi danymi
  • usuwanie wierszy tylko gdy wszystkie dane są niekompletne - how
  • określnaie jakie dane są wymagane - subset
  • usuwanie kolumn z niekompletnymi danymi - axis = 'columns'
  • wykonywanie zmian w bieżącym obiekcie - inplace
Oczyszczanie danych - dropna() - VIDEO
13:29
Oczyszczanie danych - dropna() - QUIZ
3 questions
Oczyszczanie danych - dropna() - LAB
00:01
  • wypełnianie wszystkich luk tą samą wartością
  • wypełnianie luk w zależności od kolumny
  • oczyszczanie kolumna po kolumnie
  • podstawianie wartości średniej
  • automatyczne metody podstawiania brakujących wartości
Oczyszczanie danych - fillna() - VIDEO
13:10
Oczyszczanie danych - fillna() - QUIZ
3 questions
Oczyszczanie danych - fillna() - LAB
00:01
Sortowanie data frame - VIDEO
10:28
Sortowanie data frame - QUIZ
3 questions
Sortowanie data frame - LAB
00:01
  • uzyskiwanie informacji o typach wykorzystywanych w dataframe metodą info
  • inforamcje o powtarzajacych się wartościach w kolumnie metodą value_counts
  • metoda konwertowania typów astype()
  • typy int32, in64, float64 i category
Kontrola i optymalizacja typów - VIDEO
14:27
Kontrola i optymalizacja typów - QUIZ
3 questions
Kontrola i optymalizacja typów - LAB
00:01
  • co to jest ranking
  • metoda rank
  • parametry metody rank
  • metody nlargest i nsmallest
  • odpowiedniki poleceń uzyskiwane w inny sposób
Ranking - VIDEO
13:23
Ranking - QUIZ
3 questions
Ranking - LAB
00:01
  • budowanie warunku filtra
  • stosowanie warunku filtra
  • łączenie filtrów
  • operatory służące do budowy filtrów
Filtrowanie danych w data frame - VIDEO
14:12
Filtrowanie danych w data frame - QUIZ
3 questions
Filtrowanie danych w data frame - LAB
00:01
  • metoda where
  • porównanie metody where i filtrowania standardowego []
  • metoda query
  • operatory == in oraz and i or
Metody where i query - VIDEO
07:58
Metody where i query - QUIZ
3 questions
Metody where i query - LAB
00:01
  • Porównanie uniwersalnych metod wyszukiwania i testowania danych z isin, isnull, notnull, between
  • Jak działa isin
  • Jak działa isnull
  • Jak działa notnull
  • Jak działa between
Metody isin, isnull, notnull i between - VIDEO
09:36
Metody isin, isnull, notnull i between - QUIZ
3 questions
Metody isin, isnull, notnull i between - LAB
00:01
  • metody pozwalająće determinować unikalność danych w serii
  • obsługa wartości NaN
  • metoda duplicates wykrywająca wartości duplikujące się
  • usuwanie duplikatów metodą drop_duplicates
  • parametr keep
Duplikaty w data frame - VIDEO
12:37
Duplikaty w data frame - QUIZ
3 questions
Duplikaty w data frame - LAB
00:01
+ Modyfikacja danych
12 lectures 01:18:05
  • edycja nazw kolumn obiektu data frame
  • zmiana wartości indeksu pojedynczego wiersza
  • kopiowanie obiektu data frame
Edycja kolumn i indeksu - VIDEO
10:53
Edycja kolumn i indeksu - QUIZ
3 questions
Edycja kolumn i indeksu - LAB
00:01

modyfikacja danych jednej komórki

modyfikacja danych w komórce w oparaciu o bieżącą wartość w tej komórce

modyfikacja danych w wielu wierszach jednocześnie

modyfikacja danych w wielu wierszach jednocześnie z wykorzystaniem bieżącej wartości znajdującej się w komórce

Modyfikacja danych - VIDEO
14:35
Modyfikacja danych - QUIZ
3 questions
Modyfikacja danych - LAB
00:01
  • usuwanie wierszy poleceniem del i drop
  • parametry axis, columns i label
  • dodawanie wierszy metodą append
Dodawanie i usuwanie wierszy - VIDEO
07:41
Dodawanie i usuwanie wierszy - QUIZ
3 questions
Dodawanie i usuwanie wierszy - LAB
00:01
  • metoda set_index
  • metoda reset_index
  • problemy związane z wielokrotną zmianą indeksu
  • wskazówki wydajnościowe na temat budowy dobrego indeksu
Przebudowa indeksu - VIDEO
10:41
Przebudowa indeksu - QUIZ
3 questions
Przebudowa indeksu - LAB
00:01
  • operacje na kolumnach tekstowych
  • wyszukiwanie wierszy w oparciu o dane z kolumn tekstowych
  • zmiana zawartośći kolumn tekstowych
  • dodawanie nowych kolumn w oparciu o istniejące
  • stosowanie funkcji do kolumn
Operacje na kolumnach tekstowych - VIDEO
17:44
Operacje na kolumnach tekstowych - QUIZ
3 questions
Operacje na kolumnach tekstowych - LAB
00:01
  • wybór kolumn do importu
  • nadanie nazw kolumnom
  • optymalizacja danych tekstowych
  • eliminacja NaN
  • optymalizacja danych logicznych
  • optymalizacja danych liczbowych
  • standaryzacja danych
Przygotowanie danych po imporcie - VIDEO
16:24
Przygotowanie danych po imporcie - QUIZ
3 questions
Przygotowanie danych po imporcie - LAB
00:01
+ Multiindex i tabele przestawne
16 lectures 01:23:16
  • definiowanie indeksu w oparciu o wiele kolumn
  • zmiana indeksu
  • sortowanie indeksu ze względu na elementy indeksu
Multiindex - wprowadzenie - VIDEO
10:27
Multiindex - wprowadzenie - QUIZ
3 questions
Multiindex - wprowadzenie - LAB
00:01
  • wyszukiwanie danych wg kolumn indeksu
  • podawanie tylko fragmentu indeksu podczas wyszukiwania
  • pobieranie danych z określonej komórki w data frame
Wyszukiwanie danych w multiindeksie - VIDEO
09:10
Wyszukiwanie danych w multiindeksie - QUIZ
3 questions
Wyszukiwanie danych w multiindeksie - LAB
00:01
  • co to jest transpozycja
  • multiindex na kolumnach
Transpozycja - VIDEO
07:13
Transpozycja - QUIZ
3 questions
Transpozycja - LAB
00:01
  • zmiana multiindeksu po jego utworzeniu
  • operacje na multiindeksie
Swaplevel - VIDEO
08:26
Swaplevel - QUIZ
3 questions
Swaplevel - LAB
00:01
  • konwersja wielopoziomowych kolumn do multiindeksu
  • konwersja multiindeksu do wielopoziomowych kolumn
  • parametr level
  • zmiana dotycząca wielu poziomów jednocześnie
stack i unstack - VIDEO
08:53
stack i unstack - QUIZ
3 questions
stack i unstack - LAB
00:01
  • co to jest tabela przestawna
  • tworzenie tabeli przestawnej
  • parametry index, columns, value, aggfunct
  • wykorzystanie wcześniej poznanych metod w pracy z tabelą przestawną
Pivot table - tabela przestawna - VIDEO
15:59
Pivot table - tabela przestawna - QUIZ
3 questions
Pivot table - tabela przestawna - LAB
00:01
  • Konwersja tabeli przestawnej do postaci zwykłego data frame

  • Parametry: id_var, value_name, var_name i value_vars

  • Porównanie melt i unstack

Polecenie melt - VIDEO
13:11
Polecenie melt - QUIZ
3 questions
Polecenie melt - LAB
00:01
Metadane multiindeksu - VIDEO
09:47
Metadane multiindeksu - QUIZ
3 questions
Metadane multiindeksu - LAB
00:01
+ Grupowanie danych
12 lectures 01:00:10
  • Po co grupujemy dane

  • Jak wykonać przedwstępną analizę danych

  • Jak grupować dane manualnie

  • Wykorzystanie dictionary do przechowywania danych tymczasowych

Wprowadzenie do grupowania - VIDEO
10:58
Wprowadzenie do grupowania - QUIZ
3 questions
Wprowadzenie do grupowania - LAB
00:01
  • Korzystanie z metody groupby

  • Korzystanie z metod first, last i size

  • Przegląd właściwości groups

  • Pobieranie danych z jednej grupy

Metoda groupby - VIDEO
11:20
Metoda groupby - QUIZ
3 questions
Metoda groupby - LAB
00:01
  • Wyznaczanie wartości agregowanych dla grup

  • Wybieranie kolumn do agregacji

  • Różnice między agregacjami liczbowymi  (np. sum) i uniwersalnymi (np count)

  • Analiza zwracanych wartości

Agregacje - VIDEO
09:36
Agregacje - QUIZ
3 questions
Agregacje - LAB
00:01

budowanie wielokolumnowych grup

korzystanie z danych zawartych w multigrupach

pobieranie danych z grupy z multiindexem

Grupowanie a multiindex - VIDEO
05:03
Grupowanie a multiindex - QUIZ
3 questions
Grupowanie a multiindex - LAB
00:01
  • metody wyliczania funkcji agregujących dla grup

  • wyznaczanie funkcji agregującychdla kilku kolumn jednocześnie

  • wyznaczanie kilku funkcji agregujących dla jednej kolumny jednocześnie

Metoda agg() - VIDEO
09:25
Metoda agg() - QUIZ
3 questions
Metoda agg() - LAB
00:01
Przetwarzanie danych z obiektu grupy - VIDEO
13:41
Przetwarzanie danych z obiektu grupy - QUIZ
3 questions
Przetwarzanie danych z obiektu grupy - LAB
00:01
+ Łączenie danych z wielu obiektów data frame
16 lectures 01:37:07
  • Dlaczego dane są rozbijane między wiele obiektów data frame lub wiele tabel

  • Co decyduje o podziale danych

  • Jaka jest logika stojąca za łączeniem danych

  • Prezentacja obiektów wykorzystywanych w dalszych lekcjach

Łączenie danych z wielu obiektów data frame - VIDEO
13:32
Łączenie danych z wielu obiektów data frame - QUIZ
3 questions
Łączenie danych z wielu obiektów data frame - LAB
00:01
  • polecenie append

  • polecenie concat

  • parametr ignore_index

  • łączenie danych o różnych nazwach kolumn


Metody append i concat - VIDEO
13:30
Metody append i concat - QUIZ
3 questions
Metody append i concat - LAB
00:01
  • łączenie danych w oparciu o indeks

  • wybieranie kolumny definiującej złączenie obiektów data frame

  • częste błędy podczas korzystania z metody join

Metoda join - VIDEO
14:49
Metoda join - QUIZ
3 questions
Metoda join - LAB
00:01
  • Łączenie danych w oparciu o dowolną kolumnę

  • Parametr how: inner, outer, left i right

  • Parametr suffixes

  • Parametr indicator

Metoda merge - VIDEO
16:53
Metoda merge - QUIZ
3 questions
Metoda merge - LAB
00:01
  • idea złączenia outer

  • parametr on

  • parametr indicator

  • wartości both, left_only i right_only

  • wyszukiwanie wartości nieistniejących w drugim zbiorze danych

Merge outer - VIDEO
07:51
Merge outer - QUIZ
3 questions
Merge outer - LAB
00:01
  • left join

  • right join

  • left i right join jako wyrażenia równoważne

Left & Right Merge - VIDEO
12:23
Left & Right Merge - QUIZ
3 questions
Left & Right Merge - LAB
00:01
  • parametry left_on i right_on

  • parametr suffixes

  • parametry left_index i right_index

  • parametr sort

Opcje polecenia merge - VIDEO
10:43
Opcje polecenia merge - QUIZ
3 questions
Opcje polecenia merge - LAB
00:01
  • łączenie kilku obiektów dataframe

  • korzystanie z opcji "on" oraz left_on i right_on

  • korzystanie z suffixów pozwalających określić pochodzenie danych

Łączenie trzech i więcej data frame - VIDEO
07:16
Łączenie trzech i więcej data frame - QUIZ
3 questions
Łączenie trzech i więcej data frame - LAB
00:01
+ Wykresy
12 lectures 01:21:41
  • metoda plot

  • rysowanie wszystkich wartośći data frame

  • umieszczanie na wykresie tylko wybranych serii

Metoda plot - VIDEO
07:45
Metoda plot - QUIZ
3 questions
Metoda plot - LAB
00:01
  • Przegląd parametrów dostępnych w metodzie plot

Parametry metody plot - VIDEO
13:17
Parametry metody plot - QUIZ
3 questions
Parametry metody plot - LAB
00:01
  • definiowanie kolorów dla każdej serii oddzielnie

  • korzystanie ze schematów kolorów - colormap

  • korzystanie ze styli budowy wykresów

  • zmiany poszczególnych elementów wykresu

Formatowanie wykresu - VIDEO
10:36
Formatowanie wykresu - QUIZ
3 questions
Formatowanie wykresu - LAB
00:01

Przygotowanie danych do wykresu kołowego

Typowe zastosowanie wykresów kołowych

Parametry metody plot wykorzystywane w wykresach kołowych

Wykres kołowy - VIDEO
15:56
Wykres kołowy - QUIZ
3 questions
Wykres kołowy - LAB
00:01
  • Jak budować wykres kolumnowy i słupkowy

  • Jak budować wykres skrzynkowy (pudełkowy)

  • Jak budować histogram

  • Parametry wpływające na wygląd generowanych wykresów

Wykres słupkowy, skrzynkowy i histogram - VIDEO
14:28
Wykres słupkowy, skrzynkowy i histogram - QUIZ
3 questions
Wykres słupkowy, skrzynkowy i histogram - LAB
00:01
Wykresy scatter, hexbin, area - VIDEO
19:32
Wykresy scatter, hexbin, area - QUIZ
3 questions
Wykresy scatter, hexbin, area - LAB
00:01
Requirements
  • Podstawowa znajomość Python (zobacz kurs "Python dla początkujących")
  • Doświadczenie w analizie danych w innym narzędziu np. Excel lub Google Sheets
  • Komputer z zainstalowanym środowiskiem (kurs zawiera opis instalacji na Windows)
  • Chęć wkroczenia w świat Data Science!
  • Znajomość baz danych - mile widziana, ale niekonieczna
Description

Dlaczego ten kurs?

  • Bo podstawą do stosowania Pythona w Data Science jest właśnie moduł PANDAS. W pierwszym lepszym przykładzie Machine Learning znajdziesz obiekty, które są omawiane tu na tym kursie

  • Bo dane, które wczytujesz i chcesz analizować trzeba najpierw oczyścić i przetworzyć i  w tym również wykorzystuje się PANDAS

  • Bo każda lekcja ma quiz i praktyczne zadania do samodzielnego rozwiązania - zdaniem autora samo patrzenie nie wystarcza żeby się nauczyć - praktyka jest konieczna

  • Bo kurs jest dość szczegółowy - ma ponad 13 godzin nagrań a i tak porusza tylko te najważniejsze aspekty pracy z danymi

  • Bo do kursu masz dołączone materiały do wykonywania ćwiczeń - specjalnie dobrane zbiory pozwalają praktycznie stosować możliwości poznawanych poleceń

  • Bo tylko na takim praktycznym kursie masz szansę rzeczywiście czegoś się nauczyć - a sądzę, że to właśnie Twój cel!

  • Naukę możesz kontynuować na innych kursach tego samego autora

To nie jest kurs dla zupełnie początkujących. Wśród wymogów znajdziesz przynajmniej podstawową znajomość Pythona oraz chociaż ogólną wiedzę o analizie danych. Ale bez obaw!

  • Jeśli chodzi o wiedzę z zakresu programowania w Pythonie – możesz ją zdobyć na kursie „Python dla początkujących”. Jeśli już używasz Pythona, możesz przejrzeć sam spis treści tego kursu i zweryfikować, czy znasz te tematy.

  • Jeśli chodzi o podstawową znajomość analizy danych, mam na myśli typowe czynności, jakie wykonujemy np. w Excelu. Tam też dane się importuje, przetwarza i analizuje. W tym kursie generalnie robimy to samo, ale w zupełnie inny sposób. Dlatego znajomość np. Excela będzie bardzo mile widziana.

  • Po tym kursie możesz kontynuować naukę na kursie tego samego autora "Python dla średnio zaawansowanych"

Kurs dość dokładnie omawia wszystkie tematy i właściwie nie ma w nim teorii. Praktycznie tylko video, quizy i zadania do samodzielnego rozwiązania.

Kurs jest dość intensywny. Każde nagranie skupia się na innym temacie i nie tracimy czasu. Główna zaleta kursu online jest taka, że jeśli chcesz aby Ci coś powtórzyć, to nie musisz o to specjalnie prosić… wystarczy skorzystać z przycisku „cofnij 15 sekund wstecz”. Z kolei jeśli materiał już znasz i chcesz go tylko przesłuchać, możesz zwiększyć lub zmniejszyć jego prędkość. O ile tylko nie denerwuje Cię zmiana głosu na bardziej piskliwy, to… czemu nie – korzystaj!

Zaczynamy od skonfigurowania środowiska. Tutaj jest to zrobione w oparciu o system Windows. Jeżeli korzystasz z Linux lub MacOS, to kroki do wykonania są podobne, ale w materiałach ich nie znajdziesz. Jeśli masz już zainstalowane środowisko u siebie to oczywiście ten blok możesz przerobić pobieżnie. Chcę żeby pracowało Ci się wygodnie, dlatego nie tylko instalujemy Jupyter Notebook, ale jeszcze dodatkowo omawiamy jak pracować z nim wydajnie. Jak go konfigurować, dodawać do niego pakiety, jak korzystać ze skrótów klawiaturowych itp. Wiem, że kiedy „palisz się” do analizy danych ten wstęp może Ci się wydawać przydługawy. Możesz w takim przypadku przeskoczyć część tematów i kontynuować lekcje poświęcone PANDAS, a tu wrócisz później. Zdecydowałem się dodać te lekcje po to, żeby ułatwić Ci pracę z PANDAS na własną rękę. Zwłaszcza te kilka lekcji poświęcone tematyce zaawansowanej konfiguracji  środowiska z linii komend przydadzą się, kiedy napotkasz jakieś problemy, a znajdowane na forach odpowiedzi będą mówiły o instalacji pakietu przez conda…

Żeby dane analizować, trzeba je mieć. Wszystkie pliki prezentowane na kursie jak i potrzebne do rozwiązywania zadań są dołączone do kursu. W większości przypadków podaję też skąd te materiały pochodzą i moim zdaniem ich dystrybucja nie jest zabroniona – korzystaj do woli, albo szukaj innych na własną rękę. W Internecie jest naprawdę mnóstwo ciekawych i darmowych zbiorów.

Potem właściwie zaczynamy najważniejszą część kursu opowiadającą o PANDAS. Pełna nazwa PANDAS to Python and data analysis i logo tego pakietu to kilka wykresików, ale… sam powiedz z czym się graficznie kojarzy nazwa PANDAS…

Kluczowa w PANDAS i analizie danych jest kolumna danych – tutaj zwana Data Series. Ten obiekt trzeba bardzo dobrze poznać, bo inne obiekty i polecenia bardzo mocno go wykorzystują. Kiedy sam uczyłem się PANDAS bardzo mnie to denerwowało, że tyle czasu uczyłem się tylko o przetwarzaniu pojedynczej kolumny, ale uwierz mi – to nie będzie stracony czas.

Potem przechodzimy do zbioru kolumn, co w PANDAS nazywa się Data Frame. Tu będzie już ciekawiej, bo da się obserwować na raz więcej kolumn a więc i więcej danych. Na tym etapie możesz już pomyśleć o budowaniu analiz własnych zbiorów danych.

Dalej opowiemy o modyfikacji danych. Można by myśleć, że przy analizie danych, nie trzeba ich modyfikować i ogólnie chyba rzeczywiście tak jest. Ale warto wiedzieć jak dodać wiersz, kolumnę, przebudować indeks, bo to też metody na przygotowanie danych do analizy.

W następnym etapie jesteśmy gotowi do pierwszych analiz. Indeksy będą mogły już składać się z wielu poziomów, będziemy je przerzucać z wierszy do kolumn i odwrotnie, zbudujemy tabele przestawne, albo właśnie przekształcimy dane z postaci tabeli danych do normalnej tabeli.

Kolejny krok to grupowanie danych i agregacja danych. Posiadając zagregowane dane możesz analizować je w mniejszych fragmentach, a dzięki temu możesz wykrywać zależności w tych danych i ich charakterystyczne dane. Bez tego wszystkie wyniki byłyby uśrednione na cały zbiór danych i przez to najprawdopodobniej zupełnie bez wartości, a tak możesz zobaczyć charakterystyczne cechy  zakupów w poszczególnych regionach czy inne zainteresowania w zależności od wieku i płci itp.

Rzadko kiedy wszystko to, co jest potrzebne jest w jednym miejscu, często jedna sytuacja jest opisywana przez kilka zbiorów danych. Dlatego właśnie mamy specjalną sekcję dotyczącą łączenia danych z różnych źródeł. Myśl o tym jak o łączeniu tabel w bazie danych lub łączeniu arkuszy w skoroszycie.

Kolejny temat to wykresy. Przedstawiamy tu kilka różnych rodzajów wykresów i zmieniamy ich wygląd modyfikując ich mniej i bardziej zaawansowane parametry, ale nie ma co ukrywać – za wykresy w PANDAS odpowiadają funkcje z matplotlib. Informacje z tego kursu będą wystarczające do samodzielnego zbudowania wykresów i zaprezentowania na nich analizowanych danych, ale moduł matplotlib nie jest tutaj omawiany – to duży temat na osobny kurs.

Naukę kończymy dodatkowymi materiałami dotyczącymi pobierania i zapisywania danych na zewnątrz PANDAS, włączając w to dane pobierane z Internetu lub wczytywane i zapisywane w plikach excel.

Zapraszam do nauki. Otwórz sobie drzwi do Data Science!

Who this course is for:
  • Analitycy danych, którzy analizy przeprowadzają w innych narzędziach niż Python i PANDAS
  • Chętni do poważnego zajęcia się Data Science
  • Rozpoczynający naukę Machine Learning i sztucznej inteligencji