Wprowadzenie do data science w języku Python - Pandas
What you'll learn
- instalacja i konfiguracja środowiska
- wprowadzenie do Pandas
- manipulacja danymi
- czyszczenie danych
- analiza i wizualizacja danych
- łączenie danych
- importowanie i exportowanie danych (csv, excel, txt, html, sas7bdat)
- operacje na strukturach danych (grupowanie, agregacja, tabele przestawne)
- porównanie do języka SQL
- 3 x Case Study (Amazon Reviews, Google Apps Data, NASDAQ)
Requirements
- ukończone kursy ze ścieżki Python Developer na tym koncie instruktorskim
- podstawowa znajomość języka programowania Python
- zrozumienie podstawowych koncepcji statystyki:
- podstawowa wiedza na temat struktur danych
- znajomość podstawowych operacji na danych
Description
Kurs "Wprowadzenie do data science w języku Python - Pandas" to kompletne źródło wiedzy dla osób, które chcą rozpocząć swoją podróż w świecie analizy danych i nauki o danych (data science). W trakcie kursu uczestnicy nauczą się korzystać z jednej z najważniejszych bibliotek Pythona dla analizy danych - Pandas.
Kurs jest podzielony na kilka modułów, które stopniowo wprowadzają uczestników w świat analizy danych. Pierwszy moduł skupia się na podstawach Pythona i Pandas, takich jak instalacja i konfiguracja środowiska. Kolejne moduły omawiają podstawowe operacje na danych przy użyciu Pandas. Następnie uczestnicy poznają bardziej zaawansowane funkcje Pandas, takie jak przekształcanie i czyszczenie danych, obsługa danych tekstowych, a także łączenie i grupowanie danych.
W kolejnych modułach kursu uczestnicy nauczą się tworzyć różne typy wykresów i wizualizacji danych, dzięki którym będą mogli prezentować wyniki swojej pracy w sposób atrakcyjny i zrozumiały dla innych.
Pod koniec kursu, uczestnicy będą mieli możliwość zastosowania zdobytych umiejętności w praktyce, pracując nad prawdziwymi zestawami danych w trzech różnych przypadkach użycia (case studies).
Kurs "Wprowadzenie do data science w języku Python - Pandas" jest doskonałym punktem wyjścia dla wszystkich, którzy chcą zrozumieć, jak przetwarzać i analizować duże ilości danych, a następnie wykorzystywać te dane do podejmowania decyzji biznesowych. Bez względu na to, czy planujesz karierę jako analityk danych, inżynier danych, czy data scientist, ten kurs da Ci solidne podstawy, na których będziesz mógł zbudować swoją przyszłą karierę.
Pandas: Twój mocny sprzymierzeniec w analizie danych!
Biblioteka Pandas to potężne narzędzie do manipulacji i analizy danych w języku Python. Pandas zapewnia łatwy w użyciu i elastyczny interfejs, który umożliwia efektywną pracę z różnymi rodzajami danych, takimi jak tabele, arkusze kalkulacyjne, pliki CSV, bazy danych itp.
Kilka kluczowych cech biblioteki Pandas:
Struktury danych: Pandas wprowadza dwie główne struktury danych: Series i DataFrame. Series to jednowymiarowa struktura danych podobna do tablicy lub kolumny w arkuszu kalkulacyjnym. DataFrame to dwuwymiarowa struktura danych, która przypomina tabelę bazy danych, składającą się z wierszy i kolumn.
Wczytywanie danych: Pandas oferuje funkcje do łatwego wczytywania danych z różnych formatów, takich jak pliki CSV, Excel, bazy danych SQL, JSON i wiele innych. Można również wczytać dane bezpośrednio z Internetu.
Indeksowanie i filtrowanie: Pandas umożliwia indeksowanie i filtrowanie danych na podstawie różnych kryteriów. Można wykonywać operacje takie jak wybieranie kolumn i wierszy na podstawie ich nazw, wartości lub warunków logicznych.
Operacje na danych: Pandas dostarcza szereg funkcji do przetwarzania i transformacji danych. Można wykonywać operacje matematyczne, statystyczne, łączenia, grupowania, sortowania, usuwania duplikatów itp. na danych.
Obsługa brakujących danych: Pandas zapewnia mechanizmy do obsługi brakujących danych. Można z łatwością sprawdzać, usuwać lub zastępować brakujące wartości w danych.
Analiza danych: Pandas oferuje wiele funkcji do analizy danych. Można obliczać statystyki opisowe, wykonywać agregacje danych, grupować dane, stosować funkcje do całych kolumn itp. Biblioteka umożliwia również wykonywanie zaawansowanych operacji na danych, takich jak łączenie, łączenie, transformacja i wiele innych.
Wizualizacja danych: Pandas integruje się z innymi bibliotekami, takimi jak Matplotlib i Seaborn, co umożliwia wizualizację danych w formie wykresów, histogramów, diagramów punktowych i innych.
Biblioteka Pandas jest niezwykle popularna w społeczności analizy danych w języku Python i jest szeroko stosowana w dziedzinach takich jak data sicence, finanse, ekonomia, badania społeczne, bioinformatyka i wiele innych.
Who this course is for:
- programiści, którzy chcą rozpocząć pracę w dziedzinie analizy danych i data science
- analitycy danych, którzy chcą rozwijać swoje umiejętności w zakresie manipulacji i analizy danych za pomocą biblioteki Pandas
- studenci i absolwenci kierunków związanych z informatyką, statystyką, matematyką lub naukami pokrewnymi, którzy chcą zdobyć podstawy data science i nauczyć się używać Pandas jako narzędzia do analizy danych
- osoby pracujące w dziedzinie biznesowej, marketingu, finansów lub innych dziedzinach, które chcą nauczyć się wykorzystywać dane do podejmowania informowanych decyzji i zrozumienia trendów w danych
- każdy, kto ma podstawową wiedzę programistyczną i chce poznać możliwości biblioteki Pandas w kontekście analizy danych
Instructor
EN
Python Developer/AI Enthusiast/Data Scientist/Stockbroker
Enthusiast of new technologies, particularly in the areas of artificial intelligence, the Python language, big data and cloud solutions. Graduate of postgraduate studies at the Polish-Japanese Academy of Information Technology in the field of Computer Science and Big Data specialization. Master's degree graduate in Financial and Actuarial Mathematics at the Faculty of Mathematics and Computer Science at the University of Lodz. Former PhD student at the faculty of mathematics. Since 2015, a licensed Securities Broker with the right to provide investment advisory services (license number 3073). Lecturer at the GPW Foundation, conducting training for investors in the field of technical analysis, behavioral finance, and principles of managing a portfolio of financial instruments.
Founder at e-smartdata
PL
Data Scientist, Securities Broker
Jestem miłośnikiem nowych technologii, szczególnie w obszarze sztucznej inteligencji, języka Python big data oraz rozwiązań chmurowych. Posiadam stopień absolwenta podyplomowych studiów na kierunku Informatyka, specjalizacja Big Data w Polsko-Japońskiej Akademii Technik Komputerowych oraz magistra z Matematyki Finansowej i Aktuarialnej na wydziale Matematyki i Informatyki Uniwersytetu Łódzkiego. Od 2015 roku posiadam licencję Maklera Papierów Wartościowych z uprawnieniami do czynności doradztwa inwestycyjnego (nr 3073). Jestem również wykładowcą w Fundacji GPW prowadzącym szkolenia dla inwestorów z zakresu analizy technicznej, finansów behawioralnych i zasad zarządzania portfelem instrumentów finansowych. Mam doświadczenie w prowadzeniu zajęć dydaktycznych na wyższej uczelni z przedmiotów związanych z rachunkiem prawdopodobieństwa i statystyką. Moje główne obszary zainteresowań to język Python, sztuczna inteligencja, web development oraz rynki finansowe.
Założyciel platformy e-smartdata
IG: e_smartdata