Udemy
    •  
    •  
    •  
    •  
    •  
    •  
    •  
    •  
Turn what you know into an opportunity and reach millions around the world.
Learn More
Your cart is empty.
Keep shopping
Big Data, Hadoop oraz MapReduce w języku Python
Highest Rated
Rating: 4.6 out of 5(82 ratings)
884 students

Big Data, Hadoop oraz MapReduce w języku Python

Zaawansowane przetwarzanie Big Data z wykorzystaniem Hadoop, MapReduce i języka Python!
Last updated 4/2025
Polish

What you'll learn

  • paradygmat programowania MapReduce do rozwiązań Big Data
  • omówienie podstawowych elementów ekosystemu Hadoop
  • budowanie MapReduce Jobs w oparciu o bibliotekę MRJob
  • debugging MapReduce Jobs
  • uruchomienie programów MapReduce lokalnie
  • uruchomienie programów MapReduce z wykorzystaniem chmury - Amazon Web Services (AWS)
  • usługa Amazon Elastic MapReduce i zarządzanie klastrami Hadoop
  • analiza zawartości tekstowej Iliady
  • analiza danych dotyczących linii lotniczych
  • analiza danych dotyczących ruchu taksówek
  • analiza danych dotyczących recenzji produktów na sklepie internetowym Amazon
  • praktyczne zastosowania Big Data - przykład użycia technik NLP w przetwarzaniu języka naturalnego

Course content

14 sections70 lectures7h 48m total length
  • Wprowadzenie do Big Data3:49
  • Big Data - Intro0:55
  • Big Data - początki i historia4:14
  • The 5 V's of Big Data4:06
  • Big Data - przykłady zastosowań11:22

Requirements

  • Ukończone kursy ze ścieżki Python Developer na tym koncie instruktorskim
  • Ukończone kursy ze ścieżki Data Scientist na tym koncie instruktorskim
  • Podstawowa wiedza o danych i plikach tekstowych
  • Chęć poznania technologii Big Data

Description

W dobie eksplozji danych, umiejętność pracy z technologiami Big Data staje się jedną z najbardziej pożądanych kompetencji na rynku pracy. Ten kurs został stworzony z myślą o osobach, które chcą zrozumieć, jak przetwarzać ogromne zbiory danych w rozproszonym środowisku przy użyciu Pythona — jednego z najpopularniejszych języków programowania w świecie analizy danych.

W trakcie kursu poznasz podstawy ekosystemu Hadoop, dowiesz się, czym jest HDFS (Hadoop Distributed File System), oraz nauczysz się, jak działa model programowania MapReduce. Zdobędziesz praktyczne umiejętności poprzez implementację własnych zadań MapReduce w Pythonie, bez konieczności używania Javy.

Kurs zawiera również:

  • Wprowadzenie do analizy danych w kontekście Big Data

  • Konfigurację środowiska Hadoop w chmurze

  • Tworzenie i uruchamianie zadań MapReduce przy użyciu mrjob

  • Praktyczne case studies z przetwarzania dużych zbiorów danych tekstowych

Nie musisz mieć wcześniejszego doświadczenia z Hadoopem — kurs krok po kroku przeprowadzi Cię przez wszystkie etapy konfiguracji, teorii i praktyki. To idealne wprowadzenie do świata Big Data dla analityków, programistów oraz osób, które chcą rozszerzyć swoje kompetencje o nowoczesne technologie danych. Zacznij swoją przygodę z Big Data już dziś i opanuj przetwarzanie danych na skalę, jakiej wcześniej nie znałeś!


Hadoop – Skalowalne przetwarzanie wielkich zbiorów danych

Hadoop to otwartoźródłowa platforma służąca do rozproszonego przechowywania i przetwarzania ogromnych ilości danych na klastrach komputerów. Składa się z takich komponentów jak HDFS (rozproszony system plików) oraz MapReduce (model przetwarzania danych), co pozwala na efektywne zarządzanie danymi w środowiskach Big Data. Hadoop zapewnia skalowalność, odporność na awarie i elastyczność, będąc fundamentem dla wielu nowoczesnych systemów analitycznych.


mrjob – MapReduce w Pythonie bez bólu głowy

mrjob to biblioteka Python umożliwiająca łatwe pisanie i uruchamianie zadań MapReduce na dużych zbiorach danych. Obsługuje lokalne środowiska, klastry Hadoop oraz Amazon EMR, pozwalając na szybkie przejście od prototypowania do skalowania w chmurze. mrjob upraszcza pracę z MapReduce dzięki przejrzystej składni i automatycznej obsłudze wielu szczegółów technicznych, co czyni ją doskonałym narzędziem dla analityków i inżynierów danych.

Who this course is for:

  • Analitycy danych i Data Scientists
  • Big Data Engineers
  • Inżynierowie danych (Data Engineers)
  • Programiści Pythona
  • Administratorzy systemów i DevOps
  • Studenci kierunków informatycznych / danych
  • Entuzjaści Big Data
  • Osoby przygotowujące się do pracy w branży IT / Data