安心して学べるAWSデータレイク入門:S3からQuickSightまでステップバイステップ
What you'll learn
- データレイクの基礎と全体像について
- スモールスケールでのデータ分析基盤の構築ノウハウ
- Amazon S3にデータを保存する方法
- クエリサービスAmazon Athenaを用いたSQLによる集計方法
- BIツールAmazon QuickSightを使用してデータを可視化する方法
- AWS Glueを利用したETL処理とデータカタログの実装方法
- AWS IAMによるアクセス管理
Requirements
- AWSアカウント:任意(ハンズオンセクションで実際に操作を行いたい場合)
- OSの制限なし
Description
データレイクでデータ分析基盤をはじめるための入門コース
このコースでは、データレイクのコンセプトについての理解から始め、クラウドサービスAWSを実際に操作して統合データ基盤の構築から活用までをステップバイステップで学びます。
まずデータレイクのコンセプトを理解してから、実際に手で動かして学ぶことで、データレイクに関連するAWSサービスの知見を得ることと、データレイクの全体像を効率的に知ることを目的としています。
データ分析のためにはデータレイクってきくけど、そもそもデータレイクって何?や、データ基盤とデータレイクのイメージはわかるけど、具体的にどうしていけばいいのといった課題をAWSを使い学んでいくことができます。
■本コースの内容
データレイクの基本
最初にデータレイクとは何か、そしてデータ基盤としての重要性について詳しく解説します。このセクションを通じて、データレイクの概念を理解し、以降のハンズオンに向けた基礎知識を構築します。
ハンズオンの概要と準備
このセクションでは、データレイクの構築を行うための具体的な手順と、必要な事前準備(IAM設定含む)について説明します。これにより、スムーズに実践的な学習を進められるようになります。
S3 -データをストレージに保存-
Amazon S3を用いたデータの保存方法に焦点を当て、AWSサービスを実際に操作しながらデータのアップロードと管理を学びます。
Glue -データの変換とカタログ化-
AWS Glueを使用して、保存したデータを抽出・変換、ロードし、カタログ化する工程を学びます。このプロセスを通じて、データの整理とアクセスの効率化を理解します。
Athena -データ分析 Part1 アドホックな集計-
Amazon Athenaを利用したデータ分析を実践し、SQLクエリを用いてデータの集計や検索を行います。
QuickSight -データ分析 Part2 ダッシュボードで可視化-
最後に、QuickSightを使用してデータを可視化し、ダッシュボードを作成します。これにより、分析結果を効果的にプレゼンテーションできるようになります。
これらステップで、資料や実践的なセクションを通じて、わかりやすくイメージしやすい内容になっています。
また、本コースはGUIベースの操作を中心に進めるため、技術的な深い知識がなくても効率的に学習できます。
コースを通じて、データレイクの全体像を掴み、データ保存から活用までの一連の流れを実装することが目標です。
完了時には、データレイクに関する基本的な知識と技術が身についているはずです。
データエンジニアリングの世界を楽しみましょう!
Who this course is for:
- データレイクの基本概念を学びたい初心者の方
- AWSでスモールなデータ基盤構築を検討しているデータエンジニア
- データレイクをビジネスに活用し、簡単な分析を試みたいと考える非エンジニアの方
- AWSのサービス(S3, Glue, Athena, QuickSight)を使ってみたい方
Instructor
フリーランスのデベロッパーです。
Webアプリケーションおよびデータ(集計・基盤)のシステム開発の経験があります。
【経歴】
自社開発の企業でWebエンジニアとしてシステム開発を経験後、フリーランスエンジニアとして独立。
現在は主にクライアントからの案件の対応や、個人開発に取り組んでいます。
【スキルセット】
<経験業務>
Webアプリケーション(WebサービスやECサイト)の設計・開発
SQLとBIツールを用いた集計
クラウドサービスを用いたデータ分析基盤構築
<技術>
PHP, JavaScript, PostgreSQL, AWS, GCP他
<保有資格>
OSS-DB Gold
OSS-DB Silver