【実践】dbt完全入門!dbt × SQL × DuckDB超速習コースで最先端ETLとデータモデリングを学ぼう!
What you'll learn
- dbtの基礎知識と開発環境構築、プロジェクト初期化からモデル実行までの一連の流れ
- ステージング→マートの階層型データモデル開発と、各種マテリアライゼーション戦略の使い分け
- ジェネリックテストとカスタムテストによるデータ品質保証、schema.ymlを使った包括的なテスト設計
- Jinjaマクロを活用した動的SQL生成とコード再利用、dbt Utilsパッケージの活用方法
- インクリメンタルモデルによる大規模データの効率的な処理と、スナップショットによる履歴データ管理
- SQLの基本構文
Requirements
- Python がインストールされた環境で簡単なターミナル操作ができれば、SQL から dbt での活用まで一通りを学ぶことができます。
- Mac前提での講座を進めていきますが、Windows環境でも基本的には問題ございません。
Description
データエンジニアリングの世界で急速に普及している dbt(data build tool)を、初心者でも理解できるように基礎から丁寧に解説します。本コースでは、サンプルとなる飲食店の経営データを題材に、SQL と dbt を組み合わせたデータ変換パイプラインの構築方法を実践的に学習します。
まず、SQLの基本、そしてdbt の基本概念と DuckDB を使った開発環境の構築から始め、段階的にスキルを積み上げていきます。ステージング層・中間層・マート層という3層アーキテクチャを実装しながら、データモデリングのベストプラクティスを身につけます。
コースの中盤では、ジェネリックテストとカスタムテストを活用したデータ品質保証の手法を詳しく解説。schema.yml ファイルを使った包括的なテスト設計により、信頼性の高いデータパイプラインを構築できるようになります。
後半では、Jinja テンプレートとマクロを使った高度な技法を習得。動的 SQL の生成、コードの再利用、dbt Utils パッケージの活用など、実務で役立つテクニックを豊富に紹介します。さらに、インクリメンタルモデルによる大規模データの効率的な処理方法や、スナップショット機能を使った履歴データ管理まで、実践的なスキルを幅広くカバーします。
各章では実際にコードを書きながら学習を進めるため、理論と実践のバランスが取れた内容となっています。VSCode の拡張機能を活用した効率的な開発方法も紹介し、すぐに実務で活用できるスキルが身につきます。
Who this course is for:
- データエンジニア・アナリティクスエンジニアになりたい方
- データを使ってファクトベース・技術ベースのアプローチでビジネスに貢献したい意欲のある方
- データアナリストやデータサイエンティストでデータエンジニアリングに興味のある方
Instructors
「データサイエンスやAIの力でつまらない非効率を減らしおもしろい非効率を増やす」がビジョンのWW inc.の代表取締役社長。
日系大手→外資系→AIスタートアップでデータ分析やったりデジタルマーケティングやったりしてきました。
多くの人にもっとデータサイエンスを身近に感じてもらうべく月に10万人が訪れる「スタビジ」というメデイアでデータサイエンスの面白さを発信中。
著書に「データサイエンス大全」「漫画でわかるデジタルマーケティング×データ分析」などがある
「最初からそれを教えてくれればよかったのに!」と思えるような、行間を埋めるような丁寧で論理的な講座作成をモットーにしています。
大手ニュースアプリ → 広告系上場企業 → SalesTech SaaS スタートアップと、メガベンチャーから急成長スタートアップまで幅広い IT 系ドメインでのソフトウェア・データエンジニアとしての経験を活かした、実践的かつ簡潔で本質を凝縮した講座の作成を得意としています。
副業で主にスタートアップ企業様への開発のお手伝いなどもしております。