学習内容
|
モジュール 1:データ エンジニアリング タスクとコンポーネント
- データエンジニアの役割
- データソースとデータシンクの違い
- データフォーマット
- Google Cloud におけるストレージソリューションの選択肢
- Google Cloud におけるメタデータ管理の選択肢
- Analytics Hub を使用したデータセットの共有
モジュール 2:データのレプリケーションと移行
- レプリケーションおよび移行アーキテクチャ
- gcloud コマンドラインツール
- データセットの移動
- Datastream
モジュール 3:抽出とロードのデータ パイプライン パターン
- 抽出とロード (EL) のアーキテクチャ
- bq コマンドラインツール
- BigQuery Data Transfer Service
- BigLake
モジュール 4:抽出、ロード、変換のデータ パイプライン パターン
- 抽出、ロード、変換 (ELT) アーキテクチャ
- BigQuery を使用した SQL スクリプトの作成とスケジューリング
- Dataform
モジュール 5:抽出、変換、ロードのデータ パイプライン パターン
- 抽出、変換、ロード (ETL) アーキテクチャ
- ETL データパイプラインのための Google Cloud GUI ツール
- Dataproc を使用したバッチデータ処理
- ストリーミングデータ処理の選択肢
- Bigtable とデータパイプライン
モジュール 6:自動化の手法
- パイプラインの自動化パターンと選択肢
- Cloud Scheduler と Workflows
- Cloud Composer
- Cloud Run Functions
- Eventarc
|