ホーム > Building Batch Data Analytics Solutions on AWS

Building Batch Data Analytics Solutions on AWS


期間  1日間 時間  9:30~17:30
価格(税込)  77,000円(税込) 主催  トレノケート
形式  講義+実機演習 コースコード  AWC0230V
コース日程が決定次第、ご案内いたします。マイページ会員様は「お気に入り」にご登録いただければ、日程が公開された際にメールで通知が届きます。
詳しくはお問い合わせください。

ワンポイントアドバイス

AWS で大規模パッチデータ分析基盤を構築したい方

企業に存在するビッグデータを活用して大規模パッチデータ分析基盤を構築するニーズが高まっています。このコースでは、Amazon EMR を利用したパッチデータ分析基盤について学習します。

本コースはオンライン対応です

会場が「オンラインLive」または「教室Live配信」の日程はオンラインでご参加いただけます。

  • オンラインLive:受講者の方はオンラインのみとなります。
  • 教室Live配信:教室・オンラインから受講される方が混在します。

★オンラインLiveトレーニングの詳細はこちら

重要なご連絡・ご確認事項

★お申込の皆様へ★

AWS Builder Labs へのサインインについて

このコースは、演習と電子テキストの引き換えを AWS Builder Labs を利用しており、サインインには、AWS Builder ID を利用します。

※Web お申込み時に AWS Builder ID ご登録のメールアドレスをご記載ください。
※AWS Builder ID をお持ちでない場合は、以下のガイドの手順1から4に従って予めご用意ください。

AWS Builder Labs ご利用手順

※あらかじめ「no-reply@awstraining」からのメール受信を許可してください。

●受講前の事前準備作業について

本コースでは、Gilmore社より発行される電子テキストを使用します。

ご受講当日スムーズにテキスト閲覧を開始するために、あらかじめ Bookshelfアカウント登録作業をお済ませください。
すでにアカウントをお持ちの方は、登録アカウントとパスワードでログインができることをご確認ください。

対象者情報

対象者
・データプラットフォームエンジニアを目指すエンジニア
・データ分析パイプラインを構築し、管理するアーキテクトおよびオペレーター
前提条件
□AWS Technical Essentials または Architecting on AWS の受講修了(必須)
□Building Data Lakes on AWS の受講修了(必須)
□クラウドコンピューティングの概念の知識

学習内容の詳細

コース概要
時間のかかる作業を自動化し、ビッグデータ環境を運用・拡張する必要はありませんか? このコースでは、Amazon EMR を使用して、コストとパフォーマンスを最適化するバッチデータ分析ソリューションの構築方法を学習します。
学習目標
●データウェアハウス、データレイク、モダンデータアーキテクチャの機能と利点を説明できる
●Amazon EMR を用いたバッチデータ分析ソリューションの設計をおこない実装できる
●データストレージの最適化と保護に適した手法について説明できる
●分析ワークロードのモニタリングをおこない、問題の特定と修復ができる
学習内容
1. Amazon EMR の概論
  - 分析ソリューションでの Amazon EMR の使用
  - Amazon EMR クラスターのアーキテクチャ
  - コスト管理戦略

2. Amazon EMR を使用したデータ分析パイプライン: 取り込みとストレージ
  - Amazon EMR のストレージの選択肢
  - データ取り込み手法

3. Amazon EMR の Apache Spark を使用した高パフォーマンスのバッチデータ分析
  - Amazon EMR の Apache Spark のユースケース
  - Amazon EMR の Apache Spark のメリット
  - Spark のコンセプト
  - 変換、処理、分析
  - Amazon EMR でのノートブックの使用
  - (ラボ 1)Amazon EMR の Apache Spark を使用した低レイテンシーのデータ分析

4. Amazon EMR と Apache Hive を使用したバッチデータの処理と分析
  - Amazon EMR と Hive を使用したバッチデータ処理
  - 変換、処理、分析
  - (ラボ 2)Amazon EMR と Hive を使用したバッチデータ処理
  - Amazon EMR での Apache HBase の概論

5. サーバーレスデータ処理
  - サーバーレスデータの処理、変換、分析
  - Amazon EMR ワークロードでの AWS Glue の使用
  - (ラボ 3)AWS Step Functions を使用した Spark でのデータ処理のオーケストレーション

6. Amazon EMR クラスターのセキュリティおよびモニタリング
  - EMR クラスターの保護
  - Amazon EMR クラスターのモニタリングとトラブルシューティング

7. バッチデータ分析ソリューションの設計
  - バッチデータ分析のユースケース

実習/演習内容詳細

演習/デモ内容
このコースには演習が含まれており、学習したスキルを試す機会となるとともに、実際の作業環境に応用できるようになります。

ラボ 1: AWS Lake Formation を使用してデータレイクを構築する
ラボ 2: Amazon EMR と Hive を使用したバッチデータ処理
ラボ 3: AWS Step Functions を使用した Spark でのデータ処理のオーケストレーション

コース関連付加情報

ご注意・ご連絡事項

・ご受講前に、電子ブックビューア【BookShelf】のアカウント登録をお済ませください。
・ご受講当日、電子テキスト閲覧用の各種デバイス(スマートフォン、タブレット、ノートPC等)を研修会場へお持ち込みいただいても結構です。