最新的Microsoft Data Engineering on Microsoft Azure (DP-203日本語版) - DP-203日本語免費考試真題
次の表に示すリソースを含む Azure サブスクリプションがあります。

storage1 アカウントには、container1 という名前のコンテナーが含まれています。 Container1 コンテナには次のファイルが含まれています。

組み込みのサーバーレス SQL プールで、次のスクリプトを実行します。

次の各ステートメントについて、そのステートメントが true の場合は [はい] を選択します。それ以外の場合は、「いいえ」を選択します。 注: 正しく選択するたびに 1 ポイントの価値があります。


storage1 アカウントには、container1 という名前のコンテナーが含まれています。 Container1 コンテナには次のファイルが含まれています。

組み込みのサーバーレス SQL プールで、次のスクリプトを実行します。

次の各ステートメントについて、そのステートメントが true の場合は [はい] を選択します。それ以外の場合は、「いいえ」を選択します。 注: 正しく選択するたびに 1 ポイントの価値があります。

正確答案:

Explanation:

Azureのメトリックを使用して、Azure StreamAnalyticsジョブを監視しています。
過去12時間の間に、平均透かし遅延が構成された遅延到着許容値よりも一貫して大きいことがわかります。
この動作の考えられる原因は何ですか?
過去12時間の間に、平均透かし遅延が構成された遅延到着許容値よりも一貫して大きいことがわかります。
この動作の考えられる原因は何ですか?
正確答案: B
說明:(僅 Fast2test 成員可見)
eコマーストランザクションの不正を検出するためのワークロードをサポートするために、Azure SynapseAnalytics専用のSQLプール用のデータベースを設計しています。
データは複数のeコマースサイトから結合され、クレジットカード番号などの機密性の高い財務情報を含めることができます。
次の要件を満たすソリューションを推奨する必要があります。
*ユーザーは、不正の可能性のある取引を特定できる必要があります。
*ユーザーは、モデルの潜在的な機能としてクレジットカードを使用できる必要があります。
*ユーザーは実際のクレジットカード番号にアクセスできないようにする必要があります。
推奨事項には何を含める必要がありますか?
データは複数のeコマースサイトから結合され、クレジットカード番号などの機密性の高い財務情報を含めることができます。
次の要件を満たすソリューションを推奨する必要があります。
*ユーザーは、不正の可能性のある取引を特定できる必要があります。
*ユーザーは、モデルの潜在的な機能としてクレジットカードを使用できる必要があります。
*ユーザーは実際のクレジットカード番号にアクセスできないようにする必要があります。
推奨事項には何を含める必要がありますか?
正確答案: A
說明:(僅 Fast2test 成員可見)
Twitterフィードデータレコードのデータ保持ソリューションを設計する必要があります。ソリューションは、顧客の感情分析の要件を満たす必要があります。
ソリューションに含める必要があるAzureストレージ機能はどれですか?
ソリューションに含める必要があるAzureストレージ機能はどれですか?
正確答案: B
說明:(僅 Fast2test 成員可見)
Table1 という名前のテーブルを含む、SA1 という名前の Azure Synapse Analytics 専用 SQL プールがあります。削除された行の割合が高いテーブルを特定する必要があります。あなたは何を走らせるべきですか?
正確答案: A
Azure Synapse Analytics 専用の SQL プールを作成する予定です。
会社のデータ プライバシー規則とキューを実行したユーザーによって定義されている機密情報を返すクエリを識別するためにかかる時間を最小限に抑える必要があります。
ソリューションに含める必要がある 2 つのコンポーネントは?それぞれの正解は、ソリューションの一部を示しています。
注: 正しい選択ごとに 1 ポイントの価値があります。
会社のデータ プライバシー規則とキューを実行したユーザーによって定義されている機密情報を返すクエリを識別するためにかかる時間を最小限に抑える必要があります。
ソリューションに含める必要がある 2 つのコンポーネントは?それぞれの正解は、ソリューションの一部を示しています。
注: 正しい選択ごとに 1 ポイントの価値があります。
正確答案: B,C
說明:(僅 Fast2test 成員可見)
Azure Synapse Analytics 専用 SQL プールにスター スキーマを実装しています。
DimProduct という名前のテーブルを作成する予定です。
DimProduct は、次の要件を満たすタイプ 3 のゆっくりと変化するディメンション (SCO) テーブルである必要があります。
* ProductKey と ProductSourceID という 2 つの列の値は変わりません。
* ProductName、ProductDescription、Color という 3 つの列の値は変更される可能性があります。
次のテーブル定義を完成させるには、列を追加する必要があります。

DimProduct という名前のテーブルを作成する予定です。
DimProduct は、次の要件を満たすタイプ 3 のゆっくりと変化するディメンション (SCO) テーブルである必要があります。
* ProductKey と ProductSourceID という 2 つの列の値は変わりません。
* ProductName、ProductDescription、Color という 3 つの列の値は変更される可能性があります。
次のテーブル定義を完成させるには、列を追加する必要があります。

正確答案: A,D,E
Tablet という名前の Delta Lake ディメンション テーブルを含む Azure Databricks ワークスペースがあります。Table1 はタイプ 2 の緩やかに変化するディメンション (SCD) テーブルです。ソース テーブルから Table1 に更新を適用する必要があります。どの Apache Spark SQL 操作を使用する必要がありますか?
正確答案: B
說明:(僅 Fast2test 成員可見)
英国南部リージョンの Azure Synapse Analytics に Azure ストレージ アカウントとデータ ウェアハウスがあります。
Azure Data Factory を使用して、ストレージ アカウントからデータ ウェアハウスに BLOB データをコピーする必要があります。ソリューションは、次の要件を満たす必要があります。
データが常に UK South リージョンにあることを確認してください。
管理作業を最小限に抑えます。
どのタイプの統合ランタイムを使用する必要がありますか?
Azure Data Factory を使用して、ストレージ アカウントからデータ ウェアハウスに BLOB データをコピーする必要があります。ソリューションは、次の要件を満たす必要があります。
データが常に UK South リージョンにあることを確認してください。
管理作業を最小限に抑えます。
どのタイプの統合ランタイムを使用する必要がありますか?
正確答案: C
說明:(僅 Fast2test 成員可見)
Azure Synapse Analyticsに、Server1という名前のサーバー上のDW1という名前のエンタープライズデータウェアハウスがあります。
DW1の配布ごとに、トランザクションログファイルのサイズを決定する必要があります。
あなたは何をするべきか?
DW1の配布ごとに、トランザクションログファイルのサイズを決定する必要があります。
あなたは何をするべきか?
正確答案: A
說明:(僅 Fast2test 成員可見)
マッピングデータフローを含むAzureDataFactoryパイプラインを作成することを計画しています。
ネストされた配列を持つオブジェクトを含むJSONデータがあります。
JSON形式のデータを表形式のデータセットに変換する必要があります。データセットには、配列内のアイテムごとに1つのトウが必要です。
マッピングデータフローでどの変換方法を使用する必要がありますか?
ネストされた配列を持つオブジェクトを含むJSONデータがあります。
JSON形式のデータを表形式のデータセットに変換する必要があります。データセットには、配列内のアイテムごとに1つのトウが必要です。
マッピングデータフローでどの変換方法を使用する必要がありますか?
正確答案: B
說明:(僅 Fast2test 成員可見)
Azure Synapse Analytics 専用の SQL プールがあります。
データベースを監視して長時間実行されているクエリを監視し、どのクエリがリソースを待機しているかを特定する必要があります。各要件に対してどの動的管理ビューを使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
ノート; 正解ごとに 1 ポイントの価値があります。

データベースを監視して長時間実行されているクエリを監視し、どのクエリがリソースを待機しているかを特定する必要があります。各要件に対してどの動的管理ビューを使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
ノート; 正解ごとに 1 ポイントの価値があります。

正確答案:

Explanation:

Azure サブスクリプションがあります。
ステージング テーブルとディメンション モデルを含む、pool1 という名前の Azure Synapse Analytics 専用 SQL プールにデータ ウェアハウスを構築する予定です。Pool1 には次のテーブルが含まれます。

pool1 のテーブル ストレージを設計する必要があります。ソリューションは、次の要件を満たす必要があります。
Staging.WebSessions へのデータ読み込み操作のパフォーマンスを最大化します。
ディメンション モデルに対するレポート クエリのクエリ時間を最小限に抑えます。
各テーブルにどのタイプのテーブル分散を使用する必要がありますか? 答えるには、適切なテーブル ディストリビューション タイプを正しいテーブルにドラッグします。各テーブル分散タイプは、1 回または複数回使用することも、まったく使用しないこともできます。ペイン間の分割バーをドラッグするか、コンテンツを表示するためにスクロールする必要がある場合があります。
注: それぞれの正しい選択は 1 ポイントの価値があります。

ステージング テーブルとディメンション モデルを含む、pool1 という名前の Azure Synapse Analytics 専用 SQL プールにデータ ウェアハウスを構築する予定です。Pool1 には次のテーブルが含まれます。

pool1 のテーブル ストレージを設計する必要があります。ソリューションは、次の要件を満たす必要があります。
Staging.WebSessions へのデータ読み込み操作のパフォーマンスを最大化します。
ディメンション モデルに対するレポート クエリのクエリ時間を最小限に抑えます。
各テーブルにどのタイプのテーブル分散を使用する必要がありますか? 答えるには、適切なテーブル ディストリビューション タイプを正しいテーブルにドラッグします。各テーブル分散タイプは、1 回または複数回使用することも、まったく使用しないこともできます。ペイン間の分割バーをドラッグするか、コンテンツを表示するためにスクロールする必要がある場合があります。
注: それぞれの正しい選択は 1 ポイントの価値があります。

正確答案:

Explanation:
Box 1: Replicated
The best table storage option for a small table is to replicate it across all the Compute nodes.
Box 2: Hash
Hash-distribution improves query performance on large fact tables.
Box 3: Round-robin
Round-robin distribution is useful for improving loading speed.
Reference: https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse- tables-distribute
Azure Synapse Analytics にエンタープライズ データ ウェアハウスを実装します。
サイズが 10 テラバイト (TB) の大きなファクト テーブルがあります。
受信クエリは、主キーの SaleKey 列を使用して、次の表に表示されるデータを取得します。

テーブルのパフォーマンスを最適化するには、大きなファクト テーブルを複数のノードに分散する必要があります。
どのテクノロジを使用する必要がありますか?
サイズが 10 テラバイト (TB) の大きなファクト テーブルがあります。
受信クエリは、主キーの SaleKey 列を使用して、次の表に表示されるデータを取得します。

テーブルのパフォーマンスを最適化するには、大きなファクト テーブルを複数のノードに分散する必要があります。
どのテクノロジを使用する必要がありますか?
正確答案: E
說明:(僅 Fast2test 成員可見)
Azure Databricksを使用して、DBTBL1という名前のデータセットを開発します。
DBTBL1には、次の列が含まれています。
SensorTypeID
GeographyRegionID
年
月
日
時間
分
温度
風速
他の
GeographyRegionIDごとに異なる毎日の増分ロードパイプラインをサポートするには、データを保存する必要があります。このソリューションでは、ストレージコストを最小限に抑える必要があります。
コードをどのように完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

DBTBL1には、次の列が含まれています。
SensorTypeID
GeographyRegionID
年
月
日
時間
分
温度
風速
他の
GeographyRegionIDごとに異なる毎日の増分ロードパイプラインをサポートするには、データを保存する必要があります。このソリューションでは、ストレージコストを最小限に抑える必要があります。
コードをどのように完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正確答案:

Explanation:
