DS検定-データエンジニアリング力(データ収集)-

1. 
クラウド上でのデータ収集において、サーバーレスアーキテクチャの利点は次のうちどれですか?

2. 
データ収集において、APIを使用してデータを取得する際に重要な要素はどれですか?

3. 
ウェブスクレイピングを行う際に、ウェブサイトへのリクエストに使用するプロトコルは何ですか?

4. 
センサーデータの収集において、MQTTプロトコルが適している理由として正しいものは次のうちどれですか?

5. 
データ収集において、リアルタイム処理とバッチ処理の主な違いは何ですか?

6. 
大量のセンサーデータをリアルタイムに収集する際に、データの処理を分散させることでパフォーマンスを向上させるために使用される技術は次のうちどれですか?

7. 
データ収集において、収集されたデータの信頼性を確保するために行うべき最初のステップは何ですか?

8. 
データ収集において、「ログデータ」を収集する主な目的として最も適切なものは次のうちどれですか?

9. 
データ収集において、ウェブスクレイピングが禁止されているサイトのデータを収集する場合、適切な対応として最も正しいものは次のうちどれですか?

10. 
ウェブスクレイピングを行う際、ウェブサイトが提供するデータの取り扱いに関して考慮すべき法的要件は次のうちどれですか?

11. 
データ収集時に、Webページから必要な情報を抽出するために使われる技術はどれですか?

12. 
以下のシナリオに最も適したデータ収集手法はどれですか?

  • リアルタイムで生成されるクリックストリームデータを効率的に収集し、分析に利用したい。
  • 大規模なトラフィックを処理できる耐障害性のあるシステムが必要である。

13. 
REST APIを使ってデータを収集する際に、データの形式として一般的に使用されるものは次のどれですか?

14. 
データ収集時に、ETLの「E」のプロセスに関連する主なタスクはどれですか?

15. 
センサーデータの収集に使用される技術として、最も適切なのはどれですか?

16. 
データ収集において、ETLパイプラインが失敗した際の一般的な対応は次のうちどれですか?

17. 
APIを利用して大量のデータを収集する際、APIリクエスト数を効率的に管理するための一般的な手法は次のうちどれですか?

18. 
データ収集プロセスにおける「バックプレッシャー」とは、どのような現象を指しますか?

19. 
データ収集プロセスで、ストリーミングデータを収集する際に「バックプレッシャー」を管理するために有効な方法は次のうちどれですか?

20. 
データ収集の段階で、欠損データが発生した場合に行うべき処理は次のうちどれですか?

21. 
データ収集において、定期的にデータを収集するために使用されるツールはどれですか?

22. 
データ収集のプロセスで、「サンプリング」が使用される主な理由として適切なものは次のうちどれですか?

23. 
ロギングツールを使ってデータ収集を行う際、一般的に記録される情報は次のどれですか?

24. 
データ収集において、ETLの「T」は何を意味しますか?

25. 
ストリーミングデータをリアルタイムで収集する際、使用される技術はどれですか?

26. 
データ収集において、「データ品質」を向上させるために重要な要素は次のうちどれですか?

コメントを残すにはログインしてください。