DS検定-データサイエンス力(データ準備)-

1. 
カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか?

2. 
One-Hot Encodingを使用した場合に、次元数が増加しすぎる(次元の呪い)を防ぐための対策として適切なものは次のうちどれですか?

3. 
データのバイアスを取り除くための適切な手法は次のうちどれですか?

4. 
データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか?

5. 
カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか?

6. 
データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか?

7. 
データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか?

8. 
ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか?

9. 
トレーニングデータとテストデータをランダムに分割する際、データが時間依存性を持つ場合に最も注意すべき点は次のうちどれですか?

10. 
欠損値がMCAR(Missing Completely at Random)ではなくMAR(Missing at Random)の場合に推奨される欠損値処理方法は次のうちどれですか?

11. 
大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか?

12. 
時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか?

13. 
データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか?

14. 
欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか?

15. 
欠損データの削除を行う際に、重要な注意点は次のうちどれですか?

16. 
外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか?

17. 
データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか?

18. 
時系列データの分析において、データのトレンドを除去するための手法はどれですか?

19. 
データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか?

20. 
大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか?

21. 
データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか?

22. 
カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか?

23. 
次のうち、データのスケーリングを行う方法として正しいものはどれですか?

24. 
データの正規化の目的は何ですか?

25. 
カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか?

26. 
データの標準化と正規化の違いとして正しいものはどれですか?

コメントを残すにはログインしてください。