1.
データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか?
2.
トレーニングデータとテストデータをランダムに分割する際、データが時間依存性を持つ場合に最も注意すべき点は次のうちどれですか?
3.
データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか?
4.
欠損データの削除を行う際に、重要な注意点は次のうちどれですか?
5.
データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか?
6.
次のうち、データのスケーリングを行う方法として正しいものはどれですか?
7.
欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか?
8.
カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか?
9.
大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか?
10.
カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか?
11.
データの標準化と正規化の違いとして正しいものはどれですか?
13.
外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか?
14.
時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか?
15.
ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか?
16.
データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか?
17.
データのバイアスを取り除くための適切な手法は次のうちどれですか?
18.
カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか?
19.
データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか?
20.
大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか?
21.
データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか?
22.
時系列データの分析において、データのトレンドを除去するための手法はどれですか?
23.
欠損値がMCAR(Missing Completely at Random)ではなくMAR(Missing at Random)の場合に推奨される欠損値処理方法は次のうちどれですか?
24.
カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか?
25.
データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか?
26.
One-Hot Encodingを使用した場合に、次元数が増加しすぎる(次元の呪い)を防ぐための対策として適切なものは次のうちどれですか?