1.
データ加工において、データを正規化する主な目的は何ですか?
2.
データ加工において、「ワンホットエンコーディング」を適用した場合のデータの特徴として正しいものは次のうちどれですか?
3.
データ加工において、「データの正規化(Normalization)」と「標準化(Standardization)」の主な違いとして正しいものは次のうちどれですか?
4.
データ加工において、非線形な特徴量をモデルに取り入れるために一般的に使用される手法は次のうちどれですか?
5.
テキストデータの前処理において、「ステミング(Stemming)」とはどのような処理ですか?
6.
データ加工において、特徴量の次元削減を行う主な目的は次のうちどれですか?
7.
主成分分析(PCA)による次元削減の利点は次のうちどれですか?
8.
以下のPythonコードを使用して、「欠損値の補完」を実行する際に、fillna() の引数として適切な値を指定することで、各列の平均値で補完するコードとして正しいものは次のうちどれですか?
import pandas as pd
data = {'col1': [1, None, 3], 'col2': [4, 5, None]}
df = pd.DataFrame(data)
# 欠損値補完
df_filled = df.fillna(_____)
9.
データ加工で、「IQR(四分位範囲)」を用いて外れ値を検出する際の計算手順として正しいものは次のうちどれですか?
10.
データの標準化(Standardization)において、最も一般的に使用される手法は次のうちどれですか?
11.
データの不均衡を解消するために、「オーバーサンプリング」を行う利点は次のうちどれですか?
12.
大規模なデータセットに対して、データのメモリ使用量を削減し、効率的に処理するための一般的な手法は次のうちどれですか?
13.
データ加工において、「特徴量生成」が必要になる場面として最も適切なものは次のうちどれですか?
14.
データ加工において、「外れ値」を検出するための統計手法として一般的に使用されるものは次のうちどれですか?
15.
データ加工で、カテゴリ変数を数値データに変換する手法として正しいものはどれですか?
16.
データの標準化と正規化の違いとして、正しい説明は次のうちどれですか?
17.
特徴量選択の手法として「逐次後退選択法(Backward Elimination)」を使用する利点は次のうちどれですか?
18.
外れ値の検出と除去において、IQR(四分位範囲)を使用する理由は次のうちどれですか?
19.
カテゴリ変数を数値に変換する際に、頻度ベースのエンコーディング手法を使用する利点は次のうちどれですか?
20.
データの欠損値(Missing Data)に対して、一般的に使用される処理方法として正しいものはどれですか?
21.
欠損データの補完手法として「多重代入法(Multiple Imputation)」が有効な理由は次のうちどれですか?
22.
時系列データにおける「移動平均(Moving Average)」の主な目的は次のうちどれですか?
23.
欠損データが発生している場合、欠損の発生パターンに応じて適切な処理方法を選択することが重要ですが、データが「完全にランダムに欠損している」場合に適切な処理方法はどれですか?
24.
正規化の手法の一つである「最小-最大スケーリング(Min-Max Scaling)」の目的は何ですか?
25.
データ加工における「ラグ特徴量(Lag Features)」とは、次のうちどれを意味しますか?
26.
時系列データの分割において、「スライディングウィンドウ法」を使用する主な目的は次のうちどれですか?