DS検定~模擬試験④~

1. 
ある企業が売上データを報告する際、異なる地域の売上を地図上で視覚化しました。この場合、地図の使用による最大の利点は次のうちどれですか?

2. 
Lasso回帰におけるL1正則化の主な効果はどれですか?

3. 
モデル構築において、特徴量の「スケーリング」が必要となる理由は次のうちどれですか?

4. 
データの散らばり具合を示す指標である「標準偏差」は、次のうちどのような意味を持ちますか?

5. 
モデルのチューニングにおいて、ハイパーパラメータとは何を指しますか?

6. 
正規化の手法の一つである「最小-最大スケーリング(Min-Max Scaling)」の目的は何ですか?

7. 
データ共有における「データカタログ」の主な機能は次のうちどれですか?

8. 
データの正規性を確認するために使用される統計手法として最も適切なものは次のうちどれですか?

9. 
特徴量選択の手法として「逐次後退選択法(Backward Elimination)」を使用する利点は次のうちどれですか?

10. 
データ共有の際に、「データの非対称暗号化」が採用される理由は次のうちどれですか?

11. 
モデルのデプロイ後に重要なタスクはどれですか?

12. 
モデルの性能を検証するために、データセットを訓練データとテストデータに分割する理由は何ですか?

13. 
欠損データの補完手法として「多重代入法(Multiple Imputation)」が有効な理由は次のうちどれですか?

14. 
データ共有における「Data Lake」と「Data Warehouse」の主な違いは次のうちどれですか?

15. 
あるデータセットにおいて、平均値が中央値よりも大きい場合、データの分布に関して最も適切な説明は次のうちどれですか?

16. 
データをグループごとに分類し、それぞれの傾向を説明する際に最も適切な分析手法は次のうちどれですか?

17. 
データ共有において、「Snowflake」プラットフォームが支持される理由として最も適切なものは次のうちどれですか?

18. 
次のうち、「多重共線性」が回帰分析の結果に与える影響として最も適切な説明はどれですか?

19. 
テキストデータの前処理において、「ステミング(Stemming)」とはどのような処理ですか?

20. 
分析評価で使用される「A/Bテスト」の主な目的は次のうちどれですか?

21. 
非対称なデータセットの中心傾向を表すために、最も適切な代表値は次のうちどれですか?

22. 
データ加工で、「IQR(四分位範囲)」を用いて外れ値を検出する際の計算手順として正しいものは次のうちどれですか?

23. 
データセットにおいて、目的変数が連続値である場合に使用される最も一般的なモデルは次のうちどれですか?

24. 
モデル評価において、「混同行列」が提供する情報は次のうちどれですか?

25. 
アンサンブル学習の手法として、「ブースティング」と「バギング」の主な違いは次のうちどれですか?

26. 
クロス集計表を用いる主な目的は次のうちどれですか?

27. 
ハイパーパラメータチューニングにおいて、「グリッドサーチ」が適用される主な目的は何ですか?

28. 
データ共有における「データ共有契約」の主な目的は次のうちどれですか?

29. 
「データガバナンス」における主な目的は次のうちどれですか?

30. 
データの異常値(外れ値)を検出するために用いられる「箱ひげ図」の主な利点は次のうちどれですか?

31. 
相関係数が正の値を示す場合、次のうちどの関係性があると考えられますか?

32. 
データを「説明する」ときに最も重要なポイントの1つは次のうちどれですか?

33. 
予測モデルを本番環境にデプロイする際、APIの利用が推奨される理由は何ですか?

34. 
決定木モデルにおいて「枝刈り(pruning)」を行う目的は何ですか?

35. 
「ヒートマップ」は次のうちどの目的で使用されますか?

36. 
回帰モデルの説明において「決定係数(R²)」が示す意味として正しいものは次のうちどれですか?

37. 
データ共有において、データの「レプリケーション」を行う目的は次のうちどれですか?

38. 
モデルの「ブラックボックス」問題とは何ですか?

39. 
モデルの評価指標として、精度(accuracy)以外にモデルの性能を評価するために適切な指標はどれですか?

40. 
データ共有において、「メタデータ」の役割として正しいものはどれですか?

41. 
モデルの「正則化(regularization)」とは何を指しますか?

42. 
効果的なデータの説明における「データの可視化」の目的として正しいものは次のうちどれですか?

43. 
「ピボットテーブル」を使うときの主な利点は次のうちどれですか?

44. 
モデルの定期的なメンテナンスが重要である理由として最も適切なのは次のうちどれですか?

45. 
「モデルのバイアス-バリアンストレードオフ」が示す課題は次のうちどれですか?

46. 
分析結果の評価において最も重要な要素は次のうちどれですか?

47. 
データの共有において、データの完全性と機密性を保つために使用される技術は次のうちどれですか?

48. 
データ加工における「ラグ特徴量(Lag Features)」とは、次のうちどれを意味しますか?

49. 
モデルの学習において、「早期終了(Early Stopping)」が適用される主な目的は次のうちどれですか?

50. 
決定木モデルにおいて、各ノードに分岐する際の基準としてよく使われる指標はどれですか?

51. 
回帰分析における「多重共線性」が問題となる理由として正しいものは次のうちどれですか?

52. 
データ共有の場面で、パブリッククラウド環境を使用する際の主なリスクは次のうちどれですか?

53. 
比較を行う際に使用するべきグラフとして最も適切なものは次のうちどれですか?

54. 
データ共有の際に「分散ファイルシステム」を利用する利点は次のうちどれですか?

55. 
時系列データの傾向を説明する際、移動平均を用いる主な目的は次のうちどれですか?

56. 
モデルのフェアネス(公平性)を担保するために使用される評価手法はどれですか?

57. 
モデルのデプロイ後に予測結果をリアルタイムで提供する際、必要とされる機能として最も適切なものは次のうちどれですか?

58. 
精度と再現率を評価する際、精度とはどのような指標を示していますか?

59. 
データ加工において、非線形な特徴量をモデルに取り入れるために一般的に使用される手法は次のうちどれですか?

60. 
クラウド環境において、異なるユーザー間でデータを共有する際に考慮すべき主要な課題は次のうちどれですか?

61. 
「データ共有プラットフォーム」のスケーラビリティを向上させるために一般的に使用される手法は次のうちどれですか?

62. 
「リッジ回帰」がL2正則化を使用する主な理由は次のうちどれですか?

63. 
本番環境で使用されているモデルが突然精度低下を起こした場合、考えられる原因として最も適切なものは次のうちどれですか?

64. 
データを扱う際に重要な「分位点」とは何を意味しますか?

65. 
データの欠損値(Missing Data)に対して、一般的に使用される処理方法として正しいものはどれですか?

66. 
データサイエンスにおいて、モデルを活用する際に最も重要なステップの一つは何ですか?

67. 
デプロイされたモデルの性能を定期的に監視する理由は何ですか?

68. 
モデルの予測結果を解釈しやすくするための手法として適切なのはどれですか?

69. 
データの不均衡に対処するための「アンダーサンプリング」の主なデメリットは次のうちどれですか?

70. 
クロスバリデーションの主な目的は何ですか?

71. 
データの「信頼区間」を説明する際に重要なポイントは次のうちどれですか?

72. 
時系列データの分析において、データの「自己相関」を確認する理由として最も適切なものは次のうちどれですか?

73. 
モデルがデータの相関に基づいて誤った予測を行わないようにするためには、次のどの手法が有効ですか?

74. 
勾配ブースティングのアンサンブル学習において、弱学習器とはどのような役割を果たしますか?

75. 
データの正規性を説明するために最もよく使用されるグラフは次のうちどれですか?

76. 
サポートベクターマシン (SVM) では、カーネル関数を使用する主な理由は何ですか?

77. 
データの代表値の一つである「中央値」はどのようなデータの特徴を表しますか?

78. 
モデルのパフォーマンスを評価するためにROC曲線を使用する主な目的は何ですか?

79. 
大規模なデータセットに対して、データのメモリ使用量を削減し、効率的に処理するための一般的な手法は次のうちどれですか?

80. 
データの分布が時間とともに変わる場合、モデルのパフォーマンスを向上させるために推奨される手法はどれですか?

81. 
データ加工において、「データの正規化(Normalization)」と「標準化(Standardization)」の主な違いとして正しいものは次のうちどれですか?

82. 
モデルを運用環境にデプロイする際に考慮すべき「レイテンシー」とは何ですか?

83. 
データ加工において、「ワンホットエンコーディング」を適用した場合のデータの特徴として正しいものは次のうちどれですか?

84. 
モデルの「過学習」とは何を指しますか?

85. 
モデルのパフォーマンスがデータの品質に依存している理由として最も適切なものは次のうちどれですか?

86. 
モデルの利活用において、データが定期的に追加されるシナリオで推奨される手法はどれですか?

87. 
モデルのフェアネス(公平性)を評価する際に使用される指標として適切なものは次のうちどれですか?

88. 
変数間の因果関係を説明するために用いられる「因果モデル」の一例として最も適切なものは次のうちどれですか?

89. 
主成分分析(PCA)による次元削減の利点は次のうちどれですか?

90. 
散布図で2つの変数間の相関を観察したところ、データがほぼ一直線に並んでいる場合、相関係数は次のうちどれに最も近い値をとると考えられますか?

91. 
モデルのパフォーマンスを向上させるために、次元削減が必要な場合に使用される手法はどれですか?

92. 
ビッグデータ解析において、非常に大量のデータから有用な情報を抽出するための技術として最も適切なものは次のうちどれですか?

93. 
分析評価において「A/Bテスト」を実施する際、最も重要な前提条件は次のうちどれですか?

94. 
クラスが不均衡なデータセットにおいて、モデルのパフォーマンスを正確に評価するために推奨される指標は次のどれですか?

95. 
次のうち、データを説明する際に「ピボットテーブル」を使う主な利点は何ですか?

96. 
「過学習(オーバーフィッティング)」を防ぐために、次のうちどの方法が適切ですか?

97. 
線形回帰モデルにおける「重み」とは何を指しますか?

98. 
データ共有において、「アクセストークン」が使用される主な理由は次のうちどれですか?

99. 
モデルが本番環境で意図しないバイアスを持つ可能性を最小限に抑えるためには、次のどの手法が有効ですか?

100. 
データ共有において、SFTP(Secure File Transfer Protocol)が選ばれる主な理由は次のうちどれですか?

コメントを残すにはログインしてください。