DS検定~模擬試験④~

1. 
次のうち、データを説明する際に避けるべき行動はどれですか?

2. 
主成分分析(PCA)による次元削減の利点は次のうちどれですか?

3. 
回帰分析における「多重共線性」が問題となる理由として正しいものは次のうちどれですか?

4. 
時系列データの分析において、データの「自己相関」を確認する理由として最も適切なものは次のうちどれですか?

5. 
大規模なデータセットに対して、データのメモリ使用量を削減し、効率的に処理するための一般的な手法は次のうちどれですか?

6. 
データ共有において、SFTP(Secure File Transfer Protocol)が選ばれる主な理由は次のうちどれですか?

7. 
データを「説明する」ときに最も重要なポイントの1つは次のうちどれですか?

8. 
データの分布を把握するために、累積度数分布(CDF)を使用する場合、その主な利点として最も適切なものは次のうちどれですか?

9. 
データの季節性やトレンドを把握するために、時系列データを平滑化する手法として最も適切なものは次のうちどれですか?

10. 
データ共有の際に「分散ファイルシステム」を利用する利点は次のうちどれですか?

11. 
回帰モデルの説明において「決定係数(R²)」が示す意味として正しいものは次のうちどれですか?

12. 
データの不均衡に対処するための「アンダーサンプリング」の主なデメリットは次のうちどれですか?

13. 
モデルの予測結果を解釈しやすくするための手法として適切なのはどれですか?

14. 
モデル評価において、「混同行列」が提供する情報は次のうちどれですか?

15. 
分析評価における「F1スコア」とは何を表していますか?

16. 
データの標準化と正規化の違いとして、正しい説明は次のうちどれですか?

17. 
データ加工において、非線形な特徴量をモデルに取り入れるために一般的に使用される手法は次のうちどれですか?

18. 
欠損値が多く存在するデータに対して、モデル化を行う前に推奨される処理方法は次のどれですか?

19. 
次のうち、「ロジスティック回帰分析」を使用する際に最も適切な場合はどれですか?

20. 
データセットにおいて、目的変数が連続値である場合に使用される最も一般的なモデルは次のうちどれですか?

21. 
デプロイされたモデルの性能を定期的に監視する理由は何ですか?

22. 
データ共有において、「非構造化データ」として適切な例は次のうちどれですか?

23. 
データのトレンドを説明する際、折れ線グラフを使用したが、季節性が不明確な場合に最も適切な対応は次のうちどれですか?

24. 
モデル評価において「損失関数」の役割は次のうちどれですか?

25. 
データ加工における「ラグ特徴量(Lag Features)」とは、次のうちどれを意味しますか?

26. 
データ共有における「データ共有契約」の主な目的は次のうちどれですか?

27. 
モデルのチューニングにおいて、ハイパーパラメータとは何を指しますか?

28. 
モデルの公平性を確保するために行うべきアプローチとして最も適切なものは次のうちどれですか?

29. 
データ共有において、「メタデータ」の役割として正しいものはどれですか?

30. 
決定木モデルにおいて「枝刈り(pruning)」を行う目的は何ですか?

31. 
データの異常値(外れ値)を検出するために用いられる「箱ひげ図」の主な利点は次のうちどれですか?

32. 
相関関係を持つ2つの変数間の因果関係を説明する際に避けるべきことは次のうちどれですか?

33. 
データ共有プラットフォームで「マルチテナントアーキテクチャ」が使用される理由は次のうちどれですか?

34. 
次のうち、データを説明する際に「ピボットテーブル」を使う主な利点は何ですか?

35. 
モデルの「過学習」とは何を指しますか?

36. 
クロス集計表を用いる主な目的は次のうちどれですか?

37. 
「ヒートマップ」は次のうちどの目的で使用されますか?

38. 
クロスバリデーションの主な目的は何ですか?

39. 
モデルの利活用において、バイアスとバリアンスのトレードオフはどのように関連していますか?

40. 
データを効果的に説明するために最も重要なステップは次のうちどれですか?

41. 
勾配ブースティングのアンサンブル学習において、弱学習器とはどのような役割を果たしますか?

42. 
データ共有において、「データレイク」の設計時に最も注意すべき課題は次のうちどれですか?

43. 
テキストデータの前処理において、「ステミング(Stemming)」とはどのような処理ですか?

44. 
データ加工において、特徴量の次元削減を行う主な目的は次のうちどれですか?

45. 
モデルの解釈性を向上させるために「SHAP」を利用する際、どのような情報が得られますか?

46. 
「ファイル共有サービス」で一般的に使用されるプロトコルは次のうちどれですか?

47. 
データを説明する際、対象者の理解を促進するために考慮すべき要素は次のうちどれですか?

48. 
分析評価における「ベイズ最適化」の利点として最も適切なものは次のうちどれですか?

49. 
モデルのパフォーマンスを向上させるために、次元削減が必要な場合に使用される手法はどれですか?

50. 
「ハイパーパラメータのチューニング」において「ランダムサーチ」の利点は次のうちどれですか?

51. 
データ加工で、「IQR(四分位範囲)」を用いて外れ値を検出する際の計算手順として正しいものは次のうちどれですか?

52. 
欠損データが発生している場合、欠損の発生パターンに応じて適切な処理方法を選択することが重要ですが、データが「完全にランダムに欠損している」場合に適切な処理方法はどれですか?

53. 
データ共有における「Data Lake」と「Data Warehouse」の主な違いは次のうちどれですか?

54. 
モデルの利活用において、データが定期的に追加されるシナリオで推奨される手法はどれですか?

55. 
欠損データの補完手法として「多重代入法(Multiple Imputation)」が有効な理由は次のうちどれですか?

56. 
データ加工において、「外れ値」を検出するための統計手法として一般的に使用されるものは次のうちどれですか?

57. 
分析評価における「ヒストリカルバイアス」を排除するために有効な手法は次のうちどれですか?

58. 
効果的なデータの説明における「データの可視化」の目的として正しいものは次のうちどれですか?

59. 
データをグループごとに分類し、それぞれの傾向を説明する際に最も適切な分析手法は次のうちどれですか?

60. 
モデルにおける「バイアス-バリアンストレードオフ」とは何を指しますか?

61. 
データ加工において、「特徴量生成」が必要になる場面として最も適切なものは次のうちどれですか?

62. 
サポートベクターマシン (SVM) では、カーネル関数を使用する主な理由は何ですか?

63. 
あるデータセットにおいて、平均値が中央値よりも大きい場合、データの分布に関して最も適切な説明は次のうちどれですか?

64. 
「過学習(オーバーフィッティング)」を防ぐために、次のうちどの方法が適切ですか?

65. 
データの分布が正規分布であるかどうかを視覚的に確認するために最も適切な方法は次のうちどれですか?

66. 
データの分布が時間とともに変わる場合、モデルのパフォーマンスを向上させるために推奨される手法はどれですか?

67. 
データ共有プロセスにおいて、「データ所有権」の管理が重要な理由は次のうちどれですか?

68. 
大規模データセットにおいて、相関関係が高いとされる2つの変数が実際には因果関係を持たないことを示す概念は何ですか?

69. 
「モデルのバイアス-バリアンストレードオフ」が示す課題は次のうちどれですか?

70. 
モデル評価において「リコール(再現率)」が低い場合に考えられる影響として最も適切なものは次のうちどれですか?

71. 
アンサンブル学習の手法として、「ブースティング」と「バギング」の主な違いは次のうちどれですか?

72. 
比較を行う際に使用するべきグラフとして最も適切なものは次のうちどれですか?

73. 
クラスが不均衡なデータセットにおいて、モデルのパフォーマンスを正確に評価するために推奨される指標は次のどれですか?

74. 
データ分析でよく使用される「分散分析(ANOVA)」の目的は何ですか?

75. 
モデルのデプロイ後に予測結果をリアルタイムで提供する際、必要とされる機能として最も適切なものは次のうちどれですか?

76. 
モデルの評価において、「再現率」とは何を示しますか?

77. 
データ共有において、ファイルベースの共有よりも「データベースを介した共有」が推奨される理由は次のうちどれですか?

78. 
データ共有の場面で、パブリッククラウド環境を使用する際の主なリスクは次のうちどれですか?

79. 
データの「信頼区間」を説明する際に重要なポイントは次のうちどれですか?

80. 
時系列データの傾向を説明する際、移動平均を用いる主な目的は次のうちどれですか?

81. 
データ共有における「データカタログ」の主な機能は次のうちどれですか?

82. 
モデルの「ブラックボックス」問題とは何ですか?

83. 
データ共有プラットフォームで「データのインタープリタビリティ(相互運用性)」を確保するために必要なものは次のうちどれですか?

84. 
クロスバリデーションの目的は次のうちどれですか?

85. 
分析評価のプロセスで「AUC(ROC曲線下の面積)」を使用する理由は次のうちどれですか?

86. 
モデルの汎化性能を評価するために行う手法の一つはどれですか?

87. 
モデルのフェアネス(公平性)を評価する際に使用される指標として適切なものは次のうちどれですか?

88. 
分析評価で「ヒストリカルバイアス」を検出する最適な方法として最も適切なものは次のうちどれですか?

89. 
予測モデルを本番環境にデプロイする際、APIの利用が推奨される理由は何ですか?

90. 
「ピボットテーブル」を使うときの主な利点は次のうちどれですか?

91. 
本番環境で使用されているモデルが突然精度低下を起こした場合、考えられる原因として最も適切なものは次のうちどれですか?

92. 
「再現率」は何を示す指標ですか?

93. 
散布図で2つの変数間の相関を観察したところ、データがほぼ一直線に並んでいる場合、相関係数は次のうちどれに最も近い値をとると考えられますか?

94. 
データの「異常値」を説明する際に使用する適切な手法は次のうちどれですか?

95. 
データの標準化(Standardization)において、最も一般的に使用される手法は次のうちどれですか?

96. 
データ共有における「API」の役割として正しいものはどれですか?

97. 
変数間の因果関係を説明するために用いられる「因果モデル」の一例として最も適切なものは次のうちどれですか?

98. 
データ加工において、「ワンホットエンコーディング」を適用した場合のデータの特徴として正しいものは次のうちどれですか?

99. 
非対称なデータセットの中心傾向を表すために、最も適切な代表値は次のうちどれですか?

100. 
決定木モデルにおいて、各ノードに分岐する際の基準としてよく使われる指標はどれですか?

コメントを残すにはログインしてください。