DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. AIシステム運用において、異常検知を行うために使用される一般的な手法は次のうちどれですか? モデルの精度を評価するために交差検証を行う データの前処理を手動で行う モデルの予測結果を定期的にアーカイブする クラスタリングや回帰分析を用いて、通常のパターンから外れたデータを検出する None 2. 動的計画法(Dynamic Programming)で解決できる問題の特徴はどれですか? 問題が時間によって変化する場合 問題が部分問題に分割でき、その部分問題が再利用可能な場合 制約条件が非線形な場合 決定変数が離散値をとる場合 None 3. データの「正規化」と「標準化」の違いとして最も正しい説明は次のうちどれですか? 標準化はデータを特定の範囲に収め、正規化はデータを平均0、分散1に変換する 両者は同じ意味である 正規化はデータの欠損値を補完する 正規化はデータを特定の範囲に収め、標準化はデータを平均0、分散1に変換する None 4. 複数のシナリオを考慮したアプローチ設計において、シナリオプランニングが有効とされる理由は次のうちどれですか? シナリオごとに異なる解決策を実行するため すべてのシナリオに対して同じ解決策を適用するため 不確実な未来に備え、異なる可能性に対応するため 短期間で結果を得るため None 5. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 6. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 7. モデルの利活用において、予測精度の評価に使われる指標の一つはどれですか? 平均二乗誤差 (MSE) パラメータ数 サンプル数 分散 None 8. Pythonで、遅延評価を行うデータ構造として有名なものは次のうちどれですか? ジェネレータ リスト タプル 辞書 None 9. アプローチ設計において、KPI(主要業績指標)を設定する目的は次のうちどれですか? 成果を測定し、進捗をモニタリングするため 課題を定義し、優先順位を付けるため チームメンバーの役割を明確にするため コスト削減を目指すため None 10. 分析評価で使用される「A/Bテスト」の主な目的は次のうちどれですか? 2つの異なる手法やアプローチを比較し、どちらが効果的かを判断するため モデルの訓練データを増やすため データセットを分割してモデルを評価するため データの精度を向上させるため None 11. 大規模なデータセットを処理する際、データの計算負荷を軽減しつつ代表的なサンプルを使用する手法として適切なものは次のうちどれですか? ランダムサンプリング フルデータの使用 データの一部を削除 時系列データの全範囲を使用 None 12. データセットの「多重共線性」を検出するために使用される指標として最も適切なものは次のうちどれですか? 決定係数 相関係数 VIF(Variance Inflation Factor) 平均二乗誤差 None 13. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 14. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 15. 「主成分分析(PCA)」の主な目的は次のうちどれですか? データの平均値を求める データの相関関係を調べる データの欠損値を補完する データの次元を削減し、主要な特徴を抽出する None 16. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 17. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 18. データの活用が企業経営において重要視されている理由は次のうちどれですか? 感覚や経験だけでの経営が優位であるため データの解析に時間がかかりすぎるため データが信頼できないから データに基づく意思決定が、感覚に頼る意思決定よりも信頼性が高いため None 19. ビジネスにおける「コンプライアンス」とは何を指しますか? 法律や規則を遵守すること 顧客に対する製品保証を行うこと 社内の従業員を監視すること 取引先との契約を強制的に履行させること None 20. 論理的思考における「演繹法」とは何を指しますか? 一般的な法則から具体的な結論を導く推論法 実験結果を元に新しい仮説を立てること データ分析の結果を統計的に解釈すること 不完全な情報から確率的な予測を行うこと None 21. データの正規化とは何ですか? データの最小値と最大値を0と1の範囲に変換する データを標準偏差でスケーリングする データをランダムに並べ替える データの外れ値を取り除く None 22. クラスが不均衡なデータセットにおいて、モデルのパフォーマンスを正確に評価するために推奨される指標は次のどれですか? 精度 AUC-ROC 平均絶対誤差 マクロF1スコア None 23. AIシステムをセキュリティ攻撃から保護するために重要な対策の1つとして適切なものは次のうちどれですか? AIの出力結果を無制限に公開する AIの判断プロセスを全て削除する AIシステムにセキュリティ対策を施さない AIモデルのトレーニングデータを暗号化する None 24. データを扱う際に欠損値が多い場合に最も適切な対応は次のうちどれですか? 欠損値を推定して補完する 欠損値を全て削除する 欠損値の行だけを削除する 欠損値を無視して分析を進める None 25. 「課題の優先順位付け」を行う際に、最も効果的な基準は次のうちどれですか? 課題の難易度とコスト 課題の影響範囲と解決に要するリソース チームメンバーの意見と企業の文化 課題の緊急度とチームの意思決定プロセス None 26. AIが「マーケティング分野」において特に効果的に活用されている例として正しいものは次のうちどれですか? 顧客データを削除する 顧客の購買行動データを分析し、パーソナライズされた広告を提供する 顧客に対して無作為に広告を配信する 顧客行動を分析しない None 27. データ可視化の際、外れ値が多いデータセットで正確な可視化を行うために適した手法はどれですか? 箱ひげ図 散布図 ヒストグラム 折れ線グラフ None 28. 線形回帰の目的は何ですか? データの中で非線形関係を持つ2つの変数間の関係を予測する カテゴリカルデータのクラス分けを行う データの中で複数のクラスを分類する データの中で線形関係を持つ2つの変数間の関係を予測する None 29. データエンジニアリング環境構築において、一般的に使用される仮想化技術はどれですか? Docker HTTP SMTP TCP/IP None 30. 決定木モデルにおいて「枝刈り(pruning)」を行う目的は何ですか? モデルの学習速度を向上させるため モデルの予測精度を高めるため モデルのサイズを小さくし、過学習を防ぐため モデルの出力を標準化するため None 31. 企業が遵守すべき「CSR(Corporate Social Responsibility)」の主な目的は次のうちどれですか? 企業の株主だけに利益を還元するため 企業が環境保護の義務を軽減するため 企業が競合他社を排除するため 企業が利益だけでなく、社会全体に対して責任を果たすため None 32. 大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか? 系統抽出 ランダムフォレストを使用する クロスバリデーション 無作為抽出 None 33. AIやデータサイエンスを事業に実装する際、最初に行うべきステップはどれですか? データサイエンスチームの編成 ビジネス課題の特定 モデルの選定 組織内での教育 None 34. 課題定義において、現状と目標との間にある「ギャップ」を明確にする目的は次のうちどれですか? 課題の優先順位を付けるため 現状の改善ポイントを特定し、解決策を導くため 競合他社との差別化を図るため 目標を達成できないリスクを回避するため None 35. キュー(Queue)のデータ構造において、最初に追加された要素が最初に削除される方式は何と呼ばれますか? LIFO FIFO FILO LILO None 36. データの欠損値(Missing Data)に対して、一般的に使用される処理方法として正しいものはどれですか? 平均値や中央値で補完する データ全体を削除する データを逆順に並び替える データをランダムに入れ替える None 37. 分析評価における「F1スコア」とは何を表していますか? モデルの計算速度 データセットのサイズとモデルの適合性 モデルの訓練時間 精度と再現率の調和平均 None 38. 農業におけるAIの主な役割は次のうちどれですか? 農作業全般を人間に代わって行う 農業におけるデータ活用を無効にする 気象データや土壌データを基に作物の成長を最適化する 農作物の種類を制限する None 39. AIが「農業分野」で導入されることで最も期待される効果は次のうちどれですか? 作物の成長管理を自動化し、生産性と収穫量を最大化する 作物の品種をすべて統一する 作物の管理をすべて手動で行う 農業分野ではAIが使われない None 40. データ収集プロセスにおける「バックプレッシャー」とは、どのような現象を指しますか? データベースへの接続が失敗すること データが不足していること APIリクエストが拒否されること 収集されたデータの処理が追いつかないこと None 41. 木構造(Tree)において、全ての子ノードが2つ以下のノードを持つ木のことを何と呼びますか? 完全二分木 二分木 完全グラフ 平衡木 None 42. 分散分析 (ANOVA) の目的は何ですか? 2つの母集団の平均値を比較する データの標準偏差を比較する データの分散が一定であるかを検定する 3つ以上の母集団の平均値を比較する None 43. 「相関関係が因果関係を示すとは限らない」という論理的思考における原則を指す言葉は何ですか? 後件肯定の誤謬 逆証明 相関誤謬 結論飛躍 None 44. 分析評価における「ヒストリカルバイアス」を排除するために有効な手法は次のうちどれですか? データ収集期間を見直し、最新のデータを優先する モデルのパラメータを変更する バイアスが含まれたデータをそのまま使用する データの分散を高める None 45. AVL木(AVL Tree)の特徴は何ですか? 各ノードが必ず2つの子ノードを持つ 木全体の高さが常に固定されている 各ノードの左右の部分木の高さの差が1以内に保たれている 子ノードの値が親ノードの値よりも大きい None 46. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 47. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 48. AIが「プライバシー保護」に与える課題の一つとして考えられるものは次のうちどれですか? データ収集が制限される AIがプライバシーを侵害するリスクがある AIが個人情報を正確に保護する AIがプライバシーに関与しない None 49. 課題定義の際に「仮説」を立てることの目的は次のうちどれですか? 最終的な結論を導き出すため 問題を多角的に解決するための複数の選択肢を導き出すため 課題の影響範囲を狭めるため 課題解決の方向性を早期に設定し、検証するため None 50. ITセキュリティにおける「ゼロデイ攻撃」とは何ですか? データをゼロに初期化する攻撃 データのバックアップを削除する攻撃 ウイルスを送りつける攻撃 未知の脆弱性を悪用した攻撃 None 51. 企業の行動規範において、サプライチェーンの持続可能性を確保するために行うべき対策として最も適切なものは次のうちどれですか? サプライチェーンの持続可能性は企業に直接影響しないため、特に対策は不要 供給者が持続可能性基準を守らない場合は、黙認する 供給者やパートナーに対して持続可能性に関する基準を提示し、それに準拠することを求める 持続可能性は取引先の責任であるため、企業は干渉しない None 52. データ分析における「欠損値処理」の最も一般的な方法は次のうちどれですか? 欠損値をそのまま残す 欠損値を削除する 平均値や中央値で補完する 欠損値を無視する None 53. ビジネスにおける「倫理的行動」とは次のうちどれですか? 企業が利益を最大化するために法を無視すること 顧客や取引先に対して誠実かつ公正な行動を取ること 競合他社のデータを違法に取得すること 社内で不正行為が発生した際に黙認すること None 54. ITセキュリティにおいて、ファイルの整合性を監視する「FIM(File Integrity Monitoring)」の主な目的は次のうちどれですか? ファイルの変更が正当なものであるかどうかを確認する ファイルの暗号化強度を監視する ファイルの圧縮率を最適化する ファイルの転送速度を向上させる None 55. 組織における「ダイバーシティ推進」の目的は次のうちどれですか? チームの意思決定をリーダーに集中させるため 組織の規模を縮小するため 組織の目標を定めないため 組織内に多様な背景やスキルを持つ人材を集め、組織の競争力を高めるため None 56. スタック(Stack)における操作の一つで、データを取り出す操作を何と呼びますか? push pop enqueue dequeue None 57. あるデータセットの2つの変数間の関係を可視化するために最も適切なグラフは次のうちどれですか? ヒストグラム 散布図 箱ひげ図 円グラフ None 58. データを説明する際、対象者の理解を促進するために考慮すべき要素は次のうちどれですか? 対象者のバックグラウンドや専門知識レベル データの量 グラフの色彩 文字の大きさ None 59. A B C D None 60. 次のうち、欠損値を扱う際に考慮すべき重要な点はどれですか? 欠損値を全て0で置き換える 欠損値の存在を無視して分析を進める 欠損値を全て削除する 欠損値のパターンがデータの偏りを生むかどうかを確認する None 61. クラウド環境でデータの可用性を高めるために使用されるストレージ技術は次のうちどれですか? ローカルストレージ テープバックアップ NFS(ネットワークファイルシステム) オブジェクトストレージ None 62. データ管理における「ログ管理」の目的は次のうちどれですか? データを自動的に削除する データのサイズを減らす データの変更履歴を追跡し、不正アクセスを検知する データを全て公開する None 63. モデルを運用環境にデプロイする際に考慮すべき「レイテンシー」とは何ですか? モデルの予測精度 モデルの再トレーニングにかかる時間 モデルの応答速度 モデルの学習に必要なデータ量 None 64. テキスト分類モデルにおいて、マルチラベル分類の実装が必要な場合、次のうち適切なアプローチはどれですか? 各ラベルごとに独立したバイナリ分類器を作成する 一つの分類器で全てのラベルを一度に分類する ラベルの相関を無視して処理する ラベルの階層構造を前提とした回帰モデルを作成する None 65. 「データ共有プラットフォーム」のスケーラビリティを向上させるために一般的に使用される手法は次のうちどれですか? クラウドストレージのキャッシュ 圧縮アルゴリズムの変更 マイクロサービスアーキテクチャ データのファイル形式を変更する None 66. ITセキュリティにおいて、「認証」とは何を指しますか? ユーザーやシステムが正当なものであることを確認するプロセス データの改ざんを防止するプロセス サーバーの負荷を軽減するプロセス データの圧縮を行うプロセス None 67. 組織マネジメントにおいて「権限委譲」の利点は次のうちどれですか? リーダーの責任を軽減できる プロジェクトの進行が遅くなる リーダーシップが必要なくなる メンバーが自己管理能力を高めることができる None 68. GDPRにおける「データ主体の権利」として認められているものは次のうちどれですか? データの無制限な利用を許可する権利 データの公開を強制する権利 データの修正や削除を要求する権利 データの匿名化を禁止する権利 None 69. 科学的解析において「効果サイズ」とは何を指しますか? 仮説検定の結果がどれほど重要かを示す指標 分散の大きさを示す指標 標準誤差の大きさを示す指標 サンプルサイズの大きさを示す指標 None 70. 課題定義のプロセスで発生する「認知バイアス」を排除するための方法として最も適切なものは次のうちどれですか? すべてのチームメンバーの意見を無条件で採用する データに基づいて客観的に課題を評価し、多様な視点を取り入れる 既存の成功事例を参考にして、同様のアプローチを取る チームリーダーの指示に従い、意思決定を迅速に進める None 71. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 72. 多クラス分類問題における評価指標として適切なものは次のどれですか? 精度 平均二乗誤差(MSE) 決定係数 マクロ平均F1スコア None 73. モデルの利活用において、データが定期的に追加されるシナリオで推奨される手法はどれですか? モデルの完全な再トレーニング 増分学習 モデルのパラメータ調整のみ データの削除 None 74. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None 75. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 76. イノベーションを推進するための「オープンイノベーション」の主な特徴は次のうちどれですか? 社内の資源にのみ依存して、独自のアイデアを開発する 外部との情報共有を避け、完全にクローズドな環境で開発を進める 外部のリソースや知見を活用して、社外からアイデアを取り入れる 製品の特許を完全に保護し、外部に一切公開しない None 77. データを可視化する際に使用される「散布図」の主な目的は次のうちどれですか? データの分布を確認する データの平均値を表示する 2つの変数間の相関を視覚的に確認する データの外れ値を自動的に削除する None 78. ビッグデータが公共政策の分野で活用される際の主な利点は次のうちどれですか? 政策の決定にデータを使用せず、直感に頼る 市民のニーズをデータに基づいて正確に把握できる 政策の結果を無視する ビッグデータの解析は政策に役立たない None 79. 線形計画法(LP)において、目的関数とは何ですか? 制約条件を表す数式 最大化または最小化を目指す数式 データの最適な分割を表す手法 コストの削減を示す指標 None 80. モデルの性能評価において、訓練データに対して高い精度を示すが、テストデータに対して低い精度を示す現象を何と呼びますか? 過学習(オーバーフィッティング) 欠損補完 ロジスティック回帰 標準化 None 81. 論理的思考における「帰納法」の特徴として正しいものは次のうちどれですか? 個別の具体例から一般的な法則を導き出す 一般的な法則から具体的な結論を導き出す 仮説を検証するために実験を行う データの分析に基づいて結論を出す None 82. データ加工における「ラグ特徴量(Lag Features)」とは、次のうちどれを意味しますか? 過去のデータを基に生成される新しい特徴量 特定の特徴量の欠損を補完するための手法 カテゴリデータを数値に変換するための手法 時系列データをリアルタイムで処理するためのアルゴリズム None 83. GANにおける「モード崩壊」とは何を指しますか? 生成器が多様なデータを生成できなくなる現象 判別器が過学習する現象 データの一部が学習されない現象 生成器が学習しない現象 None 84. データ共有の際に「分散ファイルシステム」を利用する利点は次のうちどれですか? データを圧縮して保存できる データをリアルタイムで共有できる データの完全性を保証できる 大規模データを複数のサーバーに分散して保存することで、処理速度を向上させることができる None 85. 課題の定義において、「解決策を先に考えてしまう」ことのリスクは次のうちどれですか? 課題の本質を見逃し、誤ったアプローチを取る可能性が高まる 迅速に解決策を見つけることができなくなる チーム内での合意形成が困難になる 問題が複雑化する None 86. データ保護の観点から、「多要素認証(MFA)」が効果的である理由は次のうちどれですか? 複数の認証要素を組み合わせることで、不正アクセスのリスクを減少させる データを全て削除することができるため 認証手続きが1回で完了するため データのバックアップを取らなくてもよい None 87. 自然言語処理(NLP)が活用される具体例として最も適切なものは次のうちどれですか? データの可視化 数値データの分析 自動翻訳やチャットボットでの顧客サポート データの保存 None 88. データの不均衡に対処するための「アンダーサンプリング」の主なデメリットは次のうちどれですか? データの一部を削除するため、重要な情報が失われるリスクがある データが増えることで処理時間が長くなる データの不均衡をさらに悪化させる可能性がある モデルの精度が低下する可能性がある None 89. テキストデータを扱う際、トークン化後の単語数が非常に多い場合に生じる問題は何ですか? 次元の呪い オーバーフィッティング アンダーフィッティング クラスターの数が増加する None 90. 組織において「適応型マネジメント」が効果的である理由として最も適切なものは次のうちどれですか? 組織が予算を削減するため 組織が変化する環境に迅速に対応し、計画を柔軟に変更できるため 組織が一度定めた計画を変更せずに維持するため 組織が短期間で利益を上げるため None 91. 外れ値の影響を受けにくい代表値はどれですか? 平均値 分散 標準偏差 メディアン None 92. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 93. 時系列データの分析において、データの「自己相関」を確認する理由として最も適切なものは次のうちどれですか? データ間に因果関係があるかどうかを確認するため データが一定の間隔で繰り返すパターンを持つかどうかを確認するため データがすべて独立しているかを確認するため データの平均値を計算するため None 94. AI導入において、データガバナンスが重要視される理由は次のうちどれですか? データを収集するため モデルの精度を向上させるため データ分析の速度を向上させるため データの品質を管理し、セキュリティを確保するため None 95. オンラインプラットフォームにおける「推薦システム」の主な役割は次のうちどれですか? 利用者の選択肢を制限する 全ての利用者に同じ商品を推薦する 推薦システムを使用しない 利用者に対してパーソナライズされた商品やコンテンツを提案する None 96. Pandasライブラリを使用して、dfというデータフレームのage列に50歳以上の行を抽出する方法は次のうちどれですか? df['age'] >= 50 df['age'].apply(lambda x: x >= 50) df[df.age >= 50] df[df['age'] >= 50] None 97. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 98. AIが「自動車産業の生産ライン」において果たす役割として、最も適切なものは次のうちどれですか? AIが生産を停止する 生産ラインの労働力を増やす 生産ラインの速度を遅くする AIが生産プロセスを自動化し、品質管理を強化する None 99. グラフ(Graph)のデータ構造において、隣接リスト(Adjacency List)の利点は次のうちどれですか? メモリ使用量が少ない 全てのノードにアクセスするのが高速である エッジが密なグラフに向いている サイクルの検出が容易である None 100. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None Time's up