DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 2. カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか? カテゴリ間に序列がある場合のエンコードが容易であるため カテゴリカルデータが数値データとして扱われるようになるため カテゴリカルデータ間に意味のない序列が生じるのを防ぐため カテゴリカルデータの次元が増加しないため None 3. ITセキュリティにおける「リスクアセスメント」とは何を指しますか? セキュリティ侵害が発生した後に、データを復元するプロセス ネットワークのトラフィックをモニタリングするプロセス セキュリティリスクを特定し、評価して対策を講じるプロセス ソフトウェアのバグを修正するプロセス None 4. デザインプロセスにおける「デザインシンキング」の特徴として正しいものは次のうちどれですか? 製品の技術的性能を最優先するアプローチ コスト削減を最優先するアプローチ ユーザー中心のアプローチを取り、反復的なプロセスで解決策を創出する デザインの見た目や美観を重視するアプローチ None 5. 精度と再現率を評価する際、精度とはどのような指標を示していますか? 予測が正しい割合 モデルが外れ値を除外する能力 予測モデルの処理速度 モデルが予測しなかったデータの比率 None 6. Kubernetesにおける「ポッド」とは何ですか? クラスタ全体の負荷分散を行う機能 コンテナ間の通信を管理するプロトコル コンテナの依存関係を管理するシステム 1つまたは複数のコンテナを含む最小のデプロイメント単位 None 7. データの活用が企業経営において重要視されている理由は次のうちどれですか? 感覚や経験だけでの経営が優位であるため データの解析に時間がかかりすぎるため データが信頼できないから データに基づく意思決定が、感覚に頼る意思決定よりも信頼性が高いため None 8. データのスケーリング(正規化)を行う目的として最も適切なものは次のうちどれですか? データの分散を減少させるため 異なるスケールを持つ変数を比較可能にするため データの因果関係を強化するため データをランダムに並べ替えるため None 9. プロジェクトマネジメントにおける「リソース管理」の主な目的は次のうちどれですか? プロジェクトの予算を削減すること プロジェクトに必要な人材、設備、予算を効率的に管理し、適切に配分すること プロジェクトの成果物を管理すること プロジェクトの終結を早めること None 10. 線形回帰モデルにおける「重み」とは何を指しますか? 変数間の相関の強さ 説明変数に対する従属変数の影響度 変数の相対的な順序 データの分散の指標 None 11. 生成AIにおける「GAN(Generative Adversarial Network)」の基本的な構造はどのようなものですか? 生成ネットワークと判別ネットワークから構成される 単一のニューラルネットワークからなる 畳み込み層のみで構成される RNN(リカレントニューラルネットワーク)をベースにする None 12. 「デザイン思考」のプロセスに含まれるステップとして正しいものは次のうちどれですか? 共感 → 定義 → 創造 → プロトタイプ → テスト 創造 → 評価 → テスト → 実装 問題定義 → 解決策探索 → 実行 分析 → 計画 → 評価 → 実行 None 13. モデルの「正則化(regularization)」とは何を指しますか? モデルの複雑さを増やして、精度を向上させる手法 モデルのパラメータを制約することで、過学習を防ぐ手法 モデルの学習速度を速める手法 データの分布を正規化する手法 None 14. 生成AIにおいて「Contrastive Learning(対比学習)」が注目されている理由は次のうちどれですか? 大規模データセットであってもモデルを効率的に訓練できるため モデルの重みを効率的に更新できるため 類似したデータを引き離し、異なるデータを近づけることで、効果的な表現を学習するため 生成されたデータの多様性を高めるため None 15. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 16. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 17. 組織マネジメントにおける「コンフリクトマネジメント」の主な目的は次のうちどれですか? チームメンバーを評価しないこと チームリーダーを変更すること チームの全体的な進捗を監視すること チーム内の意見の衝突を防ぎ、適切に解決すること None 18. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 19. モデルの性能を比較するために使用される「クロスバリデーション」の利点として最も適切なものは次のうちどれですか? データの一部のみでモデルを評価する トレーニングデータ全体を用いてモデルを評価できる 過学習を促進する テストデータを完全に除外する None 20. データ共有の際に、「データの非対称暗号化」が採用される理由は次のうちどれですか? 全てのユーザーが同じ鍵を使用して、データを暗号化できるため データの送信者と受信者が異なる鍵を使用して、データの安全性を高めるため データのサイズを圧縮するため データのリアルタイム性を保証するため None 21. AIが最も活用されている分野の1つとして正しいものは次のうちどれですか? 農業のみ 製造業、金融業、医療業など、さまざまな産業 芸術分野のみ 人間の感情理解に限定される None 22. プロジェクトの進行中に、ステークホルダーから予期しない要件変更が求められた場合、プロジェクトマネージャーが最初に行うべき対応は次のうちどれですか? 要件変更の影響を評価し、変更がプロジェクト全体に与えるリスクやコストを見積もる すぐに要件を反映させる 要件変更を拒否する 要件変更の責任を他のチームに移す None 23. ビジネス行動規範における「エシカルサプライチェーン」とはどのような概念ですか? 労働者の権利や環境保護に配慮した倫理的なサプライチェーンの構築 コスト削減を最優先とするサプライチェーンの構築 すべての供給者が同じ国に所属するサプライチェーンの構築 短期的な利益を追求するためのサプライチェーンの構築 None 24. 動的計画法における「重複部分問題」とは何ですか? 同じ計算を何度も繰り返すこと 最適化において複数の制約条件が重なること 異なる部分問題が同じ答えを持つこと 同時に解くべき問題の集合 None 25. 「データガバナンス」における主な目的は次のうちどれですか? データの圧縮を最適化し、保存容量を減らすこと データベースのクエリを最適化すること データの品質、整合性、安全性を確保し、適切に管理すること データのリアルタイム共有を実現すること None 26. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 27. モデルの予測結果を解釈しやすくするための手法として適切なのはどれですか? 正則化 SHAP(Shapley Additive Explanations) グリッドサーチ 正規化 None 28. 時系列データの分析において、データの「自己相関」を確認する理由として最も適切なものは次のうちどれですか? データ間に因果関係があるかどうかを確認するため データが一定の間隔で繰り返すパターンを持つかどうかを確認するため データがすべて独立しているかを確認するため データの平均値を計算するため None 29. 組織マネジメントにおいて、最も重要なリーダーシップスタイルの1つは何ですか? カリスマ的リーダーシップ ディレクティブリーダーシップ サーバントリーダーシップ 自律型リーダーシップ None 30. ITセキュリティにおいて、ペネトレーションテスト(Penetration Test)の目的として正しいものは次のうちどれですか? データベースのパフォーマンスを最適化する 通信の暗号化方式を確認する システムの脆弱性を攻撃者の視点から発見する パスワードの強度を検証する None 31. デザイン思考の「共感」のステップでは、何が行われますか? 製品のコンセプトを開発する 製品の最終的な評価を行う プロジェクトの予算を確保する ユーザーのニーズや問題を理解するために観察やインタビューを行う None 32. 大量のセンサーデータをリアルタイムに収集する際に、データの処理を分散させることでパフォーマンスを向上させるために使用される技術は次のうちどれですか? SQLクエリ pandas VirtualBox Apache Flink None 33. データの「前処理」において最も重要なステップの一つである「データクリーニング」とは、何を行うプロセスですか? データの欠損や誤りを検出して修正する データの可視化を行う データの取得元を特定する データの分析を行う None 34. 「シナリオプランニング」とは何ですか? 既存のデザインを改善するためのテストプロセス ユーザーの行動を観察し、問題を特定するためのプロセス デザインの具体的な実行計画を策定するプロセス 将来の複数の可能性に備えた計画を策定するプロセス None 35. ハッシュテーブルで「オープンアドレッシング」を使用する主な目的は次のうちどれですか? データのソートを行うため メモリの使用量を削減するため エラーを防ぐため 衝突を管理するため None 36. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 37. クラウド環境でデータの可用性を高めるために使用されるストレージ技術は次のうちどれですか? ローカルストレージ テープバックアップ NFS(ネットワークファイルシステム) オブジェクトストレージ None 38. 標準偏差を求める際に必要な計算は何ですか? 分散を2乗する 平均値を引く 分散の平方根を取る 標本数を掛ける None 39. データ加工で、カテゴリ変数を数値データに変換する手法として正しいものはどれですか? 正規化 ワンホットエンコーディング 標準化 フィルタリング None 40. 二分探索木(Binary Search Tree)において、各ノードの左側のサブツリーに含まれる値はどのように配置されますか? 親ノードよりも大きい 親ノードと等しい 親ノードよりも小さい 親ノードとは関係ない None 41. ビッグデータ解析において、非常に大量のデータから有用な情報を抽出するための技術として最も適切なものは次のうちどれですか? データサンプリング データマイニング データ可視化 データフィルタリング None 42. AIを活用した「顧客リテンション分析」の主な目的は次のうちどれですか? 顧客の離脱を予測し、離脱を防止するための施策を講じる 新規顧客を獲得する すべての顧客に同じ対応をする 顧客データを削除する None 43. ロジスティック回帰モデルは、どのようなタイプのデータに対して使用されますか? 連続値データの予測 二値分類問題 多値分類問題 非線形データの予測 None 44. AIが「農業分野」で導入されることで最も期待される効果は次のうちどれですか? 作物の成長管理を自動化し、生産性と収穫量を最大化する 作物の品種をすべて統一する 作物の管理をすべて手動で行う 農業分野ではAIが使われない None 45. 「HTTPS」が従来の「HTTP」よりも安全とされる理由は次のうちどれですか? 通信が暗号化されているため、中間者攻撃を防ぐことができる データの圧縮が行われ、転送速度が速くなるため データが複数のサーバーに分散されているため データベースへのアクセスが制限されているため None 46. 「ゼロトラストアーキテクチャ」におけるセキュリティ原則の1つは次のうちどれですか? 一度認証されたリソースは信頼し続ける 全てのアクセスを許可する 全てのリソースへのアクセスを常に検証し、信頼しない 認証プロセスを省略する None 47. 非構造化データにおける「アノテーション」とは何を指しますか? データのラベル付けを行う作業 データの可視化を行う作業 データの正規化を行う作業 データの欠損値を補完する作業 None 48. クラウド上でのデータ収集において、サーバーレスアーキテクチャの利点は次のうちどれですか? サーバーの運用管理が不要になる データベースのスキーマを定義しやすくなる データ収集の速度が制限される 大量データの保存が困難になる None 49. データ加工における「ラグ特徴量(Lag Features)」とは、次のうちどれを意味しますか? 過去のデータを基に生成される新しい特徴量 特定の特徴量の欠損を補完するための手法 カテゴリデータを数値に変換するための手法 時系列データをリアルタイムで処理するためのアルゴリズム None 50. 欠損データの補完手法として「多重代入法(Multiple Imputation)」が有効な理由は次のうちどれですか? 複数の補完値を生成して欠損データを複数回補完し、不確実性を考慮できるため 補完値をランダムに生成して、不確実性を減少させるため データを完全に削除して、不確実性を排除するため 欠損データが存在しても、モデルの精度に影響しないため None 51. 論理的思考のプロセスにおいて、「前提」を正しく設定することが重要な理由として正しいものは次のうちどれですか? 前提が間違っていても、正しい結論を導けるため 前提が間違っていると、どれだけ正しい推論をしても、結論が間違う可能性があるため 前提を設定しない方が柔軟な思考ができるため 前提を正しく設定することは論理的思考には関係がないため None 52. ソフトウェアの開発契約において、成果物の権利が開発者に帰属する場合、発注者側が事前に確認すべきポイントは次のうちどれですか? 開発者が発注者に対して使用許諾を行う権利範囲 成果物の使用料を低く設定する 開発者が使用するプログラミング言語 開発者の過去の実績 None 53. AIが工場の生産ラインで最も一般的に使用される目的は次のうちどれですか? 製造プロセスの自動化と品質管理の最適化 製品のデザイン作成 販売促進活動 顧客サービスの提供 None 54. AIシステム運用における「ブルーグリーンデプロイメント」とは何ですか? モデルを複数のサーバーに分散してデプロイする手法 2つの異なる環境を用意し、片方をテスト環境として新しいモデルを試した後、問題がなければ全てのトラフィックを新環境に切り替える手法 モデルを逐次的に更新することで、システムのダウンタイムを最小化する手法 モデルを定期的に再トレーニングする手法 None 55. 「ヒートマップ」は次のうちどの目的で使用されますか? データの相関関係を視覚的に示すため データの平均値を計算するため データの標準偏差を表示するため データを並び替えるため None 56. 生成モデルで使用される「潜在変数」とは何ですか? モデルの出力に直接関係する観測可能な変数 データの生成プロセスを表現するが、直接観測できない変数 モデルのハイパーパラメータ 出力のラベルに対応する変数 None 57. Pythonでジェネレータを使用する利点は次のうちどれですか? 関数の実行速度を大幅に向上させることができる ジェネレータは自動的にデータを並列処理する 関数の返り値をキャッシュする 大量のデータをメモリ効率良く扱うことができる None 58. テキストデータを扱う際、トークン化後の単語数が非常に多い場合に生じる問題は何ですか? 次元の呪い オーバーフィッティング アンダーフィッティング クラスターの数が増加する None 59. AWS(Amazon Web Services)を用いたクラウド環境の構築において、データストレージサービスとして使用されるものはどれですか? FTP HTTP SMTP S3 None 60. リンクリスト(Linked List)のデータ構造において、各要素を指し示すものは何ですか? ノード インデックス ハッシュキー ルート None 61. 組織マネジメントにおける「メンタリング」の利点は次のうちどれですか? メンターがすべての業務を代行する 新しいスキルや知識を効果的に習得できるようにする メンティーが独自に業務を進める メンターの仕事量を減らす None 62. データサイエンスプロジェクトにおける「スコープ管理」とは何を指しますか? プロジェクトの目標や成果物を定義し、その範囲を管理するプロセス プロジェクトの予算を管理するプロセス プロジェクトの品質を管理するプロセス プロジェクトのスケジュールを管理するプロセス None 63. Pythonでオブジェクト指向プログラミング(OOP)を行う際、クラス内で初期化メソッドを定義するための特別なメソッドは次のうちどれですか? __new__() __init__() __call__() __del__() None 64. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 65. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 66. 次のうち、「多重共線性」が回帰分析の結果に与える影響として最も適切な説明はどれですか? 説明変数間に強い相関がある場合、回帰係数の解釈が不安定になる データの分布が正規分布でなくなる データの欠損値が増加する 外れ値の影響が強くなる None 67. 生成モデルの評価指標として「Frechet Inception Distance (FID)」が用いられる理由は何ですか? 生成モデルのトレーニング時間を短縮するため データセットのバランスを保つため 生成されたデータと実際のデータの分布の違いを評価するため モデルの過学習を防ぐため None 68. AIを事業に実装する際の「デジタルリテラシー」の向上が求められる理由は次のうちどれですか? 組織全体がAIの仕組みを理解し、効果的に活用できるようにするため データサイエンティストのみがAIを使用するため AIのアルゴリズムを開発するため 経営層のみがAIを管理するため None 69. AIによる「異常検知システム」が製造業に導入されることで得られる主な利点は次のうちどれですか? 製品の品質を無視する 製造コストが増加する AIによる検知が不正確になる 製品の不良品や設備の異常をリアルタイムで検出し、早期に対応できる None 70. AI実装において「API」を利用するメリットとして最も適切なものは次のうちどれですか? AIモデルのトレーニングを効率化する モデルのパフォーマンスを最適化する モデルのアルゴリズムを変更するための手段を提供する 外部システムと簡単に連携し、データやモデルを活用できる None 71. ITセキュリティにおいて「2要素認証(2FA)」が導入される主な目的は次のうちどれですか? データの圧縮率を高めるため 認証の信頼性を向上させ、不正なアクセスを防ぐため アクセス速度を向上させるため ウイルスのスキャン速度を向上させるため None 72. カテゴリカルデータを分析する際に、データ間の関係を評価するために使用される統計手法は何ですか? t検定 カイ二乗検定 ANOVA ピアソン相関係数 None 73. 「勾配降下法」において、「モーメンタム」を導入することで期待される効果は次のうちどれですか? 勾配の振動が大きくなる 勾配降下法の学習速度が低下する 勾配が滑らかになり、収束が加速する モデルの複雑さが増す None 74. データ蓄積において、バックアップの目的は次のうちどれですか? データベースのパフォーマンスを向上させる データのサイズを小さくする データを保護し、障害時に復元できるようにする データの分析を高速化する None 75. 契約書における「免責条項」の主な役割は次のうちどれですか? 成果物の品質を保証するため 契約を早期に終了するため コストを削減するため 特定の条件下で責任を免除するため None 76. ハイパーパラメータチューニングにおいて、「グリッドサーチ」が適用される主な目的は何ですか? モデルのトレーニングデータを増やすため モデルの精度を評価するため ハイパーパラメータの最適な組み合わせを探索するため テストデータを生成するため None 77. クラウド環境において、異なるユーザー間でデータを共有する際に考慮すべき主要な課題は次のうちどれですか? データのサイズと圧縮 データのファイル形式 データの権限管理とアクセス制御 データの可視化方法 None 78. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 79. データの主成分分析 (PCA) で得られる「主成分」とは何ですか? データ内のノイズを削減する データ内で最も多くの分散を説明する新しい軸 データの標準化を行う手法 データ内の外れ値を検出する手法 None 80. モデルの利活用において、バイアスとバリアンスのトレードオフはどのように関連していますか? バイアスが高いほど、モデルの複雑さが増す バリアンスが高いほど、モデルは過学習しやすくなる バリアンスが低いほど、モデルは過学習しやすくなる バイアスが高いほど、モデルの精度が上がる None 81. 「主成分分析(PCA)」の主な目的は次のうちどれですか? データの平均値を求める データの相関関係を調べる データの欠損値を補完する データの次元を削減し、主要な特徴を抽出する None 82. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 83. プロジェクトマネジメントの5つのプロセス群に含まれないものは次のうちどれですか? 立ち上げ 計画 実行 評価 None 84. 複数の要因が結果にどのように影響しているかを説明する際、最も適切な分析手法は次のうちどれですか? 単回帰分析 分散分析(ANOVA) クロス集計 ヒストグラム None 85. AIによる「自動翻訳技術」がビジネスコミュニケーションに与える影響として最も適切なものは次のうちどれですか? 異なる言語を話す相手とのコミュニケーションがスムーズに行えるようになる 翻訳精度が低くなるため、コミュニケーションが困難になる 通訳者が必要になる 自動翻訳技術は商用利用が難しい None 86. 「ピボットテーブル」を使うときの主な利点は次のうちどれですか? 大量のデータを効率的に集計・分析することができる データを削除することができる データを無作為に並び替えることができる データを視覚的に表示することができる None 87. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 88. 次のうち、データを分割する際の方法として最も適切なものはどれですか? データをランダムに分割する データ全体をトレーニングデータとして使用する トレーニングデータとテストデータに分割する テストデータのみを使用する None 89. A B C D None 90. 「内部告発制度」が企業において重要な役割を果たす理由として最も適切なものは次のうちどれですか? 従業員のプライバシーを監視するため 企業の業績を評価するため 競合他社との戦略的パートナーシップを形成するため 従業員が企業内の不正行為を匿名で報告できるようにすることで、違法行為を未然に防ぐため None 91. GANのトレーニング過程で起こりうる「モード崩壊」とは何ですか? 生成ネットワークが一部のデータパターンしか生成できなくなる現象 判別ネットワークが過学習する現象 トレーニングデータが不足する現象 モデルのハイパーパラメータが適切に設定されない現象 None 92. データを扱う際に重要な「分位点」とは何を意味しますか? データを特定の割合で区分した点 データの平均値 データの最大値と最小値の平均 データの標準偏差 None 93. 生成AIにおける「フューズド(Fused)レイヤー」とは何ですか? 異なるタイプのレイヤーを融合させ、計算効率を向上させる技術 モデルの重みを圧縮する技術 テキスト生成に特化した層の一種 ノイズを削除するための層 None 94. 「SMARTゴール」を使って課題を定義する際、何が重要とされるか? 課題が多様で、包括的で、創造的であること 課題が具体的で、測定可能で、達成可能で、関連性があり、期限が明確であること 課題が挑戦的で、リスクが高く、革新的であること 課題が単純で、分かりやすく、迅速に解決できるものであること None 95. 次の推論に含まれる誤謬を指摘してください。 「すべてのリーダーは影響力を持っている。 Bさんはリーダーではない。 したがって、Bさんには影響力がない。」 相関誤謬 後件肯定の誤謬 前件否定の誤謬 結論飛躍 None 96. 契約書において、データサイエンスプロジェクトの成果物に対する「知的財産権」は、通常どのように規定されるべきですか? 全ての知的財産権は発注者に帰属する 知的財産権はプロジェクトの契約内容に基づいて明確に規定される 知的財産権は特に明記されない 知的財産権は開発者の所有となる None 97. マルコフ連鎖において、「定常状態」とは何を意味しますか? 各状態が常に同じ確率で遷移する すべての状態に同じ確率で遷移する 系が時間経過とともに特定の確率分布に収束する 系が無限の時間を経過しても一定の変化がない状態 None 98. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None 99. 「過学習(オーバーフィッティング)」を防ぐために、次のうちどの方法が適切ですか? データを増やすか、正則化を行う 訓練データのみを使用してモデルを評価する モデルの複雑さを高める テストデータを増やす None 100. 線形計画法における「影響係数(シンプルックス乗数)」とは何ですか? 目的関数の傾き 制約条件を変更した際の目的関数の変化率 決定変数の値 可行領域の境界 None Time's up