DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 2. ニューラルネットワークにおいて、「勾配消失問題」を軽減するために最も有効な手法は次のうちどれですか? 活性化関数にReLUを使用する モデルを小さくする 隠れ層を減らす 学習率を0にする None 3. データを扱う際に重要な「分位点」とは何を意味しますか? データを特定の割合で区分した点 データの平均値 データの最大値と最小値の平均 データの標準偏差 None 4. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 5. AIが最も活用されている分野の1つとして正しいものは次のうちどれですか? 農業のみ 製造業、金融業、医療業など、さまざまな産業 芸術分野のみ 人間の感情理解に限定される None 6. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 7. 次のうち、モデルのハイパーパラメータを調整する手法はどれですか? ロジスティック回帰 決定木 正規化 グリッドサーチ None 8. ITセキュリティにおける「ゼロトラストモデル」とはどのようなセキュリティモデルですか? ネットワーク内の全ての通信を信頼するアプローチ 全てのアクセスを検証し、内部ネットワークでも信頼しないセキュリティアプローチ 外部からの攻撃のみを防ぐためのセキュリティモデル 信頼できるネットワークデバイスのみを許可するアプローチ None 9. AIによる「需要予測」の導入が成功している業界として最も適切なものは次のうちどれですか? 教育 農業 製造業 エネルギー None 10. AI技術が「人材採用」において活用される場合のリスクとして考えられる問題は次のうちどれですか? AIがすべての候補者を平等に評価する AIが候補者のスキルを過小評価する可能性がある AIがバイアスを持つ可能性がある AIが候補者の学歴のみを重視する None 11. モデルのパフォーマンスを評価するためにROC曲線を使用する主な目的は何ですか? モデルの予測値を確認するため モデルの複雑さを測定するため モデルがどのようにクラスを区別するかを評価するため モデルの正確な予測確率を示すため None 12. モデルの性能評価において、訓練データに対して高い精度を示すが、テストデータに対して低い精度を示す現象を何と呼びますか? 過学習(オーバーフィッティング) 欠損補完 ロジスティック回帰 標準化 None 13. 「相関関係が因果関係を示すとは限らない」という論理的思考における原則を指す言葉は何ですか? 後件肯定の誤謬 逆証明 相関誤謬 結論飛躍 None 14. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 15. データの正規化とは何ですか? データの最小値と最大値を0と1の範囲に変換する データを標準偏差でスケーリングする データをランダムに並べ替える データの外れ値を取り除く None 16. イノベーションを推進するための「オープンイノベーション」の主な特徴は次のうちどれですか? 社内の資源にのみ依存して、独自のアイデアを開発する 外部との情報共有を避け、完全にクローズドな環境で開発を進める 外部のリソースや知見を活用して、社外からアイデアを取り入れる 製品の特許を完全に保護し、外部に一切公開しない None 17. AIによる「バイアス」の問題が発生する可能性がある場面として、最も適切なものは次のうちどれですか? データが大量すぎて解析できない場合 AIが完全に自動で動作している場合 データセットが少ない場合 データセットに偏りが含まれている場合 None 18. Lasso回帰におけるL1正則化の主な効果はどれですか? モデルの重みを全て大きくする モデルの重みを小さくして、特定の特徴量をゼロにする 特徴量の相関を強化する モデルの学習速度を遅くする None 19. GDPR(一般データ保護規則)において、データ漏洩が発生した際に企業が取るべき対応は次のうちどれですか? データ漏洩を隠す データ漏洩を放置する 全てのデータを削除する 速やかに関係当局に報告する None 20. 正規化の手法の一つである「最小-最大スケーリング(Min-Max Scaling)」の目的は何ですか? データの平均を0にする データの分布を正規分布に近づける データを指定した範囲にスケーリングする データを標準偏差1にする None 21. クロスバリデーションの主な目的は何ですか? モデルの性能を評価し、過学習を防ぐこと モデルのパラメータ数を減らすこと モデルの複雑さを増やすこと モデルの学習速度を速めること None 22. AIシステムのモニタリングにおいて「Prometheus」の主な役割は次のうちどれですか? モデルの再トレーニングを自動で実行する モデルのハイパーパラメータを調整する データを可視化してダッシュボードを作成する モデルのパフォーマンスやシステムの状態をリアルタイムで監視する None 23. 分析評価における「F1スコア」とは何を表していますか? モデルの計算速度 データセットのサイズとモデルの適合性 モデルの訓練時間 精度と再現率の調和平均 None 24. モデルのデプロイ後に重要なタスクはどれですか? モデルの予測結果を分析すること モデルの訓練データを増やすこと モデルの定期的な再学習とパフォーマンスの監視 モデルの複雑さを減らすこと None 25. 非構造化データとは何を指しますか? テーブル形式で保存されたデータ 事前に定義された形式がなく、自由な形で存在するデータ 時系列データ データベースに保存された数値データ None 26. 次のうち、「ロジスティック回帰分析」を使用する際に最も適切な場合はどれですか? 目的変数がカテゴリカルデータの場合 目的変数が連続値の場合 データが時系列データの場合 データが相関していない場合 None 27. ヘルスケア分野でのAIの利活用において、次のうち正しい活用例はどれですか? AIが医師の診断を支援し、診療プロセスを最適化する AIがすべての薬の製造を行う AIが患者の全ての治療を担当する AIが薬の効能を決定する None 28. GANのトレーニングにおいて、生成器と判別器のバランスを保つために重要なハイパーパラメータはどれですか? エポック数 バッチサイズ ドロップアウト率 学習率 None 29. イノベーションのための「オズボーンのチェックリスト」に含まれる質問として適切なものは次のうちどれですか? 「製品の価格を上げるためにはどうすればよいか?」 「この製品の売上を最大化するには?」 「競合他社の製品をどう取り入れるか?」 「この製品をどう変えることができるか?」 None 30. AIシステム運用において、モデルの「ドリフト」を検知するために行うことは何ですか? モデルのパラメータを手動で更新する モデルの予測結果と実際の結果の差異をモニタリングする モデルの入力データをフィルタリングする モデルのトレーニングデータを削除する None 31. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 32. 課題定義の際に「仮説」を立てることの目的は次のうちどれですか? 最終的な結論を導き出すため 問題を多角的に解決するための複数の選択肢を導き出すため 課題の影響範囲を狭めるため 課題解決の方向性を早期に設定し、検証するため None 33. 動的計画法を用いた在庫管理モデルでは、需要の不確実性を考慮するために使用される手法はどれですか? ベルマン方程式 ロジスティック回帰 ヒューリスティックアルゴリズム モンテカルロシミュレーション None 34. 最新のAI技術「ディープフェイク」がもたらす社会的なリスクとして最も適切なものは次のうちどれですか? AIの導入が遅れる データの削除 動画の圧縮 動画や音声の不正な生成による情報操作や詐欺の増加 None 35. 「ファイル共有サービス」で一般的に使用されるプロトコルは次のうちどれですか? SMTP FTP IMAP HTTP/2 None 36. データ共有の際に「分散ファイルシステム」を利用する利点は次のうちどれですか? データを圧縮して保存できる データをリアルタイムで共有できる データの完全性を保証できる 大規模データを複数のサーバーに分散して保存することで、処理速度を向上させることができる None 37. データ収集の段階で、欠損データが発生した場合に行うべき処理は次のうちどれですか? データを補完するか、削除する データをそのまま使用する データを新たに収集し直す データのフォーマットを変更する None 38. データを保護するための「暗号化」の主な目的は次のうちどれですか? データの可読性を向上させる データの機密性を保護する データのサイズを減らす データの削除を簡単にする None 39. 課題定義において「問題の本質を捉える」とは、どのようなことを意味しますか? 表面的な症状ではなく、根本的な原因を明確にすること 問題が存在することを記録すること 問題を全ての関係者に周知すること 問題が発生した時点でのデータを収集すること None 40. データの「アクセス制御」における主な目的は次のうちどれですか? 誰でも自由にデータにアクセスできるようにする データへのアクセスを適切な権限を持つ人に限定する データをすべて削除する データを自動的に公開する None 41. AI技術の導入に伴い、契約において「プライバシー保護条項」が重要視される理由は次のうちどれですか? 契約の終了時にデータを削除するため 個人情報や機密データの不正利用を防ぐため 契約内容を一般に公開するため データの質を向上させるため None 42. AIシステムのセキュリティを強化する際に考慮すべき「アドバサリアル・ロバストネス(Adversarial Robustness)」とは何を指しますか? モデルのトレーニング時間を短縮する手法 敵対的攻撃に対してモデルが強靭であること モデルのデータをすべて削除する手法 モデルの出力結果を非公開にする手法 None 43. ビジネスにおける「持続可能性」とは次のうちどれですか? 企業が長期的に利益を維持するための方針 企業が環境、社会、経済のバランスを取りながら、長期的に発展するための概念 企業の資産を短期的に増加させるための戦略 企業の利益を従業員に分配する制度 None 44. 標本平均と母集団平均の差が小さい場合、次のうち正しい説明はどれですか? 母集団分布は正規分布に近い 標本サイズが非常に大きい 標本は母集団を代表している 母集団分散が大きい None 45. Pythonにおける「デコレータ(decorator)」の主な役割は次のうちどれですか? 関数やメソッドに追加の機能を動的に付与する クラスを生成するためのテンプレートを提供する 関数の実行結果をキャッシュする 配列の要素をフィルタリングする None 46. AIが気候変動対策で活用される場面として、最も適切なものは次のうちどれですか? 自然災害の予測と早期警報システムの強化 大気汚染の拡大 自然エネルギーの使用を制限する 気候変動に関するデータの非公開 None 47. 変数間の因果関係を説明するために用いられる「因果モデル」の一例として最も適切なものは次のうちどれですか? 散布図 中央値 ヒストグラム 因果推論モデル(Causal Inference Model) None 48. ウェブスクレイピングを行う際、ウェブサイトが提供するデータの取り扱いに関して考慮すべき法的要件は次のうちどれですか? ウェブページのソースコードの変更 APIエンドポイントの自由な利用 データの利用許諾とプライバシーポリシーの遵守 データのファイル形式の変更 None 49. プロジェクトマネジメントの5つのプロセス群に含まれないものは次のうちどれですか? 立ち上げ 計画 実行 評価 None 50. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 51. データの標準化(Standardization)において、最も一般的に使用される手法は次のうちどれですか? ワンホットエンコーディング Zスコア変換 ターゲットエンコーディング ログ変換 None 52. データ共有プラットフォームで「マルチテナントアーキテクチャ」が使用される理由は次のうちどれですか? 複数のユーザーが同一のシステムを共有しながらも、データを分離して管理できるため データの暗号化を自動的に行うため データの圧縮を効率化するため データベースのクエリを高速化するため None 53. プロジェクトの「ガントチャート」は何を管理するために使われますか? プロジェクトの予算管理 プロジェクトのリスク管理 プロジェクトのスケジュール管理 プロジェクトのステークホルダー管理 None 54. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None 55. A B C D None 56. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 57. AI技術の進化により、社会に最も顕著に見られる変化の1つは次のうちどれですか? 人間による意思決定が増加している 自動化による業務効率の向上 人々の労働時間が大幅に増加している データの重要性が低下している None 58. データの「正規化」を行う目的は次のうちどれですか? データの分布を平坦化するため データを標準偏差で整えるため データのノイズを削除するため 異なるスケールを持つデータを同一基準に揃えるため None 59. 自然言語処理(NLP)で使用される「Word2Vec」の役割は次のうちどれですか? テキストデータを分類する 単語をベクトル形式に変換し、意味的な類似性を捉える テキストデータを正規化する 単語をランダムに並べる None 60. 以下の三段論法が論理的に正しいかを判断してください。 「すべてのデータサイエンティストはプログラミングを学ぶ必要がある。 Aさんはデータサイエンティストである。 したがって、Aさんはプログラミングを学ぶ必要がある。」 この結論は正しいですか? 正しくない 前提が不十分であるため、判断できない 結論が飛躍しているため、正しくない 正しい None 61. Pythonのasyncioモジュールを使用して非同期処理を行う場合、関数の前に付けるキーワードは次のうちどれですか? async await defer yield None 62. ITセキュリティにおいて、データベースに保存されているデータを「静的データ暗号化(Encryption at Rest)」する目的は次のうちどれですか? データの送信中に盗聴されないようにするため データベースのパフォーマンスを向上させるため データのバックアップを効率化するため データが保存されている状態でも盗まれた場合に解読されないようにするため None 63. A B C D None 64. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 65. 動的計画法における「重複部分問題」とは何ですか? 同じ計算を何度も繰り返すこと 最適化において複数の制約条件が重なること 異なる部分問題が同じ答えを持つこと 同時に解くべき問題の集合 None 66. 課題定義のフレームワークとしてよく使用される「5 Whys(5回のなぜ)」の目的は次のうちどれですか? 複数の解決策を洗い出す 問題の根本原因を特定する 問題の影響範囲を広げる 問題解決のための手段を優先順位付けする None 67. プロジェクトマネージャーがチームメンバー間のコミュニケーションを促進するために使用すべき最も効果的な方法は次のうちどれですか? メールのみでやり取りを行う 定期的なミーティングを設定し、進捗と課題を共有する 全てのコミュニケーションを管理者経由で行う 個別に連絡を取り、個々の進捗を確認する None 68. 生成モデルを評価する際、Inception Score(IS)が主に評価する要素は何ですか? 生成されたデータの品質と多様性 生成モデルのトレーニング速度 モデルの過学習の程度 データの次元削減精度 None 69. 教育分野におけるAIの活用例として最も適切なものは次のうちどれですか? AIがすべての授業を担当する AIがすべての教員を置き換える AIが生徒一人ひとりに合わせたカリキュラムを提供する AIが学習環境を監視する None 70. 企業が従業員に対して行うべき「情報セキュリティ教育」の目的は次のうちどれですか? 従業員が企業の機密情報を外部に漏洩しないようにするため 従業員が自由に情報を共有できるようにするため 取引先の情報を収集する方法を教えるため 企業の利益を最大化するため None 71. AIシステム運用における「システム可用性」を向上させるための方法として最も適切なものは次のうちどれですか? システムのトラフィックを制限し、ユーザー数を減らす モデルのハイパーパラメータを調整して精度を向上させる モデルのトレーニングデータを定期的にバックアップする 冗長構成を採用し、障害が発生してもシステムが稼働し続けられるようにする None 72. データ可視化において、変数の密度分布を滑らかに表現するために使用される手法はどれですか? ヒストグラム KDE(カーネル密度推定) 散布図 箱ひげ図 None 73. 「ハラスメント防止」に関する行動規範の主な目的は次のうちどれですか? 職場内での不正行為を防止するため 従業員の人権を尊重し、健全な職場環境を維持するため 従業員の労働時間を管理するため 従業員の個人情報を保護するため None 74. データのスケーリング(正規化)を行う目的として最も適切なものは次のうちどれですか? データの分散を減少させるため 異なるスケールを持つ変数を比較可能にするため データの因果関係を強化するため データをランダムに並べ替えるため None 75. デザイン思考に基づく課題定義のプロセスにおいて、最初に行うべきステップは次のうちどれですか? プロトタイプを作成し、テストを行う 解決策のアイデアをブレインストーミングする 課題を具体的に定義し、SMARTゴールを設定する 共感フェーズでユーザーのニーズを理解する None 76. 「中間項不周延の誤謬」が発生するのは次のどのケースですか? 前提と結論が論理的に関係していない場合 二つの異なる前提が正しく結びつけられていない場合 中間項がすべての前提に適切に当てはまらない場合 結論が前提に基づかない場合 None 77. 生成AIの「Diffusionモデル」が注目されている理由として正しいものは次のうちどれですか? 計算コストが低いため 時系列データに適しているため 高品質な画像やテキストを生成できるため リアルタイム処理に特化しているため None 78. 時系列データの特性として、次のうち正しいものはどれですか? データが一貫して変動しない データがランダムに取得される データが構造化されていない 時間に沿った順序が重要である None 79. 「UX(ユーザーエクスペリエンス)」デザインにおける重要な要素として正しいものは次のうちどれですか? 製品の技術的な性能を最大化すること ユーザーの体験全体を設計し、使いやすさや満足度を向上させる デザインのコストを最小化すること 製品の外観や見た目に重点を置くこと None 80. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 81. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 82. GANやVAEのような生成モデルを用いて、新しいデータを生成する際に直面する可能性のある課題は何ですか? モデルのトレーニングに非常に時間がかかる モデルが生成したデータが現実のデータと大きく異なる場合がある ラベル付けが必要なデータでしか動作しない ハイパーパラメータの調整が不要である None 83. 仮説検定において「有意水準」とは何を指しますか? 第二種の誤りを許容する確率の上限 第一種の誤りを許容する確率の上限 ある仮説が真である確率 データのばらつきを示す指標 None 84. 事業へのAIの実装において、PoCから本番導入への移行が困難となる理由として適切なものは次のうちどれですか? PoCでは問題が発生しないため、運用段階でのリスクが高くなる PoCの段階でデータが少なく、本番でのスケーラビリティが確保できない モデルの精度が高すぎるため、過学習が起こる データが一貫していないため、結果が変動する None 85. 予測モデルを本番環境にデプロイする際、APIの利用が推奨される理由は何ですか? モデルのスケーラビリティを向上させるため モデルの再学習が不要になるため モデルのパフォーマンスが向上するため モデルのパラメータを固定するため None 86. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 87. 次のうち、欠損値を扱う際に考慮すべき重要な点はどれですか? 欠損値を全て0で置き換える 欠損値の存在を無視して分析を進める 欠損値を全て削除する 欠損値のパターンがデータの偏りを生むかどうかを確認する None 88. 幅優先探索(BFS)を使用してグラフの最短経路を見つける際、適切なデータ構造は次のうちどれですか? キュー(Queue) スタック(Stack) ヒープ(Heap) 配列(Array) None 89. デザイン思考の「共感」のステップでは、何が行われますか? 製品のコンセプトを開発する 製品の最終的な評価を行う プロジェクトの予算を確保する ユーザーのニーズや問題を理解するために観察やインタビューを行う None 90. 大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか? 系統抽出 ランダムフォレストを使用する クロスバリデーション 無作為抽出 None 91. 木構造(Tree)において、全ての子ノードが2つ以下のノードを持つ木のことを何と呼びますか? 完全二分木 二分木 完全グラフ 平衡木 None 92. データの前処理における「欠損値の補完」の方法として最も適切なものは次のうちどれですか? 欠損値を全て削除する 欠損値を平均値や中央値で補完する 欠損値をそのまま残す 欠損値にランダムな値を入力する None 93. AIが金融業界にもたらしている変化として最も一般的なものは次のうちどれですか? 人間の判断に完全に依存する取引 リスク分析や融資判断における自動化 人間の労働時間の増加 顧客との対面相談の増加 None 94. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 95. データサイエンスにおける「フィーチャーエンジニアリング」の目的は次のうちどれですか? モデルの精度を向上させるために、重要な特徴量を作成・選択すること データの可視化を行うこと データの取得元を確認すること モデルの精度を低下させること None 96. データサイエンスにおける「特徴量エンジニアリング」とは何を指しますか? データの前処理を行う データの収集を行う モデルの精度を向上させるために、重要な特徴量を作成・選択すること データを可視化すること None 97. データ共有における「データカタログ」の主な機能は次のうちどれですか? データを暗号化し、セキュリティを強化する データの処理速度を最適化する データベースのスケーリングを行う データの内容や構造に関する情報を集約し、ユーザーが適切なデータを発見できるようにする None 98. 科学的解析において「信号対雑音比(SNR)」を最大化することが重要な理由は何ですか? データの正確さを向上させるため 誤差を最小化するため 雑音を減らして信号の強度を強調するため サンプルサイズを大きくするため None 99. 課題の定義において「曖昧さを排除する」ための手法として最も有効なものは次のうちどれですか? 課題を具体的かつ測定可能な形で定義し、SMARTゴールを設定する できるだけ多くの意見を取り入れ、柔軟に対応する 課題を抽象的に捉え、様々な視点からアプローチする 既存のデータや情報に基づいて課題を広範囲に定義する None 100. p値が0.01のとき、これは次のどれに該当しますか? 仮説は棄却されるべきではない 結果が統計的に有意ではない 仮説は棄却されるべきである 第二種の誤りが犯されている None Time's up