DS検定~模擬試験②~ 2024年12月7日2024年12月7日 ailearn 1. 主成分分析 (PCA) において、主成分を選定するために一般的に使用される基準は何ですか? 分散の大きさ p値の大きさ 相関係数の大きさ 標準偏差の大きさ None 2. 課題の定義において、利害関係者全体の合意を得るために重要なポイントとして最も適切なものは次のうちどれですか? 各ステークホルダーの意見を均等に反映させる 課題の範囲をできるだけ広げて、多様な意見を取り入れる 課題の影響や利点を明確にし、共通の目標を設定する 一部のステークホルダーの意見を優先し、迅速に決定を進める None 3. AIが「災害管理」において活用される場面として最も適切なものは次のうちどれですか? 災害復興費用の計算を手動で行う 天候データを分析して災害発生を予測する 被災者の救助活動を全て人力で行う 災害発生後のニュース報道を作成する None 4. データの特徴量間の相関関係を確認する際に、特に多次元データセットに適している可視化手法は次のうちどれですか? ヒストグラム 棒グラフ 箱ひげ図 散布図行列(Pair Plot) None 5. 「気候変動対策」におけるAIの役割として最も適切なものは次のうちどれですか? AIが気候変動に関与しない AIが気象データを分析し、気候変動の影響を予測する 気候変動に関するデータを削除する 気候変動対策を停止する None 6. AIが物流業界で利用される際の代表的な用途は次のうちどれですか? 荷物の重量測定 人手による配送の完全な代替 配送先の削減 配送ルートの最適化と需要予測 None 7. 課題定義において、ステークホルダーからのフィードバックを効果的に活用する方法として適切なものは次のうちどれですか? フィードバックを受けたら、すぐにその意見を基に解決策を実施する すべてのフィードバックをまとめて、解決策の検討に利用する 重要なステークホルダーのフィードバックのみを反映させる フィードバックを検討し、課題の定義が適切かどうか再評価する None 8. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 9. 信頼区間が狭い場合、その結果に対してどのような解釈ができますか? 標本の精度が高いことを示す。 標本サイズが小さいことを示す。 分散が大きいことを示す。 データが正規分布に従わないことを示す。 None 10. 信頼区間の解釈として正しいものはどれですか? サンプルの平均が信頼区間内にある確率 母集団の分散が信頼区間内にある確率 母集団の平均が常に信頼区間内にあること 母集団の平均が信頼区間内にある確率 None 11. 課題定義の際に、現状分析と未来予測を組み合わせて行うことで得られるメリットは次のうちどれですか? 現在の問題と将来的なリスクやチャンスを同時に考慮できる 解決策の実行を迅速に進めることができる 過去のデータに基づいて確実な解決策を導き出すことができる チームメンバー全員の合意を得ることができる None 12. 木構造(Tree)において、全ての子ノードが2つ以下のノードを持つ木のことを何と呼びますか? 完全二分木 二分木 完全グラフ 平衡木 None 13. AIが「製造業における品質管理」において最も効果的に活用される方法は次のうちどれですか? AIが製品の不良品をリアルタイムで検出し、品質の改善を促進する AIが製品の品質に関与しない AIがすべての製品を無条件で合格させる 製造ラインでAIを無視する None 14. グラフの探索アルゴリズムである深さ優先探索(DFS)は、次のうちどのような順序でノードを探索しますか? 隣接する全てのノードを同時に探索する 最も浅いノードから順に探索する エッジの重みが最も小さいノードを優先して探索する 最も深いノードまで探索し、その後バックトラックして次のノードを探索する None 15. 外れ値の影響を受けにくい代表値はどれですか? 平均値 分散 標準偏差 メディアン None 16. モデルの性能を比較するために使用される「クロスバリデーション」の利点として最も適切なものは次のうちどれですか? データの一部のみでモデルを評価する トレーニングデータ全体を用いてモデルを評価できる 過学習を促進する テストデータを完全に除外する None 17. 科学的解析における仮説検定の第一種の誤りとは何を指しますか? 帰無仮説が真であるのに、誤って棄却すること 帰無仮説が偽であるのに、棄却しないこと データに基づかない推論を行うこと 仮説を正しく検証できないこと None 18. 仮説検定において、第二種の誤り(βエラー)を減少させるために適切な方法は次のうちどれですか? 有意水準(α)を大きくする。 データの標準化を行う。 p値を低下させる。 サンプルサイズを増加させる。 None 19. カテゴリカルデータを分析する際に、データ間の関係を評価するために使用される統計手法は何ですか? t検定 カイ二乗検定 ANOVA ピアソン相関係数 None 20. データの分布形状を確認するために最適な手法は次のうちどれですか? 箱ひげ図(ボックスプロット) ヒストグラム 散布図 クロス集計表 None 21. 以下のヒープ構造に関する説明として正しいものはどれですか? 各ノードの値はその子ノードの値よりも常に小さいか等しい。 最小値の要素が常にルートに配置される。 最大ヒープ 二分探索木 AVL木 最小ヒープ None 22. ニューラルネットワークにおいて、「勾配消失問題」を軽減するために最も有効な手法は次のうちどれですか? 活性化関数にReLUを使用する モデルを小さくする 隠れ層を減らす 学習率を0にする None 23. ヘルスケア分野でのAIの利活用において、次のうち正しい活用例はどれですか? AIが医師の診断を支援し、診療プロセスを最適化する AIがすべての薬の製造を行う AIが患者の全ての治療を担当する AIが薬の効能を決定する None 24. デザイン思考において、ユーザーの行動を観察し、潜在的なニーズを発見するための方法はどれですか? ブレインストーミング エスノグラフィー調査 スワット分析 ファイブフォース分析 None 25. デザイン思考における「リフレーミング」の主な目的は何ですか? 問題を異なる視点から再評価し、新しい解決策を見つけるため 製品のデザインを見直して、コスト削減を図るため チームの役割分担を変更するため 既存の解決策をそのまま採用するため None 26. 以下の条件を満たすデータ構造として最も適切なものはどれですか? キーと値のペアを管理。 データの追加、削除、検索を平均O(1)の時間で行える。 配列 リンクリスト ハッシュテーブル ヒープ None 27. データサイエンスにおける「特徴量選択」の目的として最も適切なものは次のうちどれですか? 不必要な特徴量を削除し、モデルの精度と計算効率を向上させる データセットを大きくする モデルのパラメータを自動設定する モデルの複雑さを高める None 28. 二分ヒープ(Binary Heap)の特性に関して正しい説明はどれですか? 親ノードの値は常に子ノードの値より大きいか、または小さい 親ノードの値は常に子ノードの値と等しい 親ノードの値は常に子ノードの値よりランダムに決まる ヒープは常に平衡状態を維持する None 29. 「デザイン思考」で「収束的思考」を使用するタイミングとして最も適切なものは次のうちどれですか? 問題を広範に探索し、アイデアを発散させる段階 データを収集し、分析の範囲を設定する段階 顧客ニーズを特定するための初期段階 アイデアを評価し、実現可能性の高い解決策を絞り込む段階 None 30. 「自動運転車」におけるAIの役割として最も適切なものは次のうちどれですか? AIがリアルタイムで周囲の環境を認識し、安全な運転を支援する AIが車両のエネルギー供給を担当する AIが運転者を無視する 自動運転車ではAIが不要である None 31. 着想プロセスにおいて「ブレインストーミング」の主な目的は何ですか? 自由なアイデアを多く集め、後で整理するため 特定の課題に対して迅速に解決策を導くため 既存のアイデアを深く分析するため 問題を明確に定義するため None 32. デザイン思考の「共感」のステップでは、何が行われますか? 製品のコンセプトを開発する 製品の最終的な評価を行う プロジェクトの予算を確保する ユーザーのニーズや問題を理解するために観察やインタビューを行う None 33. 「発散的思考」とは、どのようなプロセスを指しますか? 1つの問題に対して特定の解決策を深掘りするプロセス 問題を解決するためのデータを収集するプロセス さまざまな視点から自由にアイデアを広げるプロセス 解決策を具体的に実行するプロセス None 34. 配列(Array)のデータ構造において、データ要素の挿入や削除が特に時間がかかるのはどの位置ですか? 先頭 中央 末尾 ランダム None 35. 予測モデルの精度を評価するために、交差検証を行う主な理由は何ですか? サンプルサイズを増やすため モデルの誤差を最小化するため データセットをランダムに分割するため モデルの過学習を防ぐため None 36. 二分探索木(Binary Search Tree)において、各ノードの左側のサブツリーに含まれる値はどのように配置されますか? 親ノードよりも大きい 親ノードと等しい 親ノードよりも小さい 親ノードとは関係ない None 37. 「スポーツ分野」でAIが活用される例として最も適切なものは次のうちどれですか? 試合中の観客数を記録する 試合スケジュールを手動で調整する スポーツ用品の価格を設定する 選手のパフォーマンスデータを分析し、トレーニング計画を最適化する None 38. グラフ(Graph)のデータ構造において、隣接リスト(Adjacency List)の利点は次のうちどれですか? メモリ使用量が少ない 全てのノードにアクセスするのが高速である エッジが密なグラフに向いている サイクルの検出が容易である None 39. 階層的クラスタリングにおいて、クラスタ間の距離を測定するための手法は次のうちどれですか? ユークリッド距離 ピアソン相関係数 カイ二乗距離 マンハッタン距離 None 40. 課題定義において、現状と目標との間にある「ギャップ」を明確にする目的は次のうちどれですか? 課題の優先順位を付けるため 現状の改善ポイントを特定し、解決策を導くため 競合他社との差別化を図るため 目標を達成できないリスクを回避するため None 41. AIが最も活用されている分野の1つとして正しいものは次のうちどれですか? 農業のみ 製造業、金融業、医療業など、さまざまな産業 芸術分野のみ 人間の感情理解に限定される None 42. 自然言語処理(NLP)における「注意機構(Attention Mechanism)」の主な目的は次のうちどれですか? モデルの計算コストを削減する テキストを固定長のベクトルに変換する 複数の言語を同時に処理する テキスト全体の重要な情報を動的に特定する None 43. トポロジカルソート(Topological Sort)は、次のうちどのタイプのグラフで使用されますか? 無向グラフ 有向非巡回グラフ(DAG) 完全グラフ 部分グラフ None 44. AIが「自動車産業の生産ライン」において果たす役割として、最も適切なものは次のうちどれですか? AIが生産を停止する 生産ラインの労働力を増やす 生産ラインの速度を遅くする AIが生産プロセスを自動化し、品質管理を強化する None 45. データの次元が多すぎるときに、次元削減を行うために適切な手法はどれですか? 主成分分析 (PCA) k-平均法 決定木 サポートベクターマシン (SVM) None 46. 課題の定義において、「解決策を先に考えてしまう」ことのリスクは次のうちどれですか? 課題の本質を見逃し、誤ったアプローチを取る可能性が高まる 迅速に解決策を見つけることができなくなる チーム内での合意形成が困難になる 問題が複雑化する None 47. デザイン思考において「反復的なプロトタイピング」が重要とされる理由は次のうちどれですか? 繰り返しのテストを通じて、製品やサービスを改善し続けることができるため 最初のプロトタイプが必ずしも最終製品になるため プロトタイプを一度に多く作ることでコストを削減できるため プロジェクトの納期を短縮するため None 48. データセットに含まれる外れ値を検出するために最も効果的な視覚化手法はどれですか? 箱ひげ図 ヒストグラム 散布図 Q-Qプロット None 49. 教育分野でAIを活用して学習成果を最大化する方法として、次のうち最も適切なものはどれですか? 各学生の進捗データを分析し、個別の学習プランを作成する 全ての学生に同じ教材を一斉に提供する 教師が使用する教材のデジタル化を促進する 教育機関の経費を削減するためにAIを活用する None 50. デザインプロセスにおける「収束的思考」の役割は次のうちどれですか? 多くのアイデアを絞り込み、実現可能なものにフォーカスする アイデアをできるだけ多く出すプロセス 問題を分析し、根本原因を特定するプロセス ユーザーのニーズを理解するためのステップ None 51. データの正規性を検定するための手法として適切なものは次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 相関係数 None 52. ビジネスデザインにおける「ブルーオーシャン戦略」とは何ですか? 既存市場での競争に勝つための戦略 競争の少ない新しい市場を開拓する戦略 競合他社を模倣する戦略 製品コストを下げるための戦略 None 53. 課題定義において「ステークホルダー分析」の目的は次のうちどれですか? 課題に関わる利害関係者の影響や関心を特定するため 課題を迅速に解決するための戦略を策定するため 課題解決のためのコストを算出するため 課題に対する法的な影響を確認するため None 54. B木(B-Tree)がよく使われるデータベースのインデックス構造である理由は何ですか? 木の高さが固定されているため データが自動的にソートされるため 大量のデータに対してもバランスが保たれるため 全てのノードが1つの値を持つため None 55. データ構造「デキュー(Deque)」の主な特徴として正しいものは次のうちどれですか? 要素の挿入と削除が両端から行える。 要素の削除は先頭のみで行える。 要素の挿入は後端のみで行える。 要素の挿入や削除はランダムに行える。 None 56. 標本平均と母集団平均を比較するために、標本の標準誤差を用いる理由は何ですか? 母集団の分散を推定するため 標本の標準偏差を推定するため 標本平均のばらつきを測定するため 標本数を増やすため None 57. 課題定義において「問題の本質を捉える」とは、どのようなことを意味しますか? 表面的な症状ではなく、根本的な原因を明確にすること 問題が存在することを記録すること 問題を全ての関係者に周知すること 問題が発生した時点でのデータを収集すること None 58. 機械学習のモデル評価において、データのバランスが重要となるケースとして適切なものはどれですか? クラスタリング 回帰分析 分類問題 PCA None 59. カテゴリカルデータの分布を視覚化する際、最も適切なグラフは次のうちどれですか? 棒グラフ 散布図 ヒートマップ 箱ひげ図 None 60. 農業におけるAIの主な役割は次のうちどれですか? 農作業全般を人間に代わって行う 農業におけるデータ活用を無効にする 気象データや土壌データを基に作物の成長を最適化する 農作物の種類を制限する None 61. 機械学習において、「ランダムフォレスト」の主な特徴として最も適切なものは次のうちどれですか? 線形回帰の一種である データを多次元の空間にマッピングする手法である 多数の決定木を用いて予測の精度を向上させるアルゴリズムである 時系列データ専用のアルゴリズムである None 62. データの欠損値処理において「多重代入法(Multiple Imputation)」の特徴として最も適切な説明は次のうちどれですか? 欠損値を単純に削除する 欠損値を1回だけ補完する 欠損値を複数回補完し、結果を統合する 欠損値をランダムに生成する None 63. ある変数 X が、他の変数 Y と非線形な関係を持っていることが予想される場合、適切な解析手法は次のうちどれですか? 線形回帰 ロジスティック回帰 多項式回帰 単回帰分析 None 64. データの分布が正規分布に従っているかどうかを確認するための視覚的な手法はどれですか? ヒストグラム 散布図 箱ひげ図 Q-Qプロット None 65. 「SMARTゴール」を使って課題を定義する際、何が重要とされるか? 課題が多様で、包括的で、創造的であること 課題が具体的で、測定可能で、達成可能で、関連性があり、期限が明確であること 課題が挑戦的で、リスクが高く、革新的であること 課題が単純で、分かりやすく、迅速に解決できるものであること None 66. 「シナリオプランニング」とは何ですか? 既存のデザインを改善するためのテストプロセス ユーザーの行動を観察し、問題を特定するためのプロセス デザインの具体的な実行計画を策定するプロセス 将来の複数の可能性に備えた計画を策定するプロセス None 67. 2標本t検定を使用して2つのグループの平均を比較する際、次のうち正しい仮定はどれですか? 両グループの分散は等しい 両グループの分散は異なる 両グループのサンプルサイズは等しい 両グループのサンプルサイズは異なる None 68. データの欠損率が高い場合に推奨される手法はどれですか? 多重代入法 欠損データの削除 平均値による補完 中央値による補完 None 69. 「ディープラーニング」において最も一般的に使用されるフレームワークは次のうちどれですか? TensorFlow Excel R Tableau None 70. 課題定義のプロセスにおいて、最初に行うべきステップは次のうちどれですか? 現状分析 解決策の提案 チーム編成 予算の確保 None 71. 科学的解析における外れ値の影響を最小化するために有効な手法はどれですか? 平均値を使用する メディアンを使用する 回帰分析を行う 分散分析を行う None 72. 課題を定義する際に使用される「SWOT分析」の要素に含まれないものは次のうちどれですか? 弱み(Weaknesses) 機会(Opportunities) リーダーシップ(Leadership) 強み(Strengths) None 73. グラフにおいて、エッジの数がノード数に比べて非常に少ない場合、このようなグラフを指す用語は次のうちどれですか? 密グラフ(Dense Graph) 疎グラフ(Sparse Graph) 完全グラフ(Complete Graph) 有向グラフ(Directed Graph) None 74. デザインプロセスにおける「デザインシンキング」の特徴として正しいものは次のうちどれですか? 製品の技術的性能を最優先するアプローチ コスト削減を最優先するアプローチ ユーザー中心のアプローチを取り、反復的なプロセスで解決策を創出する デザインの見た目や美観を重視するアプローチ None 75. 「人間中心設計」の基本的な概念として正しいものは次のうちどれですか? デザインを効率よく進めるための組織内の管理手法 デザインのコスト削減を目的としたプロセス デザインの中心にユーザーのニーズや体験を据えたプロセス デザインの完成度を最優先するプロセス None 76. 「自然言語処理(NLP)」における「Bag of Words」のアプローチの特徴として最も適切なものは次のうちどれですか? テキストを単語の出現頻度ベースで表現するが、単語の順序は無視する 単語の順序を重視し、文脈を保持する テキストを画像データとして変換する 単語の出現頻度を無視する None 77. ニューラルネットワークの「バッチ正規化(Batch Normalization)」の主な目的は次のうちどれですか? モデルのサイズを小さくする データの正規化を行う 学習率を自動調整する 各層の出力を正規化し、学習の安定化と加速を図る None 78. 「問題をフレーミングする」とは、どのようなプロセスですか? 問題を特定の視点から定義し、問題の範囲や焦点を明確にすること 問題を抽象的に定義し、解決策を多角的に検討すること 問題を数値化し、具体的な測定指標を設定すること 問題をステークホルダー間で共有し、合意を得ること None 79. グラフデータ構造において、全てのノードが他の全てのノードとエッジで直接つながっている場合、このグラフは何と呼ばれますか? 部分グラフ 無向グラフ 完全グラフ 木構造 None 80. デザイン思考に基づく課題定義のプロセスにおいて、最初に行うべきステップは次のうちどれですか? プロトタイプを作成し、テストを行う 解決策のアイデアをブレインストーミングする 課題を具体的に定義し、SMARTゴールを設定する 共感フェーズでユーザーのニーズを理解する None 81. 相関関係がある2つの変数間で因果関係を示すためには、次のうちどの手法が適切ですか? 単純な回帰分析 グランジャー因果分析 t検定 カイ二乗検定 None 82. 複数のステークホルダーが関与する課題の定義において、利害関係の衝突を防ぐために有効なアプローチは次のうちどれですか? 最も影響力のあるステークホルダーの意見を優先する すべての利害関係者に対して同じ優先順位を設定する 課題の定義に関与するステークホルダーをできるだけ減らす 各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける None 83. モデルの性能を評価するために使用される「混同行列」の要素に含まれないものは次のうちどれですか? True Positive False Negative True Negative Recall None 84. 時系列データの自己相関関数 (ACF) を使用して確認できるものは何ですか? データ間の線形関係 データ間の時間依存性 データの外れ値 データの平均 None 85. 散布図において、2つの変数が互いに強い線形関係を示すときのグラフの形は? 水平な線 垂直な線 斜めの直線 曲線 None 86. 課題の定義において「曖昧さを排除する」ための手法として最も有効なものは次のうちどれですか? 課題を具体的かつ測定可能な形で定義し、SMARTゴールを設定する できるだけ多くの意見を取り入れ、柔軟に対応する 課題を抽象的に捉え、様々な視点からアプローチする 既存のデータや情報に基づいて課題を広範囲に定義する None 87. データの正規性を検定するための方法の1つとして使用される検定はどれですか? Shapiro-Wilk検定 t検定 F検定 カイ二乗検定 None 88. 課題定義の段階で「現状分析」を実施する主な目的として最も適切なものは次のうちどれですか? 現状と目標のギャップを明確にし、解決すべき課題を特定するため 将来の解決策を事前に決定するため ビジネス課題を抽象化し、詳細な分析を回避するため 利害関係者間の意見を完全に統一するため None 89. 「ペーパープロトタイプ」の利点として最も適切なものは次のうちどれですか? 最終製品の完成度を確認するため プロトタイプの耐久性を検証するため 複雑な機能を正確にシミュレーションするため 低コストで迅速にユーザビリティテストを実施できる None 90. AIが「ヘルスケア分野のパーソナライズド医療」に貢献する方法として、最も適切なものは次のうちどれですか? AIが患者の遺伝情報を基に、最適な治療法を提案する AIがすべての患者に同じ治療法を提供する 患者の遺伝情報を無視する AIが患者のデータを削除する None 91. 次のグラフアルゴリズムの説明に該当するアルゴリズムとして正しいものはどれですか? 重み付きグラフにおいて、単一始点から他の全ノードへの最短経路を見つける。 負の重みが存在する場合でも動作する。 ダイクストラ法 プリム法 ベルマンフォード法 クラスカル法 None 92. 正規分布に従うデータを基にしたカイ二乗検定の帰無仮説は何ですか? 2つの変数が独立である データが正規分布に従っていない データが正規分布に従っている データの分散が等しい None 93. イノベーションのための「オズボーンのチェックリスト」に含まれる質問として適切なものは次のうちどれですか? 「製品の価格を上げるためにはどうすればよいか?」 「この製品の売上を最大化するには?」 「競合他社の製品をどう取り入れるか?」 「この製品をどう変えることができるか?」 None 94. 課題定義における「問題の本質を掘り下げる」手法の一つとして、どのアプローチが最も有効ですか? チームメンバー全員でブレインストーミングを行う ロジックツリーを使って問題を分解し、根本原因を探る 既存のデータを基に定量的な分析を行う 他社の事例を参考にし、同じアプローチを試す None 95. AIが「観光業」で活用される例として最も適切なものは次のうちどれですか? 宿泊施設の建設計画を立てる 観光客の行動データを分析し、個別化された旅行プランを提案する 航空機の整備スケジュールを最適化する ホテルの予約数を予測するだけでなく、手動で予約を管理する None 96. 回帰分析において、決定係数(R²)が1に近い場合、モデルについてどのように解釈できますか? モデルは全く役に立たない。 モデルはデータを完全に説明している。 モデルの誤差が大きいことを示す。 モデルの予測性能が低いことを示す。 None 97. 機械学習モデルの「過学習」を防ぐために最も効果的な手法は次のうちどれですか? データの増加 モデルの複雑化 正則化(レギュラリゼーション) 学習率の低下 None 98. A B C D None 99. データ分析における「欠損値処理」の最も一般的な方法は次のうちどれですか? 欠損値をそのまま残す 欠損値を削除する 平均値や中央値で補完する 欠損値を無視する None 100. 「勾配ブースティング」のアルゴリズムが他のアンサンブル学習手法と比較して優れている理由として最も適切なものは次のうちどれですか? モデルが完全に自動で構築される 学習データの誤差を段階的に修正する能力がある 全ての決定木が同じ重みで予測を行う モデルの解釈性が高い None Time's up