DS検定~模擬試験②~ 2024年12月7日2024年12月7日 ailearn 1. 仮説検定で「帰無仮説」とは何を意味しますか? 研究仮説が正しいという主張 データに基づかない推測 差がない、または効果がないという仮説 結果が偶然であることを示す仮説 None 2. 仮説検定において、第二種の誤り(βエラー)を減少させるために適切な方法は次のうちどれですか? 有意水準(α)を大きくする。 データの標準化を行う。 p値を低下させる。 サンプルサイズを増加させる。 None 3. 科学的解析において「効果サイズ」とは何を指しますか? 仮説検定の結果がどれほど重要かを示す指標 分散の大きさを示す指標 標準誤差の大きさを示す指標 サンプルサイズの大きさを示す指標 None 4. 「問題をフレーミングする」とは、どのようなプロセスですか? 問題を特定の視点から定義し、問題の範囲や焦点を明確にすること 問題を抽象的に定義し、解決策を多角的に検討すること 問題を数値化し、具体的な測定指標を設定すること 問題をステークホルダー間で共有し、合意を得ること None 5. AIが「スマートシティ」の構築において果たす役割として最も適切なものは次のうちどれですか? 都市全体の運営をリアルタイムで最適化し、持続可能な社会の実現を支援する 都市の人口を減少させる 都市内のすべての活動を停止する 都市の環境を無視する None 6. 機械学習モデルの「過学習」を防ぐために最も効果的な手法は次のうちどれですか? データの増加 モデルの複雑化 正則化(レギュラリゼーション) 学習率の低下 None 7. 課題定義において「ステークホルダー分析」の目的は次のうちどれですか? 課題に関わる利害関係者の影響や関心を特定するため 課題を迅速に解決するための戦略を策定するため 課題解決のためのコストを算出するため 課題に対する法的な影響を確認するため None 8. AIが「災害管理」において活用される場面として最も適切なものは次のうちどれですか? 災害復興費用の計算を手動で行う 天候データを分析して災害発生を予測する 被災者の救助活動を全て人力で行う 災害発生後のニュース報道を作成する None 9. 「ペーパープロトタイプ」の利点として最も適切なものは次のうちどれですか? 最終製品の完成度を確認するため プロトタイプの耐久性を検証するため 複雑な機能を正確にシミュレーションするため 低コストで迅速にユーザビリティテストを実施できる None 10. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 11. AIが医療分野で使用される主な目的として最も適切なものは次のうちどれですか? すべての医師を置き換えるため 患者の診断をサポートし、早期発見を促進するため 医療機器の管理のみに使用するため 手術のみを担当するため None 12. 次のグラフアルゴリズムの説明に該当するアルゴリズムとして正しいものはどれですか? 重み付きグラフにおいて、単一始点から他の全ノードへの最短経路を見つける。 負の重みが存在する場合でも動作する。 ダイクストラ法 プリム法 ベルマンフォード法 クラスカル法 None 13. グラフデータ構造において、全てのノードが他の全てのノードとエッジで直接つながっている場合、このグラフは何と呼ばれますか? 部分グラフ 無向グラフ 完全グラフ 木構造 None 14. データサイエンスでよく使用される「ハイパーパラメータ」とは何ですか? モデルが自動で最適化するパラメータ モデルの学習プロセスで調整する必要のあるパラメータ データの欠損値を処理するための手法 データの前処理方法 None 15. 木構造(Tree)において、全ての子ノードが2つ以下のノードを持つ木のことを何と呼びますか? 完全二分木 二分木 完全グラフ 平衡木 None 16. B木(B-Tree)がよく使われるデータベースのインデックス構造である理由は何ですか? 木の高さが固定されているため データが自動的にソートされるため 大量のデータに対してもバランスが保たれるため 全てのノードが1つの値を持つため None 17. デザイン思考において、ユーザーの行動を観察し、潜在的なニーズを発見するための方法はどれですか? ブレインストーミング エスノグラフィー調査 スワット分析 ファイブフォース分析 None 18. 「気候変動対策」におけるAIの役割として最も適切なものは次のうちどれですか? AIが気候変動に関与しない AIが気象データを分析し、気候変動の影響を予測する 気候変動に関するデータを削除する 気候変動対策を停止する None 19. AVL木(AVL Tree)の特徴は何ですか? 各ノードが必ず2つの子ノードを持つ 木全体の高さが常に固定されている 各ノードの左右の部分木の高さの差が1以内に保たれている 子ノードの値が親ノードの値よりも大きい None 20. 「自然言語処理(NLP)」における「Bag of Words」のアプローチの特徴として最も適切なものは次のうちどれですか? テキストを単語の出現頻度ベースで表現するが、単語の順序は無視する 単語の順序を重視し、文脈を保持する テキストを画像データとして変換する 単語の出現頻度を無視する None 21. グラフ(Graph)のデータ構造において、隣接リスト(Adjacency List)の利点は次のうちどれですか? メモリ使用量が少ない 全てのノードにアクセスするのが高速である エッジが密なグラフに向いている サイクルの検出が容易である None 22. カテゴリカルデータの分布を視覚化する際、最も適切なグラフは次のうちどれですか? 棒グラフ 散布図 ヒートマップ 箱ひげ図 None 23. データの前処理で行う「標準化」とは次のうちどれを指しますか? データの分布を平均0、分散1に変換する データの分布を一様分布にする データの欠損値を削除する データを可視化する None 24. 課題定義において「仮説検証型アプローチ」を活用する際の最初のステップは次のうちどれですか? 仮説を立てる データ収集を開始する 分析ツールを選定する 成果指標(KPI)を設定する None 25. 以下のヒープ構造に関する説明として正しいものはどれですか? 各ノードの値はその子ノードの値よりも常に小さいか等しい。 最小値の要素が常にルートに配置される。 最大ヒープ 二分探索木 AVL木 最小ヒープ None 26. AIが「製造業における品質管理」において最も効果的に活用される方法は次のうちどれですか? AIが製品の不良品をリアルタイムで検出し、品質の改善を促進する AIが製品の品質に関与しない AIがすべての製品を無条件で合格させる 製造ラインでAIを無視する None 27. 「ペルソナ」とは、デザインプロセスにおいて何を指しますか? 製品のブランディングに用いるキャラクター 典型的なユーザー像を具体化した架空の人物 チームメンバーの役割を定義する概念 デザインの最終成果物を指す None 28. 散布図において、2つの変数が互いに強い線形関係を示すときのグラフの形は? 水平な線 垂直な線 斜めの直線 曲線 None 29. データの分布形状を確認するために最適な手法は次のうちどれですか? 箱ひげ図(ボックスプロット) ヒストグラム 散布図 クロス集計表 None 30. スタック(Stack)における操作の一つで、データを取り出す操作を何と呼びますか? push pop enqueue dequeue None 31. データ構造「デキュー(Deque)」の主な特徴として正しいものは次のうちどれですか? 要素の挿入と削除が両端から行える。 要素の削除は先頭のみで行える。 要素の挿入は後端のみで行える。 要素の挿入や削除はランダムに行える。 None 32. ビジネスデザインにおける「ブルーオーシャン戦略」とは何ですか? 既存市場での競争に勝つための戦略 競争の少ない新しい市場を開拓する戦略 競合他社を模倣する戦略 製品コストを下げるための戦略 None 33. カテゴリカルデータを分析する際に、データ間の関係を評価するために使用される統計手法は何ですか? t検定 カイ二乗検定 ANOVA ピアソン相関係数 None 34. 課題定義の段階で「現状分析」を実施する主な目的として最も適切なものは次のうちどれですか? 現状と目標のギャップを明確にし、解決すべき課題を特定するため 将来の解決策を事前に決定するため ビジネス課題を抽象化し、詳細な分析を回避するため 利害関係者間の意見を完全に統一するため None 35. 予測モデルの精度を評価するために、交差検証を行う主な理由は何ですか? サンプルサイズを増やすため モデルの誤差を最小化するため データセットをランダムに分割するため モデルの過学習を防ぐため None 36. データの分布が正規分布に従っているかどうかを確認するための視覚的な手法はどれですか? ヒストグラム 散布図 箱ひげ図 Q-Qプロット None 37. 課題定義の際に、現状分析と未来予測を組み合わせて行うことで得られるメリットは次のうちどれですか? 現在の問題と将来的なリスクやチャンスを同時に考慮できる 解決策の実行を迅速に進めることができる 過去のデータに基づいて確実な解決策を導き出すことができる チームメンバー全員の合意を得ることができる None 38. 「サプライチェーン」におけるAIの役割として、最も適切なものは次のうちどれですか? AIがすべての物流業務を無効化する サプライチェーンのデータを削除する すべての業務を人間が手動で管理する AIが供給と需要のバランスを最適化し、リスク管理を強化する None 39. 教育分野におけるAIの活用例として最も適切なものは次のうちどれですか? AIがすべての授業を担当する AIがすべての教員を置き換える AIが生徒一人ひとりに合わせたカリキュラムを提供する AIが学習環境を監視する None 40. データサイエンスにおける「特徴量エンジニアリング」とは何を指しますか? データの前処理を行う データの収集を行う モデルの精度を向上させるために、重要な特徴量を作成・選択すること データを可視化すること None 41. データの次元が多すぎるときに、次元削減を行うために適切な手法はどれですか? 主成分分析 (PCA) k-平均法 決定木 サポートベクターマシン (SVM) None 42. 欠損データの補完方法として、機械学習モデルを使用する際に特に考慮すべき点は次のうちどれですか? 補完後のデータ分布が元のデータと一致すること。 欠損値をすべて平均値で補完すること。 欠損データの削除を避けること。 欠損値の存在を無視しても問題ない場合に適用すること。 None 43. AIが最も活用されている分野の1つとして正しいものは次のうちどれですか? 農業のみ 製造業、金融業、医療業など、さまざまな産業 芸術分野のみ 人間の感情理解に限定される None 44. 分散分析 (ANOVA) の目的は何ですか? 2つの母集団の平均値を比較する データの標準偏差を比較する データの分散が一定であるかを検定する 3つ以上の母集団の平均値を比較する None 45. データの欠損値処理において「多重代入法(Multiple Imputation)」の特徴として最も適切な説明は次のうちどれですか? 欠損値を単純に削除する 欠損値を1回だけ補完する 欠損値を複数回補完し、結果を統合する 欠損値をランダムに生成する None 46. ニューラルネットワークにおいて、「勾配消失問題」を軽減するために最も有効な手法は次のうちどれですか? 活性化関数にReLUを使用する モデルを小さくする 隠れ層を減らす 学習率を0にする None 47. 二分探索木(Binary Search Tree)において、各ノードの左側のサブツリーに含まれる値はどのように配置されますか? 親ノードよりも大きい 親ノードと等しい 親ノードよりも小さい 親ノードとは関係ない None 48. 時系列データの自己相関関数 (ACF) を使用して確認できるものは何ですか? データ間の線形関係 データ間の時間依存性 データの外れ値 データの平均 None 49. デザイン思考の「共感」のステップでは、何が行われますか? 製品のコンセプトを開発する 製品の最終的な評価を行う プロジェクトの予算を確保する ユーザーのニーズや問題を理解するために観察やインタビューを行う None 50. 機械学習のモデル評価において、データのバランスが重要となるケースとして適切なものはどれですか? クラスタリング 回帰分析 分類問題 PCA None 51. 「発散的思考」とは、どのようなプロセスを指しますか? 1つの問題に対して特定の解決策を深掘りするプロセス 問題を解決するためのデータを収集するプロセス さまざまな視点から自由にアイデアを広げるプロセス 解決策を具体的に実行するプロセス None 52. 科学的解析において「信号対雑音比(SNR)」を最大化することが重要な理由は何ですか? データの正確さを向上させるため 誤差を最小化するため 雑音を減らして信号の強度を強調するため サンプルサイズを大きくするため None 53. AIが「観光業」で活用される例として最も適切なものは次のうちどれですか? 宿泊施設の建設計画を立てる 観光客の行動データを分析し、個別化された旅行プランを提案する 航空機の整備スケジュールを最適化する ホテルの予約数を予測するだけでなく、手動で予約を管理する None 54. 多重検定を行う場合、家族誤差率(Family-Wise Error Rate)を制御するために使用される手法はどれですか? Bonferroni補正 カイ二乗検定 ヒストグラムの作成 コレスポンデンス分析 None 55. データの自由度が減少すると、t検定の結果にどのような影響を与えますか? t値が大きくなる t値が小さくなる p値が小さくなる p値が大きくなる None 56. 「デザイン思考」のプロセスに含まれるステップとして正しいものは次のうちどれですか? 共感 → 定義 → 創造 → プロトタイプ → テスト 創造 → 評価 → テスト → 実装 問題定義 → 解決策探索 → 実行 分析 → 計画 → 評価 → 実行 None 57. データの特徴量間の相関関係を確認する際に、特に多次元データセットに適している可視化手法は次のうちどれですか? ヒストグラム 棒グラフ 箱ひげ図 散布図行列(Pair Plot) None 58. AIが金融業界で特に活用されている分野は次のうちどれですか? 融資判断とリスク管理 金庫管理 物理的な現金の流通 店舗デザイン None 59. 「着想・デザイン」において、データを活用してアイデアを発想する際の主な利点は次のうちどれですか? データの精度に関係なく創造的な発想が可能になる 仮説の妥当性を客観的に評価できる 定性的データを必要としなくなる 発想のプロセスを省略できる None 60. 課題の定義において、ステークホルダーの要望が多岐にわたる場合、最も適切な対処法は次のうちどれですか? 全ての要望を無条件に受け入れる 主要なステークホルダーの要望だけを考慮する 各要望をビジネスインパクトや実現可能性の観点で優先順位付けする 要望に優先順位を付けずにすべて平等に扱う None 61. 「トライ木(Trie)」を用いたデータ構造の主な応用例として最も適切なものはどれですか? 数値データの範囲検索 文字列の検索やオートコンプリート グラフデータの最短経路探索 データベースのインデックス管理 None 62. 赤黒木(Red-Black Tree)は、二分探索木の一種であり、次のうち正しい特性はどれですか? 各ノードの値が常に奇数である 各ノードが赤または黒に塗られている 全ての葉ノードは赤である 木の高さは常に一定である None 63. AIを活用した「インシュアテック(InsurTech)」の目的は次のうちどれですか? AIを活用して保険業務の自動化やリスク管理の効率化を実現する AIによってすべての保険業務を廃止する 保険契約者のデータを削除する 保険金の支払いを減少させる None 64. 課題の定義において「曖昧さを排除する」ための手法として最も有効なものは次のうちどれですか? 課題を具体的かつ測定可能な形で定義し、SMARTゴールを設定する できるだけ多くの意見を取り入れ、柔軟に対応する 課題を抽象的に捉え、様々な視点からアプローチする 既存のデータや情報に基づいて課題を広範囲に定義する None 65. モデルのパフォーマンスを向上させるための「ハイパーパラメータチューニング」の一般的な方法は次のうちどれですか? データの削除 モデルの複雑化 正則化の排除 グリッドサーチ None 66. AIが「法務分野」において文書管理で利用される場合、主な利点として最も適切なものは次のうちどれですか? 全ての法律文書を物理的に保存する 法律改正の必要性を自動的に提案する 裁判官の判決を完全に自動化する 大量の法的文書を自動分類し、重要な情報を抽出する None 67. 「デザイン思考」において、ユーザーインタビューを行う際に最も重要な要素は次のうちどれですか? ユーザーに簡潔な選択肢を提供する ユーザーが自らのニーズや行動を自由に語れる環境を整える ユーザーに特定の結論を導く質問をする データ収集の効率性を優先する None 68. データサイエンスで「クラスター分析」に使用される主なアルゴリズムは次のうちどれですか? ロジスティック回帰 k-means法 線形回帰 決定木 None 69. デザイン思考における「リフレーミング」の主な目的は何ですか? 問題を異なる視点から再評価し、新しい解決策を見つけるため 製品のデザインを見直して、コスト削減を図るため チームの役割分担を変更するため 既存の解決策をそのまま採用するため None 70. 正規分布に従うデータを基にしたカイ二乗検定の帰無仮説は何ですか? 2つの変数が独立である データが正規分布に従っていない データが正規分布に従っている データの分散が等しい None 71. 課題の定義において、利害関係者全体の合意を得るために重要なポイントとして最も適切なものは次のうちどれですか? 各ステークホルダーの意見を均等に反映させる 課題の範囲をできるだけ広げて、多様な意見を取り入れる 課題の影響や利点を明確にし、共通の目標を設定する 一部のステークホルダーの意見を優先し、迅速に決定を進める None 72. データ分析における「欠損値処理」の最も一般的な方法は次のうちどれですか? 欠損値をそのまま残す 欠損値を削除する 平均値や中央値で補完する 欠損値を無視する None 73. 信頼区間が狭い場合、その結果に対してどのような解釈ができますか? 標本の精度が高いことを示す。 標本サイズが小さいことを示す。 分散が大きいことを示す。 データが正規分布に従わないことを示す。 None 74. 課題定義のプロセスで発生する「認知バイアス」を排除するための方法として最も適切なものは次のうちどれですか? すべてのチームメンバーの意見を無条件で採用する データに基づいて客観的に課題を評価し、多様な視点を取り入れる 既存の成功事例を参考にして、同様のアプローチを取る チームリーダーの指示に従い、意思決定を迅速に進める None 75. AIが「ヘルスケア分野のパーソナライズド医療」に貢献する方法として、最も適切なものは次のうちどれですか? AIが患者の遺伝情報を基に、最適な治療法を提案する AIがすべての患者に同じ治療法を提供する 患者の遺伝情報を無視する AIが患者のデータを削除する None 76. 課題の定義において、「解決策を先に考えてしまう」ことのリスクは次のうちどれですか? 課題の本質を見逃し、誤ったアプローチを取る可能性が高まる 迅速に解決策を見つけることができなくなる チーム内での合意形成が困難になる 問題が複雑化する None 77. 課題定義において「問題の本質を捉える」とは、どのようなことを意味しますか? 表面的な症状ではなく、根本的な原因を明確にすること 問題が存在することを記録すること 問題を全ての関係者に周知すること 問題が発生した時点でのデータを収集すること None 78. グラフ(Graph)の探索アルゴリズムの一つで、幅優先探索(Breadth-First Search)における探索順序はどれですか? 深さ優先で探索する 最も遠いノードから探索する 重みの大きいエッジを優先して探索する 隣接するノードを次々に探索する None 79. ある変数 X が、他の変数 Y と非線形な関係を持っていることが予想される場合、適切な解析手法は次のうちどれですか? 線形回帰 ロジスティック回帰 多項式回帰 単回帰分析 None 80. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 81. 課題定義における「問題の本質を掘り下げる」手法の一つとして、どのアプローチが最も有効ですか? チームメンバー全員でブレインストーミングを行う ロジックツリーを使って問題を分解し、根本原因を探る 既存のデータを基に定量的な分析を行う 他社の事例を参考にし、同じアプローチを試す None 82. 相関係数が -1 に近い場合、2つの変数間にはどのような関係がありますか? 強い正の相関がある 強い負の相関がある 変数間に相関はない 変数間には線形関係がない None 83. ヘルスケア分野でのAIの利活用において、次のうち正しい活用例はどれですか? AIが医師の診断を支援し、診療プロセスを最適化する AIがすべての薬の製造を行う AIが患者の全ての治療を担当する AIが薬の効能を決定する None 84. 課題定義の際に「仮説」を立てることの目的は次のうちどれですか? 最終的な結論を導き出すため 問題を多角的に解決するための複数の選択肢を導き出すため 課題の影響範囲を狭めるため 課題解決の方向性を早期に設定し、検証するため None 85. グラフの探索アルゴリズムである深さ優先探索(DFS)は、次のうちどのような順序でノードを探索しますか? 隣接する全てのノードを同時に探索する 最も浅いノードから順に探索する エッジの重みが最も小さいノードを優先して探索する 最も深いノードまで探索し、その後バックトラックして次のノードを探索する None 86. キュー(Queue)のデータ構造において、最初に追加された要素が最初に削除される方式は何と呼ばれますか? LIFO FIFO FILO LILO None 87. 課題定義のプロセスで「曖昧さ」を排除するために最も有効な方法は次のうちどれですか? 定性的データのみを活用する 定量的な成功指標を設定する 複数の解決策を同時に採用する 主観的な評価基準を使用する None 88. 課題定義のプロセスにおいて、最初に行うべきステップは次のうちどれですか? 現状分析 解決策の提案 チーム編成 予算の確保 None 89. 課題を定義する際、定性的データの利点として最も適切なものは次のうちどれですか? 定量的な数値を基に、問題の規模を正確に測定できる 問題の感情的・社会的な側面を理解することができる 問題を迅速に解決するための戦略を導き出すことができる 問題を簡単に可視化することができる None 90. モデルの性能を比較するために使用される「クロスバリデーション」の利点として最も適切なものは次のうちどれですか? データの一部のみでモデルを評価する トレーニングデータ全体を用いてモデルを評価できる 過学習を促進する テストデータを完全に除外する None 91. 課題定義のフレームワークとしてよく使用される「5 Whys(5回のなぜ)」の目的は次のうちどれですか? 複数の解決策を洗い出す 問題の根本原因を特定する 問題の影響範囲を広げる 問題解決のための手段を優先順位付けする None 92. データセットに外れ値が含まれる場合、回帰分析におけるモデルの精度を向上させるための適切なアプローチは次のうちどれですか? 外れ値を無視してモデルを構築する。 外れ値を削除するかロバスト回帰を使用する。 外れ値を平均値で補完する。 外れ値を新しいカテゴリとして扱う。 None 93. 「SMARTゴール」を使って課題を定義する際、何が重要とされるか? 課題が多様で、包括的で、創造的であること 課題が具体的で、測定可能で、達成可能で、関連性があり、期限が明確であること 課題が挑戦的で、リスクが高く、革新的であること 課題が単純で、分かりやすく、迅速に解決できるものであること None 94. ニューラルネットワークの「バッチ正規化(Batch Normalization)」の主な目的は次のうちどれですか? モデルのサイズを小さくする データの正規化を行う 学習率を自動調整する 各層の出力を正規化し、学習の安定化と加速を図る None 95. t検定において、標準誤差を計算する主な目的は次のうちどれですか? 標本データのばらつきを減少させるため。 母集団の標準偏差を推定するため。 標本平均の信頼性を評価するため。 標本間の相関を計算するため。 None 96. 階層的クラスタリングにおいて、クラスタ間の距離を測定するための手法は次のうちどれですか? ユークリッド距離 ピアソン相関係数 カイ二乗距離 マンハッタン距離 None 97. 複数のステークホルダーが関与する課題の定義において、利害関係の衝突を防ぐために有効なアプローチは次のうちどれですか? 最も影響力のあるステークホルダーの意見を優先する すべての利害関係者に対して同じ優先順位を設定する 課題の定義に関与するステークホルダーをできるだけ減らす 各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける None 98. 「課題の優先順位付け」を行う際に、最も効果的な基準は次のうちどれですか? 課題の難易度とコスト 課題の影響範囲と解決に要するリソース チームメンバーの意見と企業の文化 課題の緊急度とチームの意思決定プロセス None 99. 機械学習において、「ランダムフォレスト」の主な特徴として最も適切なものは次のうちどれですか? 線形回帰の一種である データを多次元の空間にマッピングする手法である 多数の決定木を用いて予測の精度を向上させるアルゴリズムである 時系列データ専用のアルゴリズムである None 100. A B C D None Time's up