DS検定~模擬試験②~ 2024年12月7日2024年12月7日 ailearn 1. データの標準化を行う目的は何ですか? データの範囲を広げる データの平均値をゼロにし、分散を1にする データの値を整数に変換する データの分散を大きくする None 2. 「ディープラーニング」において最も一般的に使用されるフレームワークは次のうちどれですか? TensorFlow Excel R Tableau None 3. モデルの性能を比較するために使用される「クロスバリデーション」の利点として最も適切なものは次のうちどれですか? データの一部のみでモデルを評価する トレーニングデータ全体を用いてモデルを評価できる 過学習を促進する テストデータを完全に除外する None 4. グラフデータ構造において、全てのノードが他の全てのノードとエッジで直接つながっている場合、このグラフは何と呼ばれますか? 部分グラフ 無向グラフ 完全グラフ 木構造 None 5. 「着想・デザイン」のプロセスにおいて、成功のために「反復的プロトタイピング」を実施する主な目的は次のうちどれですか? 開発コストを削減するため 顧客フィードバックを取り入れ、デザインを継続的に改善するため 製品の発売を早めるため デザインプロセスを簡略化するため None 6. カテゴリカルデータの分布を視覚化する際、最も適切なグラフは次のうちどれですか? 棒グラフ 散布図 ヒートマップ 箱ひげ図 None 7. デザイン思考の「共感」のステップでは、何が行われますか? 製品のコンセプトを開発する 製品の最終的な評価を行う プロジェクトの予算を確保する ユーザーのニーズや問題を理解するために観察やインタビューを行う None 8. 「発散的思考」とは、どのようなプロセスを指しますか? 1つの問題に対して特定の解決策を深掘りするプロセス 問題を解決するためのデータを収集するプロセス さまざまな視点から自由にアイデアを広げるプロセス 解決策を具体的に実行するプロセス None 9. 仮説検定において「有意水準」とは何を指しますか? 第二種の誤りを許容する確率の上限 第一種の誤りを許容する確率の上限 ある仮説が真である確率 データのばらつきを示す指標 None 10. データの「正規化」と「標準化」の違いとして最も正しい説明は次のうちどれですか? 標準化はデータを特定の範囲に収め、正規化はデータを平均0、分散1に変換する 両者は同じ意味である 正規化はデータの欠損値を補完する 正規化はデータを特定の範囲に収め、標準化はデータを平均0、分散1に変換する None 11. 散布図において、2つの変数が互いに強い線形関係を示すときのグラフの形は? 水平な線 垂直な線 斜めの直線 曲線 None 12. データの正規化とは何ですか? データの最小値と最大値を0と1の範囲に変換する データを標準偏差でスケーリングする データをランダムに並べ替える データの外れ値を取り除く None 13. AIが「ヘルスケア分野のパーソナライズド医療」に貢献する方法として、最も適切なものは次のうちどれですか? AIが患者の遺伝情報を基に、最適な治療法を提案する AIがすべての患者に同じ治療法を提供する 患者の遺伝情報を無視する AIが患者のデータを削除する None 14. 「UX(ユーザーエクスペリエンス)」デザインにおける重要な要素として正しいものは次のうちどれですか? 製品の技術的な性能を最大化すること ユーザーの体験全体を設計し、使いやすさや満足度を向上させる デザインのコストを最小化すること 製品の外観や見た目に重点を置くこと None 15. 時系列データに対する「ARIMAモデル」の主な用途は次のうちどれですか? 画像データの分類 テキストデータの処理 時系列データの予測 クラスタリング None 16. 自動運転車で使用されるAI技術に関する主な役割は次のうちどれですか? 車両の設計を行う 車両の安全運転を支援し、障害物を認識する 燃料の消費を管理する 乗客の体調管理を行う None 17. 標本平均と母集団平均の差が小さい場合、次のうち正しい説明はどれですか? 母集団分布は正規分布に近い 標本サイズが非常に大きい 標本は母集団を代表している 母集団分散が大きい None 18. AIが「スマートシティ」の構築において果たす役割として最も適切なものは次のうちどれですか? 都市全体の運営をリアルタイムで最適化し、持続可能な社会の実現を支援する 都市の人口を減少させる 都市内のすべての活動を停止する 都市の環境を無視する None 19. 課題の定義において「曖昧さを排除する」ための手法として最も有効なものは次のうちどれですか? 課題を具体的かつ測定可能な形で定義し、SMARTゴールを設定する できるだけ多くの意見を取り入れ、柔軟に対応する 課題を抽象的に捉え、様々な視点からアプローチする 既存のデータや情報に基づいて課題を広範囲に定義する None 20. データサイエンスで「クラスター分析」に使用される主なアルゴリズムは次のうちどれですか? ロジスティック回帰 k-means法 線形回帰 決定木 None 21. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 22. データセットに含まれる外れ値を検出するために最も効果的な視覚化手法はどれですか? 箱ひげ図 ヒストグラム 散布図 Q-Qプロット None 23. データの欠損値処理において「多重代入法(Multiple Imputation)」の特徴として最も適切な説明は次のうちどれですか? 欠損値を単純に削除する 欠損値を1回だけ補完する 欠損値を複数回補完し、結果を統合する 欠損値をランダムに生成する None 24. 以下の条件を満たすデータ構造として最も適切なものはどれですか? キーと値のペアを管理。 データの追加、削除、検索を平均O(1)の時間で行える。 配列 リンクリスト ハッシュテーブル ヒープ None 25. 赤黒木(Red-Black Tree)は、二分探索木の一種であり、次のうち正しい特性はどれですか? 各ノードの値が常に奇数である 各ノードが赤または黒に塗られている 全ての葉ノードは赤である 木の高さは常に一定である None 26. データ分析における「欠損値処理」の最も一般的な方法は次のうちどれですか? 欠損値をそのまま残す 欠損値を削除する 平均値や中央値で補完する 欠損値を無視する None 27. 「ハイパーパラメータ」として適切なものは次のうちどれですか? 学習データ内の特徴量の値 学習率やバッチサイズの設定値 モデルの重みやバイアスの値 モデルが予測したクラスの確率 None 28. 課題定義において「フレームワーク」を使用する主な利点として最も適切なものは次のうちどれですか? 定量的な分析を完全に不要にする 課題を抽象化し、具体的な行動計画を省略できる ステークホルダーとの協議を簡略化する 問題を構造化し、全体像を明確に把握することができる None 29. p値が0.01のとき、これは次のどれに該当しますか? 仮説は棄却されるべきではない 結果が統計的に有意ではない 仮説は棄却されるべきである 第二種の誤りが犯されている None 30. 「問題をフレーミングする」とは、どのようなプロセスですか? 問題を特定の視点から定義し、問題の範囲や焦点を明確にすること 問題を抽象的に定義し、解決策を多角的に検討すること 問題を数値化し、具体的な測定指標を設定すること 問題をステークホルダー間で共有し、合意を得ること None 31. 課題定義の際に、現状分析と未来予測を組み合わせて行うことで得られるメリットは次のうちどれですか? 現在の問題と将来的なリスクやチャンスを同時に考慮できる 解決策の実行を迅速に進めることができる 過去のデータに基づいて確実な解決策を導き出すことができる チームメンバー全員の合意を得ることができる None 32. 課題の定義において、利害関係者全体の合意を得るために重要なポイントとして最も適切なものは次のうちどれですか? 各ステークホルダーの意見を均等に反映させる 課題の範囲をできるだけ広げて、多様な意見を取り入れる 課題の影響や利点を明確にし、共通の目標を設定する 一部のステークホルダーの意見を優先し、迅速に決定を進める None 33. デザインプロセスにおける「デザインシンキング」の特徴として正しいものは次のうちどれですか? 製品の技術的性能を最優先するアプローチ コスト削減を最優先するアプローチ ユーザー中心のアプローチを取り、反復的なプロセスで解決策を創出する デザインの見た目や美観を重視するアプローチ None 34. 課題定義において、ステークホルダーからのフィードバックを効果的に活用する方法として適切なものは次のうちどれですか? フィードバックを受けたら、すぐにその意見を基に解決策を実施する すべてのフィードバックをまとめて、解決策の検討に利用する 重要なステークホルダーのフィードバックのみを反映させる フィードバックを検討し、課題の定義が適切かどうか再評価する None 35. 「ペルソナ」とは、デザインプロセスにおいて何を指しますか? 製品のブランディングに用いるキャラクター 典型的なユーザー像を具体化した架空の人物 チームメンバーの役割を定義する概念 デザインの最終成果物を指す None 36. 以下のうち、p値とは何ですか? 帰無仮説が正しい場合に得られるデータの確率 仮説が正しい確率 仮説が偽である確率 検定の正確さ None 37. イノベーションのための「オズボーンのチェックリスト」に含まれる質問として適切なものは次のうちどれですか? 「製品の価格を上げるためにはどうすればよいか?」 「この製品の売上を最大化するには?」 「競合他社の製品をどう取り入れるか?」 「この製品をどう変えることができるか?」 None 38. 深層学習で使用される「転移学習」の主な利点として最も適切なものは次のうちどれですか? 小規模なデータセットでも高性能なモデルを構築できる モデルの計算コストを大幅に削減できる すべてのタスクで新しいモデルをトレーニングする必要がなくなる 異なる分野のデータでもモデルの精度が向上する None 39. データサイエンスでよく使用される「ハイパーパラメータ」とは何ですか? モデルが自動で最適化するパラメータ モデルの学習プロセスで調整する必要のあるパラメータ データの欠損値を処理するための手法 データの前処理方法 None 40. B木(B-Tree)がよく使われるデータベースのインデックス構造である理由は何ですか? 木の高さが固定されているため データが自動的にソートされるため 大量のデータに対してもバランスが保たれるため 全てのノードが1つの値を持つため None 41. データサイエンスにおける「特徴量選択」の目的として最も適切なものは次のうちどれですか? 不必要な特徴量を削除し、モデルの精度と計算効率を向上させる データセットを大きくする モデルのパラメータを自動設定する モデルの複雑さを高める None 42. 自然言語処理(NLP)で使用される「Word2Vec」の役割は次のうちどれですか? テキストデータを分類する 単語をベクトル形式に変換し、意味的な類似性を捉える テキストデータを正規化する 単語をランダムに並べる None 43. 信頼区間が狭い場合、その結果に対してどのような解釈ができますか? 標本の精度が高いことを示す。 標本サイズが小さいことを示す。 分散が大きいことを示す。 データが正規分布に従わないことを示す。 None 44. デザインプロセスにおいて、アフォーダンスとは何ですか? 物がどのように使えるかを直感的に示すデザインの特性 製品の美観を重視するデザインの要素 使用者にとって複雑な操作方法を必要とするデザイン 製品の持つ技術的な強みを強調するデザイン None 45. 分散分析 (ANOVA) の目的は何ですか? 2つの母集団の平均値を比較する データの標準偏差を比較する データの分散が一定であるかを検定する 3つ以上の母集団の平均値を比較する None 46. 2標本t検定を使用して2つのグループの平均を比較する際、次のうち正しい仮定はどれですか? 両グループの分散は等しい 両グループの分散は異なる 両グループのサンプルサイズは等しい 両グループのサンプルサイズは異なる None 47. 回帰分析において、変数間の多重共線性が存在する場合、どのような問題が発生しますか? モデルの決定係数(R²)が0に近づく。 回帰係数の信頼性が低下する。 モデルの自由度が増加する。 モデルが過学習する。 None 48. グラフにおいて、エッジの数がノード数に比べて非常に少ない場合、このようなグラフを指す用語は次のうちどれですか? 密グラフ(Dense Graph) 疎グラフ(Sparse Graph) 完全グラフ(Complete Graph) 有向グラフ(Directed Graph) None 49. 課題定義の段階で「現状分析」を実施する主な目的として最も適切なものは次のうちどれですか? 現状と目標のギャップを明確にし、解決すべき課題を特定するため 将来の解決策を事前に決定するため ビジネス課題を抽象化し、詳細な分析を回避するため 利害関係者間の意見を完全に統一するため None 50. ある変数 X が、他の変数 Y と非線形な関係を持っていることが予想される場合、適切な解析手法は次のうちどれですか? 線形回帰 ロジスティック回帰 多項式回帰 単回帰分析 None 51. 配列(Array)のデータ構造において、データ要素の挿入や削除が特に時間がかかるのはどの位置ですか? 先頭 中央 末尾 ランダム None 52. AIが金融業界で特に活用されている分野は次のうちどれですか? 融資判断とリスク管理 金庫管理 物理的な現金の流通 店舗デザイン None 53. 自然言語処理(NLP)における「注意機構(Attention Mechanism)」の主な目的は次のうちどれですか? モデルの計算コストを削減する テキストを固定長のベクトルに変換する 複数の言語を同時に処理する テキスト全体の重要な情報を動的に特定する None 54. 機械学習モデルの「過学習」を防ぐために最も効果的な手法は次のうちどれですか? データの増加 モデルの複雑化 正則化(レギュラリゼーション) 学習率の低下 None 55. グラフ(Graph)のデータ構造において、隣接リスト(Adjacency List)の利点は次のうちどれですか? メモリ使用量が少ない 全てのノードにアクセスするのが高速である エッジが密なグラフに向いている サイクルの検出が容易である None 56. 課題定義における「問題の本質を掘り下げる」手法の一つとして、どのアプローチが最も有効ですか? チームメンバー全員でブレインストーミングを行う ロジックツリーを使って問題を分解し、根本原因を探る 既存のデータを基に定量的な分析を行う 他社の事例を参考にし、同じアプローチを試す None 57. 欠損データを処理するための一般的な手法の1つはどれですか? 欠損値を無視する 欠損値を0に置き換える 欠損値を平均値で補完する 欠損値をランダムな値で埋める None 58. 課題定義において「ステークホルダー分析」の目的は次のうちどれですか? 課題に関わる利害関係者の影響や関心を特定するため 課題を迅速に解決するための戦略を策定するため 課題解決のためのコストを算出するため 課題に対する法的な影響を確認するため None 59. データサイエンスにおける「欠損データの処理方法」として、最も高度な方法は次のうちどれですか? 欠損データをすべて削除する 欠損データを無視する 欠損データをそのまま残す 欠損データを予測モデルを用いて補完する None 60. 課題定義において「データ駆動型アプローチ」を採用する主な目的は次のうちどれですか? ステークホルダー間の意見を重視するため 問題の本質を客観的に把握し、再現可能な分析を行うため 課題の解決策を事前に決定するため 直感に基づく意思決定をサポートするため None 61. 欠損データの補完方法として、機械学習モデルを使用する際に特に考慮すべき点は次のうちどれですか? 補完後のデータ分布が元のデータと一致すること。 欠損値をすべて平均値で補完すること。 欠損データの削除を避けること。 欠損値の存在を無視しても問題ない場合に適用すること。 None 62. 課題の定義において、ステークホルダーの要望が多岐にわたる場合、最も適切な対処法は次のうちどれですか? 全ての要望を無条件に受け入れる 主要なステークホルダーの要望だけを考慮する 各要望をビジネスインパクトや実現可能性の観点で優先順位付けする 要望に優先順位を付けずにすべて平等に扱う None 63. 二分ヒープ(Binary Heap)の特性に関して正しい説明はどれですか? 親ノードの値は常に子ノードの値より大きいか、または小さい 親ノードの値は常に子ノードの値と等しい 親ノードの値は常に子ノードの値よりランダムに決まる ヒープは常に平衡状態を維持する None 64. ハッシュテーブル(Hash Table)における「衝突(Collision)」とは何ですか? 同じハッシュ値を持つ異なるキーが発生すること 配列の範囲外にデータが追加されること リンクリストが循環すること データが重複して保存されること None 65. 小売業におけるAIの活用例として最も適切なものは次のうちどれですか? AIが在庫管理を効率化し、需要予測を行う AIが商品の配送を行う AIが販売員を完全に置き換える AIが商品のデザインを担当する None 66. AIが「医薬品開発」において果たす役割として最も適切なものは次のうちどれですか? すべての医薬品開発を廃止する 医薬品の需要予測を行わない 新薬の開発プロセスを効率化し、治験の成功確率を高める 新薬の開発を無制限に行う None 67. デザイン思考における「リフレーミング」の主な目的は何ですか? 問題を異なる視点から再評価し、新しい解決策を見つけるため 製品のデザインを見直して、コスト削減を図るため チームの役割分担を変更するため 既存の解決策をそのまま採用するため None 68. 主成分分析 (PCA) において、主成分を選定するために一般的に使用される基準は何ですか? 分散の大きさ p値の大きさ 相関係数の大きさ 標準偏差の大きさ None 69. 「スポーツ分野」でAIが活用される例として最も適切なものは次のうちどれですか? 試合中の観客数を記録する 試合スケジュールを手動で調整する スポーツ用品の価格を設定する 選手のパフォーマンスデータを分析し、トレーニング計画を最適化する None 70. 「SMARTゴール」を使って課題を定義する際、何が重要とされるか? 課題が多様で、包括的で、創造的であること 課題が具体的で、測定可能で、達成可能で、関連性があり、期限が明確であること 課題が挑戦的で、リスクが高く、革新的であること 課題が単純で、分かりやすく、迅速に解決できるものであること None 71. データの欠損率が高い場合に推奨される手法はどれですか? 多重代入法 欠損データの削除 平均値による補完 中央値による補完 None 72. 標本平均と母集団平均を比較するために、標本の標準誤差を用いる理由は何ですか? 母集団の分散を推定するため 標本の標準偏差を推定するため 標本平均のばらつきを測定するため 標本数を増やすため None 73. 課題定義において「問題の本質を捉える」とは、どのようなことを意味しますか? 表面的な症状ではなく、根本的な原因を明確にすること 問題が存在することを記録すること 問題を全ての関係者に周知すること 問題が発生した時点でのデータを収集すること None 74. キュー(Queue)のデータ構造において、最初に追加された要素が最初に削除される方式は何と呼ばれますか? LIFO FIFO FILO LILO None 75. 課題定義のプロセスで「曖昧さ」を排除するために最も有効な方法は次のうちどれですか? 定性的データのみを活用する 定量的な成功指標を設定する 複数の解決策を同時に採用する 主観的な評価基準を使用する None 76. AIが「災害管理」において活用される場面として最も適切なものは次のうちどれですか? 災害復興費用の計算を手動で行う 天候データを分析して災害発生を予測する 被災者の救助活動を全て人力で行う 災害発生後のニュース報道を作成する None 77. データの分布形状を確認するために最適な手法は次のうちどれですか? 箱ひげ図(ボックスプロット) ヒストグラム 散布図 クロス集計表 None 78. データの分布が正規分布に従っているかどうかを確認するための視覚的な手法はどれですか? ヒストグラム 散布図 箱ひげ図 Q-Qプロット None 79. 科学的解析における仮説検定の第一種の誤りとは何を指しますか? 帰無仮説が真であるのに、誤って棄却すること 帰無仮説が偽であるのに、棄却しないこと データに基づかない推論を行うこと 仮説を正しく検証できないこと None 80. グラフ(Graph)の探索アルゴリズムの一つで、幅優先探索(Breadth-First Search)における探索順序はどれですか? 深さ優先で探索する 最も遠いノードから探索する 重みの大きいエッジを優先して探索する 隣接するノードを次々に探索する None 81. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 82. モデルの性能を評価するために使用される「混同行列」の要素に含まれないものは次のうちどれですか? True Positive False Negative True Negative Recall None 83. データの正規性を検定するための手法として適切なものは次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 相関係数 None 84. 「デザイン思考」において、ユーザーインタビューを行う際に最も重要な要素は次のうちどれですか? ユーザーに簡潔な選択肢を提供する ユーザーが自らのニーズや行動を自由に語れる環境を整える ユーザーに特定の結論を導く質問をする データ収集の効率性を優先する None 85. AIが「自動車産業の生産ライン」において果たす役割として、最も適切なものは次のうちどれですか? AIが生産を停止する 生産ラインの労働力を増やす 生産ラインの速度を遅くする AIが生産プロセスを自動化し、品質管理を強化する None 86. リンクリスト(Linked List)のデータ構造において、各要素を指し示すものは何ですか? ノード インデックス ハッシュキー ルート None 87. 「着想・デザイン」において、データを活用してアイデアを発想する際の主な利点は次のうちどれですか? データの精度に関係なく創造的な発想が可能になる 仮説の妥当性を客観的に評価できる 定性的データを必要としなくなる 発想のプロセスを省略できる None 88. デザインプロセスにおける「収束的思考」の役割は次のうちどれですか? 多くのアイデアを絞り込み、実現可能なものにフォーカスする アイデアをできるだけ多く出すプロセス 問題を分析し、根本原因を特定するプロセス ユーザーのニーズを理解するためのステップ None 89. 外れ値の影響を受けにくい代表値はどれですか? 平均値 分散 標準偏差 メディアン None 90. 「デザインプロセス」で利用される「サービスブループリント」の主な目的は次のうちどれですか? サービスの内部プロセスと顧客体験を可視化する デザイン思考の「共感」ステップを簡略化する サービスの収益性を予測する 顧客データの分析を代替する None 91. A B C D None 92. 「トライ木(Trie)」を用いたデータ構造の主な応用例として最も適切なものはどれですか? 数値データの範囲検索 文字列の検索やオートコンプリート グラフデータの最短経路探索 データベースのインデックス管理 None 93. データの前処理で行う「標準化」とは次のうちどれを指しますか? データの分布を平均0、分散1に変換する データの分布を一様分布にする データの欠損値を削除する データを可視化する None 94. 階層的クラスタリングにおいて、クラスタ間の距離を測定するための手法は次のうちどれですか? ユークリッド距離 ピアソン相関係数 カイ二乗距離 マンハッタン距離 None 95. 教育分野でAIを活用して学習成果を最大化する方法として、次のうち最も適切なものはどれですか? 各学生の進捗データを分析し、個別の学習プランを作成する 全ての学生に同じ教材を一斉に提供する 教師が使用する教材のデジタル化を促進する 教育機関の経費を削減するためにAIを活用する None 96. 複数のステークホルダーが関与する課題の定義において、利害関係の衝突を防ぐために有効なアプローチは次のうちどれですか? 最も影響力のあるステークホルダーの意見を優先する すべての利害関係者に対して同じ優先順位を設定する 課題の定義に関与するステークホルダーをできるだけ減らす 各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける各ステークホルダーの期待や関心を明確にし、共有するプロセスを設ける None 97. スタック(Stack)における操作の一つで、データを取り出す操作を何と呼びますか? push pop enqueue dequeue None 98. 「着想・デザイン」における「エコシステムデザイン」の特徴として最も適切なものは次のうちどれですか? 個々のプロダクトやサービスに焦点を当てる 短期的な収益性を最優先する 特定のターゲット顧客にのみ価値を提供する 異なる関係者やサービス間の連携を重視する None 99. 「デザイン思考」で「収束的思考」を使用するタイミングとして最も適切なものは次のうちどれですか? 問題を広範に探索し、アイデアを発散させる段階 データを収集し、分析の範囲を設定する段階 顧客ニーズを特定するための初期段階 アイデアを評価し、実現可能性の高い解決策を絞り込む段階 None 100. 時系列データの自己相関関数 (ACF) を使用して確認できるものは何ですか? データ間の線形関係 データ間の時間依存性 データの外れ値 データの平均 None Time's up