DS検定~模擬試験③~ 2024年12月7日 ailearn 1. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 2. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 3. アプローチ設計において「リスク軽減策」として「リスク共有」が選択される状況として最も適切なものは次のうちどれですか? 特定のリスクが他のステークホルダーと共有可能な場合 プロジェクトリーダーが全てのリスクを管理できる場合 リスクが重大であり、プロジェクトを中止する必要がある場合 リスクが発生しても影響が軽微である場合 None 4. 農業分野でAIが導入され、収穫量の予測を行う場合、AIモデルの精度を向上させるために最も重要なデータは次のうちどれですか? 農作物の販売価格 農機具の種類と台数 地域の人口密度 土壌の成分、気象データ、過去の収穫データ None 5. 分散データベースにおける「CAP定理」の3つの要素に該当しないものは次のうちどれですか? Consistency(整合性) Availability(可用性) Partition Tolerance(分割耐性) Performance(性能) None 6. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 7. 最新のAI技術「ディープフェイク」がもたらす社会的なリスクとして最も適切なものは次のうちどれですか? AIの導入が遅れる データの削除 動画の圧縮 動画や音声の不正な生成による情報操作や詐欺の増加 None 8. データ理解の際に「正規化」を行う主な目的は何ですか? 欠損値を補完するため データの異常値を排除するため データの精度を高めるため データのスケールを統一し、比較しやすくするため None 9. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 10. 「データベースのインデックス」の主な目的として最も適切なものは次のうちどれですか? データを暗号化してセキュリティを強化すること。 データの冗長性を排除すること。 データのスキーマを動的に変更すること。 データの検索速度を向上させること。 None 11. データ蓄積において、分散データベースで使用される「シャーディング」とは何ですか? データを一つの場所に集約して保存する手法 データを複数のサーバーに分散して保存する手法 データを圧縮して保存する手法 データを一時的にキャッシュに保存する手法 None 12. ヘルスケア分野でAIが導入されている例として、患者モニタリングシステムの主な目的は次のうちどれですか? 医療記録の自動削除 患者のバイタルサインをリアルタイムで監視し、異常を検知する 薬剤の価格を一括管理する 病院のスタッフスケジュールを最適化する None 13. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 14. 農業分野におけるAIの利活用として最も効果的なものは次のうちどれですか? 農作物の種類をAIが決定する AIを利用して農作物の成長を監視し、収穫時期を最適化する 農業のすべての作業をAIに任せる 気象予測を無視して作業を進める None 15. 次元削減後のデータを可視化するために、UMAPの利点は何ですか? 高次元データの構造を保持しやすい 可視化が容易なため、データの理解が進む 計算が早く、大規模データにも適応できる 全てが利点 None 16. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 17. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None 18. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 19. アプローチ設計において、「PoC(概念実証)」を実施する主な目的は次のうちどれですか? プロジェクト全体の成功を保証するため 提案された解決策が技術的および実用的に可能であることを確認するため プロジェクトスコープを明確にするため ステークホルダーの意見を完全に反映するため None 20. 「Explainable AI(XAI)」の最新動向に関する利点として最も適切なものは次のうちどれですか? AIの決定プロセスを透明化し、結果の説明が可能になる AIの精度を低下させる AIの結果をブラックボックス化する AIの学習速度を遅くする None 21. データ理解のプロセスで、「データのバイアス」を検出する主な目的として最も適切なものは次のうちどれですか? バイアスが分析結果や意思決定に及ぼす影響を評価するため バイアスを削除してモデル精度を上げるため データにバイアスが含まれていないことを証明するため バイアスを活用してモデルの性能を向上させるため None 22. アプローチ設計において「ウォーターフォールモデル」が適している状況は次のうちどれですか? 要件が明確で、変更が予想されない場合 短期間で頻繁なフィードバックが必要な場合 チームが独立して作業できる場合 顧客要件がプロジェクト期間中に変化する可能性が高い場合 None 23. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None 24. データ蓄積において、バックアップの目的は次のうちどれですか? データベースのパフォーマンスを向上させる データのサイズを小さくする データを保護し、障害時に復元できるようにする データの分析を高速化する None 25. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 26. 大規模データの保存に適した「Hadoop HDFS(Hadoop Distributed File System)」の主な特性は次のうちどれですか? データを高速で検索できるインデックス機能を持つ データをリアルタイムで処理する 大規模なデータセットを分散して保存し、冗長性を確保する トランザクションを強力にサポートする None 27. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 28. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 29. 高次元データを可視化するための次元削減手法として「t-SNE」を使用する場合の注意点は次のうちどれですか? t-SNEは計算速度が非常に速いため、大規模データにも適している。 t-SNEは教師あり学習にのみ使用可能である。 t-SNEはカテゴリカルデータのみに適用可能である。 t-SNEは局所的な構造を重視するため、大域的な構造を把握しづらい。 None 30. ヒストグラムと箱ひげ図(ボックスプロット)の違いとして正しいものは次のうちどれですか? ヒストグラムは分布の形状を、箱ひげ図は分散や異常値を示す。 ヒストグラムはカテゴリデータ、箱ひげ図は数値データに使用する。 箱ひげ図は分布の形状を示し、ヒストグラムは平均値を強調する。 ヒストグラムと箱ひげ図は同じ目的で使用される。 None 31. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 32. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 33. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 34. 時系列データの分析において、データのトレンドを除去するための手法はどれですか? データの標準化 移動平均法 クラスタリング カイ二乗検定 None 35. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 36. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 37. データサイエンスにおける「転移学習(Transfer Learning)」の最新動向として、最も適切なものは次のうちどれですか? モデルをゼロから学習させる手法 全てのデータを破棄する手法 データ前処理を無視する手法 既存のモデルの知識を利用して、新しいタスクに応用する手法 None 38. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 39. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 40. データ蓄積において、「ACID特性」を持つシステムで保証される一貫性とは次のうちどれですか? すべてのトランザクションが同時に実行されること。 トランザクションが中断された場合でも、データの整合性が保たれること。 データが並列処理中もリアルタイムで同期されること。 データが圧縮されて効率的に保存されること。 None 41. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 42. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 43. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 44. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 45. AIによる「異常検知システム」が製造業に導入されることで得られる主な利点は次のうちどれですか? 製品の品質を無視する 製造コストが増加する AIによる検知が不正確になる 製品の不良品や設備の異常をリアルタイムで検出し、早期に対応できる None 46. 「時系列データ」の特徴として、分析時に特に考慮すべき事項は次のうちどれですか? 時系列データはすべて独立している 時系列データには季節性が存在しない 時系列データは常に正規分布に従う 時系列データの値は、時間の経過とともに相関が生じることが多い None 47. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 48. アプローチ設計において、パイロットプロジェクトを実施する際の主要な成功要因として最も適切なものは次のうちどれですか? パイロットプロジェクトで利用するデータ量を最小化すること パイロットプロジェクトを終了後すぐに本番導入すること パイロットプロジェクトの失敗を避けるためにリスクを完全に排除すること パイロットプロジェクトの結果を実際の運用環境に適用できること None 49. データ理解のプロセスにおいて最初に行うべきステップは次のうちどれですか? データの収集 データの前処理 データの定義と目標の設定 データの分析 None 50. データ可視化の際、外れ値が多いデータセットで正確な可視化を行うために適した手法はどれですか? 箱ひげ図 散布図 ヒストグラム 折れ線グラフ None 51. データの前処理における「欠損データの処理」方法として適切なものは次のうちどれですか? 欠損データを全て削除する 欠損データを適切な値で補完する 欠損データは無視して分析を続行する 欠損データを平均値で埋める None 52. 「AI倫理」の最新動向において、AIシステムに対する説明責任の確保が求められている理由として正しいものは次のうちどれですか? AIを無条件に信頼するため AIのすべての決定をブラックボックス化するため AIの導入を防ぐため AIの決定が公平であることを証明するため None 53. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 54. データ蓄積において「データウェアハウス」と「データレイク」の主な違いとして正しいものは次のうちどれですか? データウェアハウスはスキーマを事前に定義する必要があるが、データレイクはスキーマが不要である。 データウェアハウスは非構造化データに特化しているが、データレイクは構造化データに特化している。 データウェアハウスはクラウド環境でしか使用できないが、データレイクはオンプレミス環境でしか使用できない。 データウェアハウスは主にデータ保存に使用されるが、データレイクはデータ分析専用である。 None 55. AIを活用した交通管理システムにおいて、最も一般的な目的は次のうちどれですか? 交通事故のデータを削除する 信号の故障を予測する 渋滞の予測とリアルタイム交通制御 車両の登録情報を一括管理する None 56. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 57. データセットの「次元削減」が必要となる主な理由として最も適切なものは次のうちどれですか? 全ての変数を削除し、モデルを単純化するため 高次元データの計算負荷を軽減し、過学習を防ぐため データの次元を増加させて精度を向上させるため 次元削減を行うとデータの意味が失われるため None 58. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 59. データセット内の外れ値を可視化するために最も適したグラフはどれですか? 箱ひげ図 ヒストグラム 散布図 円グラフ None 60. 現在、AI技術が急速に進展している分野として最も適切なものは次のうちどれですか? 自動運転車 書籍の出版 手作業での農業 古典芸術の制作 None 61. AIが「ヘルスケア分野での診断支援システム」において果たす役割として最も適切なものは次のうちどれですか? 患者の医療画像を解析し、疾患の早期発見や診断を支援する 患者のデータを無視する AIがすべての治療を行う 医療データの管理を自動化する None 62. AIによる「需要予測」の導入が成功している業界として最も適切なものは次のうちどれですか? 教育 農業 製造業 エネルギー None 63. データ可視化の際、複数の変数間の非線形な関係を検出するために適したグラフは次のうちどれですか? 散布図行列(Pair Plot) ヒートマップ 棒グラフ 箱ひげ図 None 64. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 65. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 66. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 67. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 68. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 69. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 70. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 71. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 72. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 73. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 74. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 75. データベースの「トランザクション分離レベル」において、最も強い整合性を保証するレベルはどれですか? Read Committed Repeatable Read Serializable Read Uncommitted None 76. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 77. 複数のシナリオを考慮したアプローチ設計において、シナリオプランニングが有効とされる理由は次のうちどれですか? シナリオごとに異なる解決策を実行するため すべてのシナリオに対して同じ解決策を適用するため 不確実な未来に備え、異なる可能性に対応するため 短期間で結果を得るため None 78. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 79. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 80. AIが医療現場で活用される例として最も適切なものは次のうちどれですか? 手術を全自動で行う 診断支援システムとして活用し、画像診断の精度を向上させる 医師の役割をすべて代替する 患者のコミュニケーションを代行する None 81. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None 82. 大規模データセットのサンプリングを行う際の注意点として最も重要なものは次のうちどれですか? サンプルが全体のデータを代表するものであること サンプルがランダムに選ばれていること サンプルが欠損データを含まないこと サンプルが少ない方が効率的な分析ができること None 83. データのバイアスを取り除くための適切な手法は次のうちどれですか? 標準化 無作為抽出 欠損値補完 正規化 None 84. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 85. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 86. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 87. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 88. アプローチ設計において「データ駆動型の意思決定」が重視される理由として最も適切なものは次のうちどれですか? データを基にリスクを最小限に抑えるため 主観的な判断を避け、客観的なデータに基づいて解決策を選択するため データを活用して迅速な意思決定を行うため すべてのステークホルダーの意見を反映させるため None 89. 「Explainable AI(XAI)」が注目される背景として最も適切な理由は次のうちどれですか? AIシステムの動作を完全に自動化するため AIシステムの運用コストを削減するため AIの学習速度を向上させるため 利用者がAIの判断理由を理解しやすくするため None 90. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 91. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 92. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 93. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 94. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 95. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 96. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 97. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 98. データの正規化の目的は何ですか? データのばらつきを減らす データを一定の範囲にスケールする データの外れ値を除外する データの欠損値を補完する None 99. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 100. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None Time's up