DS検定~模擬試験③~ 2024年12月7日 ailearn 1. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 2. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 3. 農業分野でAIが導入され、収穫量の予測を行う場合、AIモデルの精度を向上させるために最も重要なデータは次のうちどれですか? 農作物の販売価格 農機具の種類と台数 地域の人口密度 土壌の成分、気象データ、過去の収穫データ None 4. データサイエンスにおける「転移学習(Transfer Learning)」の最新動向として、最も適切なものは次のうちどれですか? モデルをゼロから学習させる手法 全てのデータを破棄する手法 データ前処理を無視する手法 既存のモデルの知識を利用して、新しいタスクに応用する手法 None 5. データ蓄積において、バックアップの目的は次のうちどれですか? データベースのパフォーマンスを向上させる データのサイズを小さくする データを保護し、障害時に復元できるようにする データの分析を高速化する None 6. 分散データベースにおいて、「クエーリーのシャーディング」は何を目的としていますか? クエリを複数のデータサーバーに分散させ、パフォーマンスを向上させる クエリを自動で最適化する クエリを圧縮してデータ転送速度を上げる クエリのエラーを自動修正する None 7. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 8. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 9. アプローチ設計において「リスク軽減策」として「リスク共有」が選択される状況として最も適切なものは次のうちどれですか? 特定のリスクが他のステークホルダーと共有可能な場合 プロジェクトリーダーが全てのリスクを管理できる場合 リスクが重大であり、プロジェクトを中止する必要がある場合 リスクが発生しても影響が軽微である場合 None 10. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 11. トレーニングデータとテストデータをランダムに分割する際、データが時間依存性を持つ場合に最も注意すべき点は次のうちどれですか? 分割比率を一定に保つ。 時系列順を考慮して分割する。 カテゴリカルデータをエンコードしてから分割する。 分割後にデータをシャッフルする。 None 12. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None 13. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 14. 分散データベースにおける「CAP定理」の3つの要素に該当しないものは次のうちどれですか? Consistency(整合性) Availability(可用性) Partition Tolerance(分割耐性) Performance(性能) None 15. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 16. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 17. 自然言語処理(NLP)の最新技術である「GPT」モデルの主な用途として正しいものは次のうちどれですか? 数値データの分類 テキストの生成や翻訳 画像認識 音声データの解析 None 18. アプローチ設計において、目標を「具体的・測定可能・達成可能・関連性がある・期限付き」(SMART)の形で設定する理由は何ですか? チーム全体で共通の理解を持ち、進捗を測定できるようにするため 目標を柔軟に変更できるようにするため コストを最小限に抑えるため 目標を簡単に達成するため None 19. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 20. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 21. データ理解のプロセスで、「データのバイアス」を検出する主な目的として最も適切なものは次のうちどれですか? バイアスが分析結果や意思決定に及ぼす影響を評価するため バイアスを削除してモデル精度を上げるため データにバイアスが含まれていないことを証明するため バイアスを活用してモデルの性能を向上させるため None 22. データベースでのACID特性のうち、"I"が示すものはどれですか? Isolation(独立性) Integrity(整合性) Indexing(インデックス化) Immutability(不変性) None 23. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 24. データセット内の外れ値を可視化するために最も適したグラフはどれですか? 箱ひげ図 ヒストグラム 散布図 円グラフ None 25. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 26. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 27. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 28. データのクレンジングを行う際に考慮すべき要素として最も適切なものは次のうちどれですか? データを全て再収集すること データの正規化を優先すること データの一部を削除すること データの一貫性、重複、欠損を修正し、分析に適した状態に整えること None 29. 現在、AI技術が急速に進展している分野として最も適切なものは次のうちどれですか? 自動運転車 書籍の出版 手作業での農業 古典芸術の制作 None 30. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 31. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 32. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 33. 地理情報データを可視化する際、特定の値の濃淡を色で表現する手法は次のうちどれですか? カートグラム ヒートマップ 散布図 チョロプレス図(Choropleth Map) None 34. AIが「農業分野」で導入されることで最も期待される効果は次のうちどれですか? 作物の成長管理を自動化し、生産性と収穫量を最大化する 作物の品種をすべて統一する 作物の管理をすべて手動で行う 農業分野ではAIが使われない None 35. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 36. データの正規化の目的は何ですか? データのばらつきを減らす データを一定の範囲にスケールする データの外れ値を除外する データの欠損値を補完する None 37. ヘルスケア分野でAIが導入されている例として、患者モニタリングシステムの主な目的は次のうちどれですか? 医療記録の自動削除 患者のバイタルサインをリアルタイムで監視し、異常を検知する 薬剤の価格を一括管理する 病院のスタッフスケジュールを最適化する None 38. AIを活用した「顧客リテンション分析」の主な目的は次のうちどれですか? 顧客の離脱を予測し、離脱を防止するための施策を講じる 新規顧客を獲得する すべての顧客に同じ対応をする 顧客データを削除する None 39. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 40. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 41. アプローチ設計において「ウォーターフォールモデル」が適している状況は次のうちどれですか? 要件が明確で、変更が予想されない場合 短期間で頻繁なフィードバックが必要な場合 チームが独立して作業できる場合 顧客要件がプロジェクト期間中に変化する可能性が高い場合 None 42. データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか? 欠損データは他の観測データと無関係に発生している 欠損データは特定の変数の値に依存して発生している 欠損データは外れ値によって発生している 欠損データは観測データ全体の分布に依存している None 43. アプローチ設計において「ファシリテーション」の役割は何ですか? データの収集と分析を管理する 解決策を評価し、フィードバックを提供する チームのコミュニケーションを円滑にし、効果的な意思決定をサポートする プロジェクトの予算を管理する None 44. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 45. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 46. アプローチ設計において「パイロットプロジェクト」を実施する主な目的は何ですか? 完全な実装前にすべてのデータを収集するため プロジェクトの全体像を短期間で完成させるため プロジェクトのコストを最小限に抑えるため 小規模で解決策をテストし、その有効性を確認するため None 47. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 48. AIが医療現場で活用される例として最も適切なものは次のうちどれですか? 手術を全自動で行う 診断支援システムとして活用し、画像診断の精度を向上させる 医師の役割をすべて代替する 患者のコミュニケーションを代行する None 49. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 50. アプローチ設計において「データ駆動型の意思決定」が最も重要になる状況として適切なものは次のうちどれですか? データが少なく、意思決定に経験が優先される場合 データの品質が低い場合 データが豊富で、意思決定が複数の利害関係者に影響を与える場合 短期間で感覚的な意思決定が必要な場合 None 51. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 52. AIが金融業界で最新のトレンドとなっている「AI取引」とは何ですか? 全ての取引をAIが管理する手法 AIが手動で取引を支援する手法 AIが取引を禁止する手法 AIがリアルタイムで市場データを分析し、自動的に取引を行う手法 None 53. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 54. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 55. データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか? 1.0倍 1.5倍 2.0倍 3.0倍 None 56. AIが工場の生産ラインで最も一般的に使用される目的は次のうちどれですか? 製造プロセスの自動化と品質管理の最適化 製品のデザイン作成 販売促進活動 顧客サービスの提供 None 57. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 58. アプローチ設計において、「PoC(概念実証)」を実施する主な目的は次のうちどれですか? プロジェクト全体の成功を保証するため 提案された解決策が技術的および実用的に可能であることを確認するため プロジェクトスコープを明確にするため ステークホルダーの意見を完全に反映するため None 59. 最新のAI技術「ディープフェイク」がもたらす社会的なリスクとして最も適切なものは次のうちどれですか? AIの導入が遅れる データの削除 動画の圧縮 動画や音声の不正な生成による情報操作や詐欺の増加 None 60. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 61. AI倫理において「AIバイアスの除去」が重視される理由として最も適切なものは次のうちどれですか? AIが複雑なデータを処理できるようにするため AIシステムが特定の属性に不公平な判断をしないようにするため AIの計算速度を向上させるため AIモデルのサイズを小さくするため None 62. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 63. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 64. 小売業界でAIを活用した「パーソナライズ広告配信」が注目されています。このシステムが特に効果を発揮する状況として最も適切なものは次のうちどれですか? 顧客の好みに基づいた広告をリアルタイムで配信する場合 顧客の購入履歴が乏しい場合 全顧客に同じ広告を一斉配信する場合 広告費を大幅に削減したい場合 None 65. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 66. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 67. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 68. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 69. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 70. AIによる「異常検知システム」が製造業に導入されることで得られる主な利点は次のうちどれですか? 製品の品質を無視する 製造コストが増加する AIによる検知が不正確になる 製品の不良品や設備の異常をリアルタイムで検出し、早期に対応できる None 71. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 72. 「AI倫理」の最新動向において、AIシステムに対する説明責任の確保が求められている理由として正しいものは次のうちどれですか? AIを無条件に信頼するため AIのすべての決定をブラックボックス化するため AIの導入を防ぐため AIの決定が公平であることを証明するため None 73. データセットの「次元削減」が必要となる主な理由として最も適切なものは次のうちどれですか? 全ての変数を削除し、モデルを単純化するため 高次元データの計算負荷を軽減し、過学習を防ぐため データの次元を増加させて精度を向上させるため 次元削減を行うとデータの意味が失われるため None 74. 分散ファイルシステムにおいて、「HDFS」がデータの冗長性を確保するために使用する技術は次のうちどれですか? データの暗号化 レプリケーション シャーディング キャッシング None 75. 大規模データセットに対する次元削減を行う主な目的は次のうちどれですか? データの一部を削除して、容量を削減するため データの精度を向上させるため データの相関性を高めるため データの特徴をシンプルにし、処理や分析を効率化するため None 76. データの可視化において、次のグラフの種類の中で、変数同士の相関の強さや相対関係を色の濃淡で示す手法はどれですか? 散布図 ヒートマップ 箱ひげ図 円グラフ None 77. データベースにおける「インデックス」の主な目的は何ですか? データの保存容量を削減する データの検索を高速化する データのバックアップを取る データを圧縮する None 78. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 79. データ蓄積において、「ACID特性」を持つシステムで保証される一貫性とは次のうちどれですか? すべてのトランザクションが同時に実行されること。 トランザクションが中断された場合でも、データの整合性が保たれること。 データが並列処理中もリアルタイムで同期されること。 データが圧縮されて効率的に保存されること。 None 80. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 81. 複数のシナリオを考慮したアプローチ設計において、シナリオプランニングが有効とされる理由は次のうちどれですか? シナリオごとに異なる解決策を実行するため すべてのシナリオに対して同じ解決策を適用するため 不確実な未来に備え、異なる可能性に対応するため 短期間で結果を得るため None 82. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 83. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 84. 「Explainable AI(XAI)」の最新動向に関する利点として最も適切なものは次のうちどれですか? AIの決定プロセスを透明化し、結果の説明が可能になる AIの精度を低下させる AIの結果をブラックボックス化する AIの学習速度を遅くする None 85. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 86. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 87. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 88. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 89. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 90. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 91. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 92. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 93. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 94. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 95. 時系列データの分析において、データのトレンドを除去するための手法はどれですか? データの標準化 移動平均法 クラスタリング カイ二乗検定 None 96. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 97. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None 98. データベースのシャーディング(Sharding)において、データのパーティショニングを行う主な理由は次のうちどれですか? データ量が増加した際に、システムのスケーラビリティを確保するため データのセキュリティを強化するため データの保存コストを削減するため データを複数のバックアップサーバーに保存するため None 99. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None 100. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None Time's up