DS検定~模擬試験③~ 2024年12月7日 ailearn 1. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 2. AIを活用した交通管理システムにおいて、最も一般的な目的は次のうちどれですか? 交通事故のデータを削除する 信号の故障を予測する 渋滞の予測とリアルタイム交通制御 車両の登録情報を一括管理する None 3. データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか? 1.0倍 1.5倍 2.0倍 3.0倍 None 4. データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか? 欠損データは他の観測データと無関係に発生している 欠損データは特定の変数の値に依存して発生している 欠損データは外れ値によって発生している 欠損データは観測データ全体の分布に依存している None 5. 次元削減後のデータを可視化するために、UMAPの利点は何ですか? 高次元データの構造を保持しやすい 可視化が容易なため、データの理解が進む 計算が早く、大規模データにも適応できる 全てが利点 None 6. データ可視化において、変数の密度分布を滑らかに表現するために使用される手法はどれですか? ヒストグラム KDE(カーネル密度推定) 散布図 箱ひげ図 None 7. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 8. データの正規化の目的は何ですか? データのばらつきを減らす データを一定の範囲にスケールする データの外れ値を除外する データの欠損値を補完する None 9. 以下の特性を持つストレージ技術として適切なものはどれですか? データをブロック単位で保存。 低レイテンシーでアクセス可能。 高速な読み書きが求められるアプリケーションで使用される。 オブジェクトストレージ ブロックストレージ データレイク ファイルストレージ None 10. データベースのシャーディング(Sharding)において、データのパーティショニングを行う主な理由は次のうちどれですか? データ量が増加した際に、システムのスケーラビリティを確保するため データのセキュリティを強化するため データの保存コストを削減するため データを複数のバックアップサーバーに保存するため None 11. データサイエンスにおける「転移学習(Transfer Learning)」の最新動向として、最も適切なものは次のうちどれですか? モデルをゼロから学習させる手法 全てのデータを破棄する手法 データ前処理を無視する手法 既存のモデルの知識を利用して、新しいタスクに応用する手法 None 12. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 13. 「AI倫理」の最新動向において、AIシステムに対する説明責任の確保が求められている理由として正しいものは次のうちどれですか? AIを無条件に信頼するため AIのすべての決定をブラックボックス化するため AIの導入を防ぐため AIの決定が公平であることを証明するため None 14. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 15. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 16. カテゴリカルデータの頻度分布を視覚化するための最も適したグラフは次のうちどれですか? 棒グラフ 散布図 ヒストグラム 折れ線グラフ None 17. アプローチ設計において、目標を「具体的・測定可能・達成可能・関連性がある・期限付き」(SMART)の形で設定する理由は何ですか? チーム全体で共通の理解を持ち、進捗を測定できるようにするため 目標を柔軟に変更できるようにするため コストを最小限に抑えるため 目標を簡単に達成するため None 18. データ可視化において、複数のカテゴリ間の割合や構成比を比較するのに最適なグラフは次のうちどれですか? 円グラフ 積み上げ棒グラフ 散布図 ヒストグラム None 19. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 20. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 21. ヘルスケア分野でAIが導入されている例として、患者モニタリングシステムの主な目的は次のうちどれですか? 医療記録の自動削除 患者のバイタルサインをリアルタイムで監視し、異常を検知する 薬剤の価格を一括管理する 病院のスタッフスケジュールを最適化する None 22. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 23. データ蓄積において、「ACID特性」を持つシステムで保証される一貫性とは次のうちどれですか? すべてのトランザクションが同時に実行されること。 トランザクションが中断された場合でも、データの整合性が保たれること。 データが並列処理中もリアルタイムで同期されること。 データが圧縮されて効率的に保存されること。 None 24. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 25. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 26. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 27. データ理解のプロセスにおいて最初に行うべきステップは次のうちどれですか? データの収集 データの前処理 データの定義と目標の設定 データの分析 None 28. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 29. データ理解において、「特徴量エンジニアリング」が重要とされる理由は次のうちどれですか? モデルの性能を向上させるためにデータの特徴を最適化するため データの前処理を自動化するため データの可視化を行うため 外れ値を取り除くため None 30. データセットの「次元削減」が必要となる主な理由として最も適切なものは次のうちどれですか? 全ての変数を削除し、モデルを単純化するため 高次元データの計算負荷を軽減し、過学習を防ぐため データの次元を増加させて精度を向上させるため 次元削減を行うとデータの意味が失われるため None 31. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 32. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 33. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 34. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 35. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 36. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 37. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 38. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 39. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 40. データセット内の外れ値を可視化するために最も適したグラフはどれですか? 箱ひげ図 ヒストグラム 散布図 円グラフ None 41. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 42. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 43. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 44. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 45. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 46. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None 47. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 48. 地理情報データを可視化する際、特定の値の濃淡を色で表現する手法は次のうちどれですか? カートグラム ヒートマップ 散布図 チョロプレス図(Choropleth Map) None 49. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 50. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 51. 自然言語処理(NLP)の最新技術である「GPT」モデルの主な用途として正しいものは次のうちどれですか? 数値データの分類 テキストの生成や翻訳 画像認識 音声データの解析 None 52. データのクレンジングを行う際に考慮すべき要素として最も適切なものは次のうちどれですか? データを全て再収集すること データの正規化を優先すること データの一部を削除すること データの一貫性、重複、欠損を修正し、分析に適した状態に整えること None 53. データ可視化の際、複数の変数間の非線形な関係を検出するために適したグラフは次のうちどれですか? 散布図行列(Pair Plot) ヒートマップ 棒グラフ 箱ひげ図 None 54. アプローチ設計において、「PoC(概念実証)」を実施する主な目的は次のうちどれですか? プロジェクト全体の成功を保証するため 提案された解決策が技術的および実用的に可能であることを確認するため プロジェクトスコープを明確にするため ステークホルダーの意見を完全に反映するため None 55. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 56. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None 57. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 58. 「データの一貫性」を確認する目的として最も適切なものは次のうちどれですか? 異なるデータソースからのデータが同じ形式で扱われることを保証するため データの内容が真実であることを確認するため データの欠損を補完するため データをモデルにそのまま投入するため None 59. AIを活用した「生成AI(Generative AI)」の最新の応用例として最も適切なものは次のうちどれですか? データの削除 音声データのリアルタイム分析 手作業によるデータ入力 画像やテキストの自動生成 None 60. AIが「ヘルスケア分野での診断支援システム」において果たす役割として最も適切なものは次のうちどれですか? 患者の医療画像を解析し、疾患の早期発見や診断を支援する 患者のデータを無視する AIがすべての治療を行う 医療データの管理を自動化する None 61. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 62. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 63. 「Explainable AI(XAI)」の最新動向に関する利点として最も適切なものは次のうちどれですか? AIの決定プロセスを透明化し、結果の説明が可能になる AIの精度を低下させる AIの結果をブラックボックス化する AIの学習速度を遅くする None 64. アプローチ設計において「ウォーターフォールモデル」が適している状況は次のうちどれですか? 要件が明確で、変更が予想されない場合 短期間で頻繁なフィードバックが必要な場合 チームが独立して作業できる場合 顧客要件がプロジェクト期間中に変化する可能性が高い場合 None 65. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 66. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 67. アプローチ設計において「リスク軽減策」として「リスク共有」が選択される状況として最も適切なものは次のうちどれですか? 特定のリスクが他のステークホルダーと共有可能な場合 プロジェクトリーダーが全てのリスクを管理できる場合 リスクが重大であり、プロジェクトを中止する必要がある場合 リスクが発生しても影響が軽微である場合 None 68. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 69. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 70. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 71. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 72. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 73. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 74. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 75. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 76. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 77. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 78. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 79. データ蓄積において、分散データベースで使用される「シャーディング」とは何ですか? データを一つの場所に集約して保存する手法 データを複数のサーバーに分散して保存する手法 データを圧縮して保存する手法 データを一時的にキャッシュに保存する手法 None 80. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 81. データ理解のために行う「相関分析」の目的は次のうちどれですか? データの分布を確認するため 時系列データの予測を行うため 2つの変数間の関係性を測定するため 欠損値を補完するため None 82. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 83. アプローチ設計において「データ駆動型の意思決定」が最も重要になる状況として適切なものは次のうちどれですか? データが少なく、意思決定に経験が優先される場合 データの品質が低い場合 データが豊富で、意思決定が複数の利害関係者に影響を与える場合 短期間で感覚的な意思決定が必要な場合 None 84. 変数間の相関関係を視覚化するためのペアプロットは、どのようなデータに適していますか? カテゴリカルデータ 時系列データ 数値データ テキストデータ None 85. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None 86. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 87. データベースでのACID特性のうち、"I"が示すものはどれですか? Isolation(独立性) Integrity(整合性) Indexing(インデックス化) Immutability(不変性) None 88. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 89. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 90. ヒストグラムと箱ひげ図(ボックスプロット)の違いとして正しいものは次のうちどれですか? ヒストグラムは分布の形状を、箱ひげ図は分散や異常値を示す。 ヒストグラムはカテゴリデータ、箱ひげ図は数値データに使用する。 箱ひげ図は分布の形状を示し、ヒストグラムは平均値を強調する。 ヒストグラムと箱ひげ図は同じ目的で使用される。 None 91. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 92. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 93. データ可視化の際、外れ値が多いデータセットで正確な可視化を行うために適した手法はどれですか? 箱ひげ図 散布図 ヒストグラム 折れ線グラフ None 94. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 95. 分散ファイルシステムにおいて、「HDFS」がデータの冗長性を確保するために使用する技術は次のうちどれですか? データの暗号化 レプリケーション シャーディング キャッシング None 96. 現在、AI技術が急速に進展している分野として最も適切なものは次のうちどれですか? 自動運転車 書籍の出版 手作業での農業 古典芸術の制作 None 97. カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか? カテゴリ間に序列がある場合のエンコードが容易であるため カテゴリカルデータが数値データとして扱われるようになるため カテゴリカルデータ間に意味のない序列が生じるのを防ぐため カテゴリカルデータの次元が増加しないため None 98. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 99. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 100. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None Time's up