DS検定~模擬試験③~ 2024年12月7日 ailearn 1. 大規模データセットに対する次元削減を行う主な目的は次のうちどれですか? データの一部を削除して、容量を削減するため データの精度を向上させるため データの相関性を高めるため データの特徴をシンプルにし、処理や分析を効率化するため None 2. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 3. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 4. 「データベースのインデックス」の主な目的として最も適切なものは次のうちどれですか? データを暗号化してセキュリティを強化すること。 データの冗長性を排除すること。 データのスキーマを動的に変更すること。 データの検索速度を向上させること。 None 5. アプローチ設計において、パイロットプロジェクトを実施する際の主要な成功要因として最も適切なものは次のうちどれですか? パイロットプロジェクトで利用するデータ量を最小化すること パイロットプロジェクトを終了後すぐに本番導入すること パイロットプロジェクトの失敗を避けるためにリスクを完全に排除すること パイロットプロジェクトの結果を実際の運用環境に適用できること None 6. 自然言語処理(NLP)の最新技術である「GPT」モデルの主な用途として正しいものは次のうちどれですか? 数値データの分類 テキストの生成や翻訳 画像認識 音声データの解析 None 7. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 8. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 9. データ理解の際に「正規化」を行う主な目的は何ですか? 欠損値を補完するため データの異常値を排除するため データの精度を高めるため データのスケールを統一し、比較しやすくするため None 10. 変数間の相関関係を視覚化するためのペアプロットは、どのようなデータに適していますか? カテゴリカルデータ 時系列データ 数値データ テキストデータ None 11. データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか? 外れ値が検出されない データがスケーリングされない 分散がゼロとなり、標準化できない 平均値が歪む None 12. 散布図において、データポイントが過剰に重なり合う場合、それを解消するための一般的な手法は次のうちどれですか? データの正規化 ヒートマップを使用する 点をランダムにずらす(ジッターリング) データをカテゴリに変換する None 13. 分散データベースにおける「CAP定理」の3つの要素に該当しないものは次のうちどれですか? Consistency(整合性) Availability(可用性) Partition Tolerance(分割耐性) Performance(性能) None 14. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 15. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 16. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 17. 分散データベースにおいて、「クエーリーのシャーディング」は何を目的としていますか? クエリを複数のデータサーバーに分散させ、パフォーマンスを向上させる クエリを自動で最適化する クエリを圧縮してデータ転送速度を上げる クエリのエラーを自動修正する None 18. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 19. データ理解において、「特徴量エンジニアリング」が重要とされる理由は次のうちどれですか? モデルの性能を向上させるためにデータの特徴を最適化するため データの前処理を自動化するため データの可視化を行うため 外れ値を取り除くため None 20. 「時系列データ」の特徴として、分析時に特に考慮すべき事項は次のうちどれですか? 時系列データはすべて独立している 時系列データには季節性が存在しない 時系列データは常に正規分布に従う 時系列データの値は、時間の経過とともに相関が生じることが多い None 21. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 22. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 23. アプローチ設計において「パイロットプロジェクト」を実施する主な目的は何ですか? 完全な実装前にすべてのデータを収集するため プロジェクトの全体像を短期間で完成させるため プロジェクトのコストを最小限に抑えるため 小規模で解決策をテストし、その有効性を確認するため None 24. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 25. AIが医療現場で活用される例として最も適切なものは次のうちどれですか? 手術を全自動で行う 診断支援システムとして活用し、画像診断の精度を向上させる 医師の役割をすべて代替する 患者のコミュニケーションを代行する None 26. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 27. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 28. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 29. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 30. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 31. アプローチ設計において「ファシリテーション」の役割は何ですか? データの収集と分析を管理する 解決策を評価し、フィードバックを提供する チームのコミュニケーションを円滑にし、効果的な意思決定をサポートする プロジェクトの予算を管理する None 32. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 33. AIが「ヘルスケア分野での診断支援システム」において果たす役割として最も適切なものは次のうちどれですか? 患者の医療画像を解析し、疾患の早期発見や診断を支援する 患者のデータを無視する AIがすべての治療を行う 医療データの管理を自動化する None 34. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 35. 小売業界でAIを活用した「パーソナライズ広告配信」が注目されています。このシステムが特に効果を発揮する状況として最も適切なものは次のうちどれですか? 顧客の好みに基づいた広告をリアルタイムで配信する場合 顧客の購入履歴が乏しい場合 全顧客に同じ広告を一斉配信する場合 広告費を大幅に削減したい場合 None 36. AIによる「在庫管理システム」を導入することの利点として最も適切なものは次のうちどれですか? 在庫管理の精度が下がる 人手による在庫確認が増える リアルタイムで在庫量を監視し、需要予測に基づいた発注を自動化できる 在庫データが失われるリスクが高まる None 37. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 38. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None 39. アプローチ設計における「フェーズゲート法」とは何ですか? プロジェクトの各フェーズごとに進行状況を評価し、次のフェーズに進むかどうかを判断する手法 各フェーズでチームの成果を報告する手法 プロジェクト全体を一度に評価し、終了するタイミングを決定する手法 各フェーズごとに異なる解決策を適用する手法 None 40. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 41. データの可視化において、次のグラフの種類の中で、変数同士の相関の強さや相対関係を色の濃淡で示す手法はどれですか? 散布図 ヒートマップ 箱ひげ図 円グラフ None 42. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 43. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 44. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None 45. アプローチ設計において「ウォーターフォールモデル」が適している状況は次のうちどれですか? 要件が明確で、変更が予想されない場合 短期間で頻繁なフィードバックが必要な場合 チームが独立して作業できる場合 顧客要件がプロジェクト期間中に変化する可能性が高い場合 None 46. 最新のAI技術「ディープフェイク」がもたらす社会的なリスクとして最も適切なものは次のうちどれですか? AIの導入が遅れる データの削除 動画の圧縮 動画や音声の不正な生成による情報操作や詐欺の増加 None 47. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 48. AIによる「異常検知システム」が製造業に導入されることで得られる主な利点は次のうちどれですか? 製品の品質を無視する 製造コストが増加する AIによる検知が不正確になる 製品の不良品や設備の異常をリアルタイムで検出し、早期に対応できる None 49. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 50. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 51. データ理解のプロセスにおいて最初に行うべきステップは次のうちどれですか? データの収集 データの前処理 データの定義と目標の設定 データの分析 None 52. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 53. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 54. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 55. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 56. 散布図は主にどのようなデータの可視化に使用されますか? カテゴリカルデータの分布 2つの連続変数間の関係 時系列データの変動 データの中心傾向 None 57. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 58. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 59. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 60. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 61. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 62. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 63. 農業分野でAIが導入され、収穫量の予測を行う場合、AIモデルの精度を向上させるために最も重要なデータは次のうちどれですか? 農作物の販売価格 農機具の種類と台数 地域の人口密度 土壌の成分、気象データ、過去の収穫データ None 64. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 65. データ可視化の際、複数の変数間の非線形な関係を検出するために適したグラフは次のうちどれですか? 散布図行列(Pair Plot) ヒートマップ 棒グラフ 箱ひげ図 None 66. AI倫理において「AIバイアスの除去」が重視される理由として最も適切なものは次のうちどれですか? AIが複雑なデータを処理できるようにするため AIシステムが特定の属性に不公平な判断をしないようにするため AIの計算速度を向上させるため AIモデルのサイズを小さくするため None 67. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 68. データベースでのACID特性のうち、"I"が示すものはどれですか? Isolation(独立性) Integrity(整合性) Indexing(インデックス化) Immutability(不変性) None 69. アプローチ設計において「リソースアロケーション」とは何を指しますか? チームのメンバーに役割を割り当てること プロジェクトにおける成果を評価すること プロジェクトの進行に必要な資源(人員、予算、時間など)を適切に配分すること 解決策のリスクを最小化するためのプロセスを設定すること None 70. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 71. データ蓄積において、分散データベースで使用される「シャーディング」とは何ですか? データを一つの場所に集約して保存する手法 データを複数のサーバーに分散して保存する手法 データを圧縮して保存する手法 データを一時的にキャッシュに保存する手法 None 72. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 73. データベースの「トランザクション分離レベル」において、最も強い整合性を保証するレベルはどれですか? Read Committed Repeatable Read Serializable Read Uncommitted None 74. データ蓄積において、バックアップの目的は次のうちどれですか? データベースのパフォーマンスを向上させる データのサイズを小さくする データを保護し、障害時に復元できるようにする データの分析を高速化する None 75. 大規模データセットのサンプリングを行う際の注意点として最も重要なものは次のうちどれですか? サンプルが全体のデータを代表するものであること サンプルがランダムに選ばれていること サンプルが欠損データを含まないこと サンプルが少ない方が効率的な分析ができること None 76. AIを活用した交通管理システムにおいて、最も一般的な目的は次のうちどれですか? 交通事故のデータを削除する 信号の故障を予測する 渋滞の予測とリアルタイム交通制御 車両の登録情報を一括管理する None 77. 時系列データの特性として、次のうち正しいものはどれですか? データが一貫して変動しない データがランダムに取得される データが構造化されていない 時間に沿った順序が重要である None 78. 現在、AI技術が急速に進展している分野として最も適切なものは次のうちどれですか? 自動運転車 書籍の出版 手作業での農業 古典芸術の制作 None 79. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 80. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 81. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 82. アプローチ設計において、目標を「具体的・測定可能・達成可能・関連性がある・期限付き」(SMART)の形で設定する理由は何ですか? チーム全体で共通の理解を持ち、進捗を測定できるようにするため 目標を柔軟に変更できるようにするため コストを最小限に抑えるため 目標を簡単に達成するため None 83. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 84. 以下の特性を持つストレージ技術として適切なものはどれですか? データをブロック単位で保存。 低レイテンシーでアクセス可能。 高速な読み書きが求められるアプリケーションで使用される。 オブジェクトストレージ ブロックストレージ データレイク ファイルストレージ None 85. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 86. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 87. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 88. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 89. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 90. データ可視化において、変数の密度分布を滑らかに表現するために使用される手法はどれですか? ヒストグラム KDE(カーネル密度推定) 散布図 箱ひげ図 None 91. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 92. カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか? カテゴリ間に序列がある場合のエンコードが容易であるため カテゴリカルデータが数値データとして扱われるようになるため カテゴリカルデータ間に意味のない序列が生じるのを防ぐため カテゴリカルデータの次元が増加しないため None 93. ヒストグラムと箱ひげ図(ボックスプロット)の違いとして正しいものは次のうちどれですか? ヒストグラムは分布の形状を、箱ひげ図は分散や異常値を示す。 ヒストグラムはカテゴリデータ、箱ひげ図は数値データに使用する。 箱ひげ図は分布の形状を示し、ヒストグラムは平均値を強調する。 ヒストグラムと箱ひげ図は同じ目的で使用される。 None 94. 「CAP定理」において、ネットワーク分断耐性を維持しつつ可用性を優先するシステムの課題として最も適切なものは次のうちどれですか? トランザクション処理の速度が低下すること。 データベースが分断されると操作が停止すること。 データの一時的な不整合が発生すること。 データが大量に保存できなくなること。 None 95. データの前処理における「欠損データの処理」方法として適切なものは次のうちどれですか? 欠損データを全て削除する 欠損データを適切な値で補完する 欠損データは無視して分析を続行する 欠損データを平均値で埋める None 96. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 97. AIを活用した「顧客リテンション分析」の主な目的は次のうちどれですか? 顧客の離脱を予測し、離脱を防止するための施策を講じる 新規顧客を獲得する すべての顧客に同じ対応をする 顧客データを削除する None 98. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 99. 地理情報データを可視化する際、特定の値の濃淡を色で表現する手法は次のうちどれですか? カートグラム ヒートマップ 散布図 チョロプレス図(Choropleth Map) None 100. 農業分野におけるAIの利活用として最も効果的なものは次のうちどれですか? 農作物の種類をAIが決定する AIを利用して農作物の成長を監視し、収穫時期を最適化する 農業のすべての作業をAIに任せる 気象予測を無視して作業を進める None Time's up