DS検定~模擬試験③~ 2024年12月7日 ailearn 1. データ蓄積において、分散データベースで使用される「シャーディング」とは何ですか? データを一つの場所に集約して保存する手法 データを複数のサーバーに分散して保存する手法 データを圧縮して保存する手法 データを一時的にキャッシュに保存する手法 None 2. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 3. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 4. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 5. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None 6. 次元削減後のデータを可視化するために、UMAPの利点は何ですか? 高次元データの構造を保持しやすい 可視化が容易なため、データの理解が進む 計算が早く、大規模データにも適応できる 全てが利点 None 7. One-Hot Encodingを使用した場合に、次元数が増加しすぎる(次元の呪い)を防ぐための対策として適切なものは次のうちどれですか? 高頻度カテゴリのみをエンコードする。 カテゴリを数値化し、そのまま使用する。 標準化を適用して次元を削減する。 主成分分析(PCA)を適用して次元削減を行う。 None 8. データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか? 1.0倍 1.5倍 2.0倍 3.0倍 None 9. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 10. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 11. アプローチ設計において、目標を「具体的・測定可能・達成可能・関連性がある・期限付き」(SMART)の形で設定する理由は何ですか? チーム全体で共通の理解を持ち、進捗を測定できるようにするため 目標を柔軟に変更できるようにするため コストを最小限に抑えるため 目標を簡単に達成するため None 12. 以下の特性を持つストレージ技術として適切なものはどれですか? データをブロック単位で保存。 低レイテンシーでアクセス可能。 高速な読み書きが求められるアプリケーションで使用される。 オブジェクトストレージ ブロックストレージ データレイク ファイルストレージ None 13. カテゴリカルデータの頻度分布を視覚化するための最も適したグラフは次のうちどれですか? 棒グラフ 散布図 ヒストグラム 折れ線グラフ None 14. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 15. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 16. データ理解の際に「正規化」を行う主な目的は何ですか? 欠損値を補完するため データの異常値を排除するため データの精度を高めるため データのスケールを統一し、比較しやすくするため None 17. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 18. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 19. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 20. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 21. 高次元データのクラスタリング結果を2次元で可視化するために推奨される手法はどれですか? 箱ひげ図 散布図 t-SNE ヒートマップ None 22. AIが工場の生産ラインで最も一般的に使用される目的は次のうちどれですか? 製造プロセスの自動化と品質管理の最適化 製品のデザイン作成 販売促進活動 顧客サービスの提供 None 23. 大規模データの保存に適した「Hadoop HDFS(Hadoop Distributed File System)」の主な特性は次のうちどれですか? データを高速で検索できるインデックス機能を持つ データをリアルタイムで処理する 大規模なデータセットを分散して保存し、冗長性を確保する トランザクションを強力にサポートする None 24. 大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか? 系統抽出 ランダムフォレストを使用する クロスバリデーション 無作為抽出 None 25. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 26. 時系列データの特性として、次のうち正しいものはどれですか? データが一貫して変動しない データがランダムに取得される データが構造化されていない 時間に沿った順序が重要である None 27. AI倫理において「AIバイアスの除去」が重視される理由として最も適切なものは次のうちどれですか? AIが複雑なデータを処理できるようにするため AIシステムが特定の属性に不公平な判断をしないようにするため AIの計算速度を向上させるため AIモデルのサイズを小さくするため None 28. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 29. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 30. データベースの「トランザクション分離レベル」において、最も強い整合性を保証するレベルはどれですか? Read Committed Repeatable Read Serializable Read Uncommitted None 31. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 32. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 33. データセットの「次元削減」が必要となる主な理由として最も適切なものは次のうちどれですか? 全ての変数を削除し、モデルを単純化するため 高次元データの計算負荷を軽減し、過学習を防ぐため データの次元を増加させて精度を向上させるため 次元削減を行うとデータの意味が失われるため None 34. アプローチ設計において、パイロットプロジェクトを実施する際の主要な成功要因として最も適切なものは次のうちどれですか? パイロットプロジェクトで利用するデータ量を最小化すること パイロットプロジェクトを終了後すぐに本番導入すること パイロットプロジェクトの失敗を避けるためにリスクを完全に排除すること パイロットプロジェクトの結果を実際の運用環境に適用できること None 35. アプローチ設計における「フェーズゲート法」とは何ですか? プロジェクトの各フェーズごとに進行状況を評価し、次のフェーズに進むかどうかを判断する手法 各フェーズでチームの成果を報告する手法 プロジェクト全体を一度に評価し、終了するタイミングを決定する手法 各フェーズごとに異なる解決策を適用する手法 None 36. データ理解のプロセスにおいて最初に行うべきステップは次のうちどれですか? データの収集 データの前処理 データの定義と目標の設定 データの分析 None 37. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 38. 「Explainable AI(XAI)」の最新動向に関する利点として最も適切なものは次のうちどれですか? AIの決定プロセスを透明化し、結果の説明が可能になる AIの精度を低下させる AIの結果をブラックボックス化する AIの学習速度を遅くする None 39. AIを活用した農業の最新技術として、農作物の生育状況をリアルタイムでモニタリングするシステムが注目されています。この技術が最も貢献する分野は次のうちどれですか? 労働力の削減 農地の拡大 水資源の保護 農産物の輸出拡大 None 40. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 41. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 42. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 43. データサイエンスにおける「転移学習(Transfer Learning)」の最新動向として、最も適切なものは次のうちどれですか? モデルをゼロから学習させる手法 全てのデータを破棄する手法 データ前処理を無視する手法 既存のモデルの知識を利用して、新しいタスクに応用する手法 None 44. データベースのシャーディング(Sharding)において、データのパーティショニングを行う主な理由は次のうちどれですか? データ量が増加した際に、システムのスケーラビリティを確保するため データのセキュリティを強化するため データの保存コストを削減するため データを複数のバックアップサーバーに保存するため None 45. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 46. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 47. 散布図において、データポイントが過剰に重なり合う場合、それを解消するための一般的な手法は次のうちどれですか? データの正規化 ヒートマップを使用する 点をランダムにずらす(ジッターリング) データをカテゴリに変換する None 48. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 49. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 50. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 51. データ理解のために行う「相関分析」の目的は次のうちどれですか? データの分布を確認するため 時系列データの予測を行うため 2つの変数間の関係性を測定するため 欠損値を補完するため None 52. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 53. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 54. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 55. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 56. データのクレンジングを行う際に考慮すべき要素として最も適切なものは次のうちどれですか? データを全て再収集すること データの正規化を優先すること データの一部を削除すること データの一貫性、重複、欠損を修正し、分析に適した状態に整えること None 57. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 58. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 59. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 60. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 61. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 62. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 63. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 64. データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか? 外れ値が検出されない データがスケーリングされない 分散がゼロとなり、標準化できない 平均値が歪む None 65. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 66. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 67. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 68. 「時系列データ」の特徴として、分析時に特に考慮すべき事項は次のうちどれですか? 時系列データはすべて独立している 時系列データには季節性が存在しない 時系列データは常に正規分布に従う 時系列データの値は、時間の経過とともに相関が生じることが多い None 69. データベースでのACID特性のうち、"I"が示すものはどれですか? Isolation(独立性) Integrity(整合性) Indexing(インデックス化) Immutability(不変性) None 70. データ可視化において、複数のカテゴリ間の割合や構成比を比較するのに最適なグラフは次のうちどれですか? 円グラフ 積み上げ棒グラフ 散布図 ヒストグラム None 71. 次のうち、データのスケーリングを行う方法として正しいものはどれですか? データの最小値と最大値を使用してスケーリングする データの中央値を使用してスケーリングする データの範囲を倍にする データの外れ値を除去する None 72. 農業分野でAIが導入され、収穫量の予測を行う場合、AIモデルの精度を向上させるために最も重要なデータは次のうちどれですか? 農作物の販売価格 農機具の種類と台数 地域の人口密度 土壌の成分、気象データ、過去の収穫データ None 73. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 74. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None 75. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None 76. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 77. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 78. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 79. データ蓄積において、バックアップの目的は次のうちどれですか? データベースのパフォーマンスを向上させる データのサイズを小さくする データを保護し、障害時に復元できるようにする データの分析を高速化する None 80. ヘルスケア分野でAIが導入されている例として、患者モニタリングシステムの主な目的は次のうちどれですか? 医療記録の自動削除 患者のバイタルサインをリアルタイムで監視し、異常を検知する 薬剤の価格を一括管理する 病院のスタッフスケジュールを最適化する None 81. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 82. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 83. データ蓄積において、データウェアハウスの主な利用目的は何ですか? データを短期間だけ保存すること データをリアルタイムで処理すること データを圧縮して保存すること 大量のデータを分析するためにデータを集約すること None 84. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 85. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 86. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 87. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 88. 大規模データセットのサンプリングを行う際の注意点として最も重要なものは次のうちどれですか? サンプルが全体のデータを代表するものであること サンプルがランダムに選ばれていること サンプルが欠損データを含まないこと サンプルが少ない方が効率的な分析ができること None 89. 複数のシナリオを考慮したアプローチ設計において、シナリオプランニングが有効とされる理由は次のうちどれですか? シナリオごとに異なる解決策を実行するため すべてのシナリオに対して同じ解決策を適用するため 不確実な未来に備え、異なる可能性に対応するため 短期間で結果を得るため None 90. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 91. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 92. データの「拡張現実(AR)」に関する最新技術の応用例として最も適切なものは次のうちどれですか? ARを使って建築物の仮想設計を行う ARを使ってデータの圧縮を行う ARを使って音声データの解析を行う ARを使って市場データを分類する None 93. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 94. 高次元データを可視化するための次元削減手法として「t-SNE」を使用する場合の注意点は次のうちどれですか? t-SNEは計算速度が非常に速いため、大規模データにも適している。 t-SNEは教師あり学習にのみ使用可能である。 t-SNEはカテゴリカルデータのみに適用可能である。 t-SNEは局所的な構造を重視するため、大域的な構造を把握しづらい。 None 95. 最新のAI技術「ディープフェイク」がもたらす社会的なリスクとして最も適切なものは次のうちどれですか? AIの導入が遅れる データの削除 動画の圧縮 動画や音声の不正な生成による情報操作や詐欺の増加 None 96. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 97. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 98. 「Explainable AI(XAI)」が注目される背景として最も適切な理由は次のうちどれですか? AIシステムの動作を完全に自動化するため AIシステムの運用コストを削減するため AIの学習速度を向上させるため 利用者がAIの判断理由を理解しやすくするため None 99. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 100. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None Time's up