DS検定~模擬試験③~ 2024年12月7日 ailearn 1. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 2. AIが「マーケティング分野」において特に効果的に活用されている例として正しいものは次のうちどれですか? 顧客データを削除する 顧客の購買行動データを分析し、パーソナライズされた広告を提供する 顧客に対して無作為に広告を配信する 顧客行動を分析しない None 3. 分散データベースにおいて、「クエーリーのシャーディング」は何を目的としていますか? クエリを複数のデータサーバーに分散させ、パフォーマンスを向上させる クエリを自動で最適化する クエリを圧縮してデータ転送速度を上げる クエリのエラーを自動修正する None 4. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 5. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 6. AIが医療現場で活用される例として最も適切なものは次のうちどれですか? 手術を全自動で行う 診断支援システムとして活用し、画像診断の精度を向上させる 医師の役割をすべて代替する 患者のコミュニケーションを代行する None 7. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 8. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 9. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 10. アプローチ設計において「ファシリテーション」の役割は何ですか? データの収集と分析を管理する 解決策を評価し、フィードバックを提供する チームのコミュニケーションを円滑にし、効果的な意思決定をサポートする プロジェクトの予算を管理する None 11. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 12. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 13. AIを活用した「生成AI(Generative AI)」の最新の応用例として最も適切なものは次のうちどれですか? データの削除 音声データのリアルタイム分析 手作業によるデータ入力 画像やテキストの自動生成 None 14. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 15. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 16. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 17. データサイエンスの最新動向において、「フェデレーテッドラーニング(Federated Learning)」がもたらす利点として正しいものは次のうちどれですか? 中央集権的に全てのデータを収集する 全てのデータを公開する 個々の端末でデータを学習し、プライバシーを保護する 分散学習を排除する None 18. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 19. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 20. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 21. アプローチ設計において「データ駆動型の意思決定」が重視される理由として最も適切なものは次のうちどれですか? データを基にリスクを最小限に抑えるため 主観的な判断を避け、客観的なデータに基づいて解決策を選択するため データを活用して迅速な意思決定を行うため すべてのステークホルダーの意見を反映させるため None 22. AIが「農業分野」で導入されることで最も期待される効果は次のうちどれですか? 作物の成長管理を自動化し、生産性と収穫量を最大化する 作物の品種をすべて統一する 作物の管理をすべて手動で行う 農業分野ではAIが使われない None 23. 自然言語処理(NLP)の最新技術である「GPT」モデルの主な用途として正しいものは次のうちどれですか? 数値データの分類 テキストの生成や翻訳 画像認識 音声データの解析 None 24. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 25. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 26. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 27. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 28. アプローチ設計において、リスク対応策として「回避」を選択する状況は次のうちどれですか? リスクが発生した後に迅速に対処する場合 リスクが発生しても影響が少ないと判断される場合 リスクを受け入れて、解決策を模索する場合 リスクの発生を完全に防ぐためにプロジェクトを中止する場合 None 29. 欠損データの割合を視覚化するために最も適した手法はどれですか? ヒートマップ 散布図 円グラフ ヒストグラム None 30. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 31. データ蓄積において「データウェアハウス」と「データレイク」の主な違いとして正しいものは次のうちどれですか? データウェアハウスはスキーマを事前に定義する必要があるが、データレイクはスキーマが不要である。 データウェアハウスは非構造化データに特化しているが、データレイクは構造化データに特化している。 データウェアハウスはクラウド環境でしか使用できないが、データレイクはオンプレミス環境でしか使用できない。 データウェアハウスは主にデータ保存に使用されるが、データレイクはデータ分析専用である。 None 32. AIによる「在庫管理システム」を導入することの利点として最も適切なものは次のうちどれですか? 在庫管理の精度が下がる 人手による在庫確認が増える リアルタイムで在庫量を監視し、需要予測に基づいた発注を自動化できる 在庫データが失われるリスクが高まる None 33. データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか? 外れ値が検出されない データがスケーリングされない 分散がゼロとなり、標準化できない 平均値が歪む None 34. アプローチ設計において「データ駆動型の意思決定」が最も重要になる状況として適切なものは次のうちどれですか? データが少なく、意思決定に経験が優先される場合 データの品質が低い場合 データが豊富で、意思決定が複数の利害関係者に影響を与える場合 短期間で感覚的な意思決定が必要な場合 None 35. データの可視化において、次のグラフの種類の中で、変数同士の相関の強さや相対関係を色の濃淡で示す手法はどれですか? 散布図 ヒートマップ 箱ひげ図 円グラフ None 36. 大規模データセットに対する次元削減を行う主な目的は次のうちどれですか? データの一部を削除して、容量を削減するため データの精度を向上させるため データの相関性を高めるため データの特徴をシンプルにし、処理や分析を効率化するため None 37. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 38. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 39. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 40. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 41. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 42. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 43. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 44. 分散ファイルシステムにおいて、「HDFS」がデータの冗長性を確保するために使用する技術は次のうちどれですか? データの暗号化 レプリケーション シャーディング キャッシング None 45. 以下の特性を持つストレージ技術として適切なものはどれですか? データをブロック単位で保存。 低レイテンシーでアクセス可能。 高速な読み書きが求められるアプリケーションで使用される。 オブジェクトストレージ ブロックストレージ データレイク ファイルストレージ None 46. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 47. 欠損値がMCAR(Missing Completely at Random)ではなくMAR(Missing at Random)の場合に推奨される欠損値処理方法は次のうちどれですか? 欠損値を無視して分析を続ける。 欠損値を平均値で補完する。 欠損値の補完に予測モデルを使用する。 欠損データを全て削除する。 None 48. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 49. 高次元データを可視化するための次元削減手法として「t-SNE」を使用する場合の注意点は次のうちどれですか? t-SNEは計算速度が非常に速いため、大規模データにも適している。 t-SNEは教師あり学習にのみ使用可能である。 t-SNEはカテゴリカルデータのみに適用可能である。 t-SNEは局所的な構造を重視するため、大域的な構造を把握しづらい。 None 50. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 51. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 52. 散布図において、データポイントが過剰に重なり合う場合、それを解消するための一般的な手法は次のうちどれですか? データの正規化 ヒートマップを使用する 点をランダムにずらす(ジッターリング) データをカテゴリに変換する None 53. ヒストグラムと箱ひげ図(ボックスプロット)の違いとして正しいものは次のうちどれですか? ヒストグラムは分布の形状を、箱ひげ図は分散や異常値を示す。 ヒストグラムはカテゴリデータ、箱ひげ図は数値データに使用する。 箱ひげ図は分布の形状を示し、ヒストグラムは平均値を強調する。 ヒストグラムと箱ひげ図は同じ目的で使用される。 None 54. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 55. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 56. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 57. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 58. データベースにおける「インデックス」の主な目的は何ですか? データの保存容量を削減する データの検索を高速化する データのバックアップを取る データを圧縮する None 59. AIが金融業界で最新のトレンドとなっている「AI取引」とは何ですか? 全ての取引をAIが管理する手法 AIが手動で取引を支援する手法 AIが取引を禁止する手法 AIがリアルタイムで市場データを分析し、自動的に取引を行う手法 None 60. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 61. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 62. AIを活用した農業の最新技術として、農作物の生育状況をリアルタイムでモニタリングするシステムが注目されています。この技術が最も貢献する分野は次のうちどれですか? 労働力の削減 農地の拡大 水資源の保護 農産物の輸出拡大 None 63. 時系列データの特性として、次のうち正しいものはどれですか? データが一貫して変動しない データがランダムに取得される データが構造化されていない 時間に沿った順序が重要である None 64. 複雑なプロジェクトにおける「クリティカルパス分析」の目的は次のうちどれですか? プロジェクト全体の進行において、遅延が最も影響を与えるタスクを特定するため プロジェクト全体のタスクを短縮するため すべてのタスクを同時に完了させるため コストを最小限に抑えるため None 65. 現在、AI技術が急速に進展している分野として最も適切なものは次のうちどれですか? 自動運転車 書籍の出版 手作業での農業 古典芸術の制作 None 66. データの「IQR(四分位範囲)」を用いて外れ値を検出する際、一般的に使用される閾値は次のうちどれですか? 1.0倍 1.5倍 2.0倍 3.0倍 None 67. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 68. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 69. 「AI倫理」の最新動向において、AIシステムに対する説明責任の確保が求められている理由として正しいものは次のうちどれですか? AIを無条件に信頼するため AIのすべての決定をブラックボックス化するため AIの導入を防ぐため AIの決定が公平であることを証明するため None 70. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 71. データ可視化において、複数のカテゴリ間の割合や構成比を比較するのに最適なグラフは次のうちどれですか? 円グラフ 積み上げ棒グラフ 散布図 ヒストグラム None 72. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 73. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 74. 大規模データの保存に適した「Hadoop HDFS(Hadoop Distributed File System)」の主な特性は次のうちどれですか? データを高速で検索できるインデックス機能を持つ データをリアルタイムで処理する 大規模なデータセットを分散して保存し、冗長性を確保する トランザクションを強力にサポートする None 75. データ理解の際に「正規化」を行う主な目的は何ですか? 欠損値を補完するため データの異常値を排除するため データの精度を高めるため データのスケールを統一し、比較しやすくするため None 76. 「外れ値(アウトライヤー)」を理解する際に重要な点は次のうちどれですか? 他のデータから大きく離れた値が、全体の傾向を歪める可能性があるため 外れ値は常に無視すべきものであるため 外れ値を取り除くことで、分析結果が必ず正確になるため 外れ値は分析に関係しないため None 77. AIが工場の生産ラインで最も一般的に使用される目的は次のうちどれですか? 製造プロセスの自動化と品質管理の最適化 製品のデザイン作成 販売促進活動 顧客サービスの提供 None 78. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 79. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 80. データサイエンスにおける「転移学習(Transfer Learning)」の最新動向として、最も適切なものは次のうちどれですか? モデルをゼロから学習させる手法 全てのデータを破棄する手法 データ前処理を無視する手法 既存のモデルの知識を利用して、新しいタスクに応用する手法 None 81. 次のうち、データのスケーリングを行う方法として正しいものはどれですか? データの最小値と最大値を使用してスケーリングする データの中央値を使用してスケーリングする データの範囲を倍にする データの外れ値を除去する None 82. 小売業界でAIを活用した「パーソナライズ広告配信」が注目されています。このシステムが特に効果を発揮する状況として最も適切なものは次のうちどれですか? 顧客の好みに基づいた広告をリアルタイムで配信する場合 顧客の購入履歴が乏しい場合 全顧客に同じ広告を一斉配信する場合 広告費を大幅に削減したい場合 None 83. データのクレンジングを行う際に考慮すべき要素として最も適切なものは次のうちどれですか? データを全て再収集すること データの正規化を優先すること データの一部を削除すること データの一貫性、重複、欠損を修正し、分析に適した状態に整えること None 84. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 85. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 86. データベースでのACID特性のうち、"I"が示すものはどれですか? Isolation(独立性) Integrity(整合性) Indexing(インデックス化) Immutability(不変性) None 87. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 88. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 89. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 90. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 91. データベースのシャーディング(Sharding)において、データのパーティショニングを行う主な理由は次のうちどれですか? データ量が増加した際に、システムのスケーラビリティを確保するため データのセキュリティを強化するため データの保存コストを削減するため データを複数のバックアップサーバーに保存するため None 92. データのバイアスを取り除くための適切な手法は次のうちどれですか? 標準化 無作為抽出 欠損値補完 正規化 None 93. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 94. 欠損データを補完するための「多重代入法(Multiple Imputation)」の主な利点として正しいものは次のうちどれですか? 欠損値を平均値で簡単に補完できる。 欠損データの影響を無視するモデルを作成できる。 欠損データに関する不確実性を考慮できる。 欠損データの除外を容易にする。 None 95. データ可視化の際、外れ値が多いデータセットで正確な可視化を行うために適した手法はどれですか? 箱ひげ図 散布図 ヒストグラム 折れ線グラフ None 96. カテゴリカルデータの頻度分布を視覚化するための最も適したグラフは次のうちどれですか? 棒グラフ 散布図 ヒストグラム 折れ線グラフ None 97. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 98. AIによる「需要予測」の導入が成功している業界として最も適切なものは次のうちどれですか? 教育 農業 製造業 エネルギー None 99. 次元削減後のデータを可視化するために、UMAPの利点は何ですか? 高次元データの構造を保持しやすい 可視化が容易なため、データの理解が進む 計算が早く、大規模データにも適応できる 全てが利点 None 100. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None Time's up