DS検定~模擬試験③~ 2024年12月7日 ailearn 1. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 2. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 3. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 4. データ可視化において、複数のカテゴリ間の割合や構成比を比較するのに最適なグラフは次のうちどれですか? 円グラフ 積み上げ棒グラフ 散布図 ヒストグラム None 5. アプローチ設計において「リソースアロケーション」とは何を指しますか? チームのメンバーに役割を割り当てること プロジェクトにおける成果を評価すること プロジェクトの進行に必要な資源(人員、予算、時間など)を適切に配分すること 解決策のリスクを最小化するためのプロセスを設定すること None 6. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 7. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 8. アプローチ設計において、目標を「具体的・測定可能・達成可能・関連性がある・期限付き」(SMART)の形で設定する理由は何ですか? チーム全体で共通の理解を持ち、進捗を測定できるようにするため 目標を柔軟に変更できるようにするため コストを最小限に抑えるため 目標を簡単に達成するため None 9. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 10. AIが医療現場で活用される例として最も適切なものは次のうちどれですか? 手術を全自動で行う 診断支援システムとして活用し、画像診断の精度を向上させる 医師の役割をすべて代替する 患者のコミュニケーションを代行する None 11. データ可視化の際、外れ値が多いデータセットで正確な可視化を行うために適した手法はどれですか? 箱ひげ図 散布図 ヒストグラム 折れ線グラフ None 12. AIを活用した「物流最適化システム」において、AIが主に分析対象とするデータとして最も重要なものは次のうちどれですか? 商品のデザイン情報 倉庫内の従業員のシフト表 販売促進キャンペーンの予算 配送ルート、交通状況、天候情報 None 13. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 14. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 15. AIによる「需要予測」の導入が成功している業界として最も適切なものは次のうちどれですか? 教育 農業 製造業 エネルギー None 16. 大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか? 系統抽出 ランダムフォレストを使用する クロスバリデーション 無作為抽出 None 17. データ理解のプロセスで、「データのバイアス」を検出する主な目的として最も適切なものは次のうちどれですか? バイアスが分析結果や意思決定に及ぼす影響を評価するため バイアスを削除してモデル精度を上げるため データにバイアスが含まれていないことを証明するため バイアスを活用してモデルの性能を向上させるため None 18. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 19. 散布図において、データポイントが過剰に重なり合う場合、それを解消するための一般的な手法は次のうちどれですか? データの正規化 ヒートマップを使用する 点をランダムにずらす(ジッターリング) データをカテゴリに変換する None 20. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 21. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 22. アプローチ設計において「データ駆動型の意思決定」が重視される理由として最も適切なものは次のうちどれですか? データを基にリスクを最小限に抑えるため 主観的な判断を避け、客観的なデータに基づいて解決策を選択するため データを活用して迅速な意思決定を行うため すべてのステークホルダーの意見を反映させるため None 23. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 24. 「データの一貫性」を確認する目的として最も適切なものは次のうちどれですか? 異なるデータソースからのデータが同じ形式で扱われることを保証するため データの内容が真実であることを確認するため データの欠損を補完するため データをモデルにそのまま投入するため None 25. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 26. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 27. アプローチ設計において、パイロットプロジェクトを実施する際の主要な成功要因として最も適切なものは次のうちどれですか? パイロットプロジェクトで利用するデータ量を最小化すること パイロットプロジェクトを終了後すぐに本番導入すること パイロットプロジェクトの失敗を避けるためにリスクを完全に排除すること パイロットプロジェクトの結果を実際の運用環境に適用できること None 28. データ準備において、データ型の整備を行う主な理由として最も適切なものは次のうちどれですか? データのメモリ使用量を削減するため。 モデルがデータを正しく処理するため。 データの視覚化が不要になるため。 欠損値を補完するため。 None 29. 時系列データの分析において、データのトレンドを除去するための手法はどれですか? データの標準化 移動平均法 クラスタリング カイ二乗検定 None 30. 時系列データの特性として、次のうち正しいものはどれですか? データが一貫して変動しない データがランダムに取得される データが構造化されていない 時間に沿った順序が重要である None 31. ヘルスケア分野でAIが導入されている例として、患者モニタリングシステムの主な目的は次のうちどれですか? 医療記録の自動削除 患者のバイタルサインをリアルタイムで監視し、異常を検知する 薬剤の価格を一括管理する 病院のスタッフスケジュールを最適化する None 32. 変数間の相関関係を視覚化するためのペアプロットは、どのようなデータに適していますか? カテゴリカルデータ 時系列データ 数値データ テキストデータ None 33. 次のうち、データのスケーリングを行う方法として正しいものはどれですか? データの最小値と最大値を使用してスケーリングする データの中央値を使用してスケーリングする データの範囲を倍にする データの外れ値を除去する None 34. アプローチ設計において「ファシリテーション」の役割は何ですか? データの収集と分析を管理する 解決策を評価し、フィードバックを提供する チームのコミュニケーションを円滑にし、効果的な意思決定をサポートする プロジェクトの予算を管理する None 35. 金融業界でAIが活用されている分野として最も一般的なものは次のうちどれですか? 融資判断とリスク管理 預金の管理 現金の流通 支店の設計 None 36. 高次元データを可視化するための次元削減手法として「t-SNE」を使用する場合の注意点は次のうちどれですか? t-SNEは計算速度が非常に速いため、大規模データにも適している。 t-SNEは教師あり学習にのみ使用可能である。 t-SNEはカテゴリカルデータのみに適用可能である。 t-SNEは局所的な構造を重視するため、大域的な構造を把握しづらい。 None 37. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 38. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None 39. AIを活用した農業の最新技術として、農作物の生育状況をリアルタイムでモニタリングするシステムが注目されています。この技術が最も貢献する分野は次のうちどれですか? 労働力の削減 農地の拡大 水資源の保護 農産物の輸出拡大 None 40. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 41. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 42. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 43. トレーニングデータとテストデータをランダムに分割する際、データが時間依存性を持つ場合に最も注意すべき点は次のうちどれですか? 分割比率を一定に保つ。 時系列順を考慮して分割する。 カテゴリカルデータをエンコードしてから分割する。 分割後にデータをシャッフルする。 None 44. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 45. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 46. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 47. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 48. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 49. 円グラフを使用する際の一般的な注意点はどれですか? 変数の分布が正規分布であること データの比率が小さい場合には適さない 多次元データに対して適している データの順序を表す必要がある None 50. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 51. データの標準化を行う際、標準偏差が0に近い場合、次のうちどの問題が発生しますか? 外れ値が検出されない データがスケーリングされない 分散がゼロとなり、標準化できない 平均値が歪む None 52. 分散データベースにおける「CAP定理」の3つの要素に該当しないものは次のうちどれですか? Consistency(整合性) Availability(可用性) Partition Tolerance(分割耐性) Performance(性能) None 53. データ蓄積において「データウェアハウス」と「データレイク」の主な違いとして正しいものは次のうちどれですか? データウェアハウスはスキーマを事前に定義する必要があるが、データレイクはスキーマが不要である。 データウェアハウスは非構造化データに特化しているが、データレイクは構造化データに特化している。 データウェアハウスはクラウド環境でしか使用できないが、データレイクはオンプレミス環境でしか使用できない。 データウェアハウスは主にデータ保存に使用されるが、データレイクはデータ分析専用である。 None 54. AIが「マーケティング分野」において特に効果的に活用されている例として正しいものは次のうちどれですか? 顧客データを削除する 顧客の購買行動データを分析し、パーソナライズされた広告を提供する 顧客に対して無作為に広告を配信する 顧客行動を分析しない None 55. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 56. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 57. オブジェクトストレージとブロックストレージの主な違いは次のうちどれですか? ブロックストレージは分散環境でしか使用できない オブジェクトストレージはメタデータを持ち、ブロックストレージは持たない オブジェクトストレージはSQLクエリをサポートする ブロックストレージはスケーラビリティに優れている None 58. データ可視化において、変数の密度分布を滑らかに表現するために使用される手法はどれですか? ヒストグラム KDE(カーネル密度推定) 散布図 箱ひげ図 None 59. データのバイアスを取り除くための適切な手法は次のうちどれですか? 標準化 無作為抽出 欠損値補完 正規化 None 60. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 61. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 62. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 63. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 64. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 65. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 66. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 67. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 68. データ蓄積において、「ACID特性」を持つシステムで保証される一貫性とは次のうちどれですか? すべてのトランザクションが同時に実行されること。 トランザクションが中断された場合でも、データの整合性が保たれること。 データが並列処理中もリアルタイムで同期されること。 データが圧縮されて効率的に保存されること。 None 69. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 70. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 71. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 72. データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか? 欠損データは他の観測データと無関係に発生している 欠損データは特定の変数の値に依存して発生している 欠損データは外れ値によって発生している 欠損データは観測データ全体の分布に依存している None 73. 「時系列データ」の特徴として、分析時に特に考慮すべき事項は次のうちどれですか? 時系列データはすべて独立している 時系列データには季節性が存在しない 時系列データは常に正規分布に従う 時系列データの値は、時間の経過とともに相関が生じることが多い None 74. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 75. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 76. AIが「スマートホームシステム」で果たす役割として最も適切なものは次のうちどれですか? 家電の修理を行う 家電の設置を自動で行う 家電の使用を制限する 家電の自動制御を行い、エネルギー効率を最適化する None 77. 「CAP定理」において、ネットワーク分断耐性を維持しつつ可用性を優先するシステムの課題として最も適切なものは次のうちどれですか? トランザクション処理の速度が低下すること。 データベースが分断されると操作が停止すること。 データの一時的な不整合が発生すること。 データが大量に保存できなくなること。 None 78. 次元削減後のデータを可視化するために、UMAPの利点は何ですか? 高次元データの構造を保持しやすい 可視化が容易なため、データの理解が進む 計算が早く、大規模データにも適応できる 全てが利点 None 79. アプローチ設計における「フィードバックループ」の役割は次のうちどれですか? プロジェクトの進行中に、得られた結果やデータを基に改善策を導入する プロジェクト完了後に成果を報告する プロジェクトの最初に課題を定義する プロジェクトのリソースを最適化する None 80. データの前処理における「欠損データの処理」方法として適切なものは次のうちどれですか? 欠損データを全て削除する 欠損データを適切な値で補完する 欠損データは無視して分析を続行する 欠損データを平均値で埋める None 81. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 82. データセット内の外れ値を可視化するために最も適したグラフはどれですか? 箱ひげ図 ヒストグラム 散布図 円グラフ None 83. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 84. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 85. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 86. アプローチ設計における「フェーズゲート法」とは何ですか? プロジェクトの各フェーズごとに進行状況を評価し、次のフェーズに進むかどうかを判断する手法 各フェーズでチームの成果を報告する手法 プロジェクト全体を一度に評価し、終了するタイミングを決定する手法 各フェーズごとに異なる解決策を適用する手法 None 87. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 88. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 89. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 90. データセット全体の傾向を一目で把握するために最適な可視化手法は次のどれですか? 散布図 棒グラフ 箱ひげ図 ヒートマップ None 91. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 92. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None 93. データ理解において、「特徴量エンジニアリング」が重要とされる理由は次のうちどれですか? モデルの性能を向上させるためにデータの特徴を最適化するため データの前処理を自動化するため データの可視化を行うため 外れ値を取り除くため None 94. 「データベースのインデックス」の主な目的として最も適切なものは次のうちどれですか? データを暗号化してセキュリティを強化すること。 データの冗長性を排除すること。 データのスキーマを動的に変更すること。 データの検索速度を向上させること。 None 95. 大規模データの保存に適した「Hadoop HDFS(Hadoop Distributed File System)」の主な特性は次のうちどれですか? データを高速で検索できるインデックス機能を持つ データをリアルタイムで処理する 大規模なデータセットを分散して保存し、冗長性を確保する トランザクションを強力にサポートする None 96. データ蓄積において、データウェアハウスの主な利用目的は何ですか? データを短期間だけ保存すること データをリアルタイムで処理すること データを圧縮して保存すること 大量のデータを分析するためにデータを集約すること None 97. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 98. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 99. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 100. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None Time's up