DS検定~模擬試験③~ 2024年12月7日 ailearn 1. 最近注目されている生成AI技術に関連し、企業が「テキスト生成AI」を活用する際の主な目的として最も適切なものは次のうちどれですか? データの保存容量を削減する カスタマーサポートやコンテンツ作成を効率化する AIモデルの透明性を向上させる データ分析の速度を向上させる None 2. アプローチ設計において「データ駆動型の意思決定」が最も重要になる状況として適切なものは次のうちどれですか? データが少なく、意思決定に経験が優先される場合 データの品質が低い場合 データが豊富で、意思決定が複数の利害関係者に影響を与える場合 短期間で感覚的な意思決定が必要な場合 None 3. 地理情報データを可視化する際、特定の値の濃淡を色で表現する手法は次のうちどれですか? カートグラム ヒートマップ 散布図 チョロプレス図(Choropleth Map) None 4. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 5. 最新のAI技術である「ニューラルネットワーク圧縮」の利点として最も適切なものは次のうちどれですか? モデルの精度を向上させるが、メモリ使用量が増加する データの圧縮を無視する モデルのサイズを小さくし、メモリ使用量と推論速度を最適化する モデルの学習速度が低下する None 6. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 7. 「AI倫理」の最新動向において、AIシステムに対する説明責任の確保が求められている理由として正しいものは次のうちどれですか? AIを無条件に信頼するため AIのすべての決定をブラックボックス化するため AIの導入を防ぐため AIの決定が公平であることを証明するため None 8. アプローチ設計において「リソースアロケーション」とは何を指しますか? チームのメンバーに役割を割り当てること プロジェクトにおける成果を評価すること プロジェクトの進行に必要な資源(人員、予算、時間など)を適切に配分すること 解決策のリスクを最小化するためのプロセスを設定すること None 9. アプローチ設計において「パイロットプロジェクト」を実施する主な目的は何ですか? 完全な実装前にすべてのデータを収集するため プロジェクトの全体像を短期間で完成させるため プロジェクトのコストを最小限に抑えるため 小規模で解決策をテストし、その有効性を確認するため None 10. データベースにおける「インデックス」の主な目的は何ですか? データの保存容量を削減する データの検索を高速化する データのバックアップを取る データを圧縮する None 11. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 12. データの分布が正規分布に従っているかどうかを検証する手法は次のうちどれですか? t検定 カイ二乗検定 シャピロ・ウィルク検定 分散分析 None 13. 分散ファイルシステムにおいて、「HDFS」がデータの冗長性を確保するために使用する技術は次のうちどれですか? データの暗号化 レプリケーション シャーディング キャッシング None 14. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None 15. 「強化学習」が活用される最新の分野として最も適切なものは次のうちどれですか? 自動化されたゲームのプレイ 音声データのリアルタイム解析 データの前処理 テキスト生成 None 16. データベースのシャーディング(Sharding)において、データの一貫性を保つための主な課題は次のうちどれですか? データの物理的な保存場所を変更すること シャード間でデータの同期を保つこと データを圧縮して保存すること データベースのバックアップを行うこと None 17. アプローチ設計において、「PoC(概念実証)」を実施する主な目的は次のうちどれですか? プロジェクト全体の成功を保証するため 提案された解決策が技術的および実用的に可能であることを確認するため プロジェクトスコープを明確にするため ステークホルダーの意見を完全に反映するため None 18. データの可視化において、次のグラフの種類の中で、変数同士の相関の強さや相対関係を色の濃淡で示す手法はどれですか? 散布図 ヒートマップ 箱ひげ図 円グラフ None 19. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 20. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 21. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 22. 農業分野におけるAIの利活用として最も効果的なものは次のうちどれですか? 農作物の種類をAIが決定する AIを利用して農作物の成長を監視し、収穫時期を最適化する 農業のすべての作業をAIに任せる 気象予測を無視して作業を進める None 23. 大規模データセットのサンプリングを行う際の注意点として最も重要なものは次のうちどれですか? サンプルが全体のデータを代表するものであること サンプルがランダムに選ばれていること サンプルが欠損データを含まないこと サンプルが少ない方が効率的な分析ができること None 24. カテゴリカルデータをエンコードする際、One-hotエンコーディングを使用する理由は何ですか? カテゴリ間に序列がある場合のエンコードが容易であるため カテゴリカルデータが数値データとして扱われるようになるため カテゴリカルデータ間に意味のない序列が生じるのを防ぐため カテゴリカルデータの次元が増加しないため None 25. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 26. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 27. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 28. 時系列データの自己相関を考慮したモデルを構築する際に使用される適切な手法は次のうちどれですか? ARIMAモデル ロジスティック回帰 k-近傍法 主成分分析 (PCA) None 29. データ理解において、「特徴量エンジニアリング」が重要とされる理由は次のうちどれですか? モデルの性能を向上させるためにデータの特徴を最適化するため データの前処理を自動化するため データの可視化を行うため 外れ値を取り除くため None 30. データ理解のプロセスで、「データのバイアス」を検出する主な目的として最も適切なものは次のうちどれですか? バイアスが分析結果や意思決定に及ぼす影響を評価するため バイアスを削除してモデル精度を上げるため データにバイアスが含まれていないことを証明するため バイアスを活用してモデルの性能を向上させるため None 31. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 32. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 33. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 34. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 35. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 36. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 37. カテゴリカルデータの頻度分布を視覚化するための最も適したグラフは次のうちどれですか? 棒グラフ 散布図 ヒストグラム 折れ線グラフ None 38. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 39. データベースの「トランザクション分離レベル」において、最も強い整合性を保証するレベルはどれですか? Read Committed Repeatable Read Serializable Read Uncommitted None 40. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 41. 散布図において、データポイントが過剰に重なり合う場合、それを解消するための一般的な手法は次のうちどれですか? データの正規化 ヒートマップを使用する 点をランダムにずらす(ジッターリング) データをカテゴリに変換する None 42. 生成AIを活用した「フェイクニュース検出システム」の主な課題として最も適切なものは次のうちどれですか? 検出精度の向上によるコスト増加 システムの運用におけるサイバー攻撃のリスク増加 AIが誤って正確な情報をフェイクニュースと判断する可能性 検出システムが大規模データを処理できない None 43. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 44. データ可視化において、複数のカテゴリ間の割合や構成比を比較するのに最適なグラフは次のうちどれですか? 円グラフ 積み上げ棒グラフ 散布図 ヒストグラム None 45. 以下の特性を持つストレージ技術として適切なものはどれですか? データをブロック単位で保存。 低レイテンシーでアクセス可能。 高速な読み書きが求められるアプリケーションで使用される。 オブジェクトストレージ ブロックストレージ データレイク ファイルストレージ None 46. データサイエンスの最新技術として「自動機械学習(AutoML)」の目的は次のうちどれですか? 機械学習モデルの構築プロセスを自動化し、専門知識がなくても高性能なモデルを作成できるようにする データの収集を自動化する データの前処理を行う モデルの評価を手動で行う None 47. 「Explainable AI(XAI)」の最新動向に関する利点として最も適切なものは次のうちどれですか? AIの決定プロセスを透明化し、結果の説明が可能になる AIの精度を低下させる AIの結果をブラックボックス化する AIの学習速度を遅くする None 48. トレーニングデータとテストデータをランダムに分割する際、データが時間依存性を持つ場合に最も注意すべき点は次のうちどれですか? 分割比率を一定に保つ。 時系列順を考慮して分割する。 カテゴリカルデータをエンコードしてから分割する。 分割後にデータをシャッフルする。 None 49. 大量のデータポイントが重なり合って見にくい場合、散布図でデータの密度を表現するために使用される手法はどれですか? ジッタリング ログ変換 ヒートマップ バイオリンプロット None 50. アプローチ設計において「データ駆動型の意思決定」が重視される理由として最も適切なものは次のうちどれですか? データを基にリスクを最小限に抑えるため 主観的な判断を避け、客観的なデータに基づいて解決策を選択するため データを活用して迅速な意思決定を行うため すべてのステークホルダーの意見を反映させるため None 51. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 52. アプローチ設計において、「リスク管理」の主な目的は何ですか? 予測されるリスクを特定し、事前に対策を講じることで影響を最小限に抑える プロジェクトの完了後にリスクを評価するため リスクが発生した際に即座に解決策を実行するため リスクを完全に排除し、失敗を防ぐため None 53. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 54. 自然言語処理(NLP)の最新技術である「GPT」モデルの主な用途として正しいものは次のうちどれですか? 数値データの分類 テキストの生成や翻訳 画像認識 音声データの解析 None 55. AIを活用した農業の最新技術として、農作物の生育状況をリアルタイムでモニタリングするシステムが注目されています。この技術が最も貢献する分野は次のうちどれですか? 労働力の削減 農地の拡大 水資源の保護 農産物の輸出拡大 None 56. 散布図は主にどのようなデータの可視化に使用されますか? カテゴリカルデータの分布 2つの連続変数間の関係 時系列データの変動 データの中心傾向 None 57. 変数の相関を表すために、次のうち誤りの少ないグラフの種類はどれですか? 散布図 円グラフ 棒グラフ 箱ひげ図 None 58. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 59. AIによる「在庫管理システム」を導入することの利点として最も適切なものは次のうちどれですか? 在庫管理の精度が下がる 人手による在庫確認が増える リアルタイムで在庫量を監視し、需要予測に基づいた発注を自動化できる 在庫データが失われるリスクが高まる None 60. データ蓄積において、「ACID特性」を持つシステムで保証される一貫性とは次のうちどれですか? すべてのトランザクションが同時に実行されること。 トランザクションが中断された場合でも、データの整合性が保たれること。 データが並列処理中もリアルタイムで同期されること。 データが圧縮されて効率的に保存されること。 None 61. データ理解のために行う「相関分析」の目的は次のうちどれですか? データの分布を確認するため 時系列データの予測を行うため 2つの変数間の関係性を測定するため 欠損値を補完するため None 62. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 63. 高次元データを可視化するための次元削減手法として「t-SNE」を使用する場合の注意点は次のうちどれですか? t-SNEは計算速度が非常に速いため、大規模データにも適している。 t-SNEは教師あり学習にのみ使用可能である。 t-SNEはカテゴリカルデータのみに適用可能である。 t-SNEは局所的な構造を重視するため、大域的な構造を把握しづらい。 None 64. テキストデータの「トークン化」が重要視される理由は次のうちどれですか? データの分布を確認するため 非構造化データを完全に削除するため 生データを構造化し、機械学習モデルで扱いやすくするため データを視覚化するため None 65. データベースのシャーディング(Sharding)において、データのパーティショニングを行う主な理由は次のうちどれですか? データ量が増加した際に、システムのスケーラビリティを確保するため データのセキュリティを強化するため データの保存コストを削減するため データを複数のバックアップサーバーに保存するため None 66. 欠損値がMCAR(Missing Completely at Random)ではなくMAR(Missing at Random)の場合に推奨される欠損値処理方法は次のうちどれですか? 欠損値を無視して分析を続ける。 欠損値を平均値で補完する。 欠損値の補完に予測モデルを使用する。 欠損データを全て削除する。 None 67. 分散データベースにおける「CAP定理」の3つの要素に該当しないものは次のうちどれですか? Consistency(整合性) Availability(可用性) Partition Tolerance(分割耐性) Performance(性能) None 68. データセット内の外れ値を可視化するために最も適したグラフはどれですか? 箱ひげ図 ヒストグラム 散布図 円グラフ None 69. AIを活用した「生成AI(Generative AI)」の最新の応用例として最も適切なものは次のうちどれですか? データの削除 音声データのリアルタイム分析 手作業によるデータ入力 画像やテキストの自動生成 None 70. アプローチ設計における最初のステップとして適切なものは次のうちどれですか? 課題の明確化 データ収集の開始 解決策の実施 成果の評価 None 71. 「データの一貫性」を確認する目的として最も適切なものは次のうちどれですか? 異なるデータソースからのデータが同じ形式で扱われることを保証するため データの内容が真実であることを確認するため データの欠損を補完するため データをモデルにそのまま投入するため None 72. カテゴリカルデータを機械学習モデルに使用するための一般的な手法はどれですか? 平均値で補完する 標準化する One-hotエンコーディングを使用する 中央値で補完する None 73. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 74. データ理解の過程で「バイアス」を検出することが重要な理由は次のうちどれですか? 分析結果が偏り、不正確な結論を導くリスクがあるため データが不足している可能性があるため データをランダムに選ぶことで、正確な分析ができるため データの欠損を埋めるため None 75. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 76. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 77. データセット内で「異常値(アウトライヤー)」を適切に処理する理由として最も適切なものは次のうちどれですか? 異常値を削除することで分析が高速化されるため 異常値は常に誤ったデータであるため 異常値がモデルの性能を大幅に低下させる可能性があるため 異常値の処理は分析の最終段階で行うべきであるため None 78. 小売業界でAIを活用した「パーソナライズ広告配信」が注目されています。このシステムが特に効果を発揮する状況として最も適切なものは次のうちどれですか? 顧客の好みに基づいた広告をリアルタイムで配信する場合 顧客の購入履歴が乏しい場合 全顧客に同じ広告を一斉配信する場合 広告費を大幅に削減したい場合 None 79. アプローチ設計において「ウォーターフォールモデル」が適している状況は次のうちどれですか? 要件が明確で、変更が予想されない場合 短期間で頻繁なフィードバックが必要な場合 チームが独立して作業できる場合 顧客要件がプロジェクト期間中に変化する可能性が高い場合 None 80. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 81. データの標準化と正規化の違いとして正しいものはどれですか? 標準化はデータの分布を均一化し、正規化はデータを特定の範囲にスケーリングする 標準化は欠損値を補完し、正規化は外れ値を除外する 標準化はデータを整数に変換し、正規化は分散を一定にする 標準化と正規化は同じ意味で使用される None 82. アプローチ設計における「バックキャスティング」とはどのような方法を指しますか? 現在の状況を分析して未来を予測する方法 未来の目標から逆算して現在取るべき行動を決定する方法 過去のデータを基に分析を行う方法 現在の制約条件を優先して設計を行う方法 None 83. データ蓄積において「データウェアハウス」と「データレイク」の主な違いとして正しいものは次のうちどれですか? データウェアハウスはスキーマを事前に定義する必要があるが、データレイクはスキーマが不要である。 データウェアハウスは非構造化データに特化しているが、データレイクは構造化データに特化している。 データウェアハウスはクラウド環境でしか使用できないが、データレイクはオンプレミス環境でしか使用できない。 データウェアハウスは主にデータ保存に使用されるが、データレイクはデータ分析専用である。 None 84. 非構造化データに対する主な課題として最も適切なものは次のうちどれですか? データが非常に小さく、分析に適さないこと 明確なフォーマットがないため、処理が複雑になること データがテーブル形式で整理されていること 非構造化データはリアルタイム処理が不要であること None 85. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 86. 変数間の相関関係を視覚化するためのペアプロットは、どのようなデータに適していますか? カテゴリカルデータ 時系列データ 数値データ テキストデータ None 87. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 88. データの欠損が「MCAR」(Missing Completely at Random)である場合、どのような仮定が成り立ちますか? 欠損データは他の観測データと無関係に発生している 欠損データは特定の変数の値に依存して発生している 欠損データは外れ値によって発生している 欠損データは観測データ全体の分布に依存している None 89. データの正規化の目的は何ですか? データのばらつきを減らす データを一定の範囲にスケールする データの外れ値を除外する データの欠損値を補完する None 90. 最新のAI動向において、「フェデレーテッドラーニング(Federated Learning)」が注目される理由として最も適切なものは次のうちどれですか? データのプライバシーを保ちながら分散型学習を実現する能力 大規模データセットを中央サーバーで一括処理する能力 学習モデルのサイズを削減し計算コストを下げる能力 データの重複を防ぐ能力 None 91. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 92. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 93. 製造業でAIを活用した「予知保全システム」の主な目的は次のうちどれですか? 機械の修理コストを完全にゼロにする 機械の故障を未然に防ぎ、稼働率を向上させる 工場の電力使用量を削減する 従業員の配置計画を最適化する None 94. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None 95. データのクレンジングを行う際に考慮すべき要素として最も適切なものは次のうちどれですか? データを全て再収集すること データの正規化を優先すること データの一部を削除すること データの一貫性、重複、欠損を修正し、分析に適した状態に整えること None 96. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 97. アプローチ設計における「ベストプラクティス」の活用の主な利点は何ですか? 既存のアプローチをそのまま模倣することができる 迅速に解決策を実施できる 革新的なアイデアを生み出すことができる 過去の成功例を基に、リスクを最小限に抑えた設計ができる None 98. カテゴリカルデータが高次元になる問題(次元の呪い)に対処するために推奨される手法はどれですか? PCAを使用して次元削減を行う One-hotエンコーディングを使用する ラベルエンコーディングを使用する 特徴選択を行う None 99. 高次元データのクラスタリング結果を2次元で可視化するために推奨される手法はどれですか? 箱ひげ図 散布図 t-SNE ヒートマップ None 100. データの前処理における「欠損データの処理」方法として適切なものは次のうちどれですか? 欠損データを全て削除する 欠損データを適切な値で補完する 欠損データは無視して分析を続行する 欠損データを平均値で埋める None Time's up