DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. 生成AIにおける「フューズド(Fused)レイヤー」とは何ですか? 異なるタイプのレイヤーを融合させ、計算効率を向上させる技術 モデルの重みを圧縮する技術 テキスト生成に特化した層の一種 ノイズを削除するための層 None 2. コンテナオーケストレーションツールとして正しいものはどれですか? Kubernetes Apache Spark SQL Server JSON None 3. AIシステムをセキュリティ攻撃から保護するために重要な対策の1つとして適切なものは次のうちどれですか? AIの出力結果を無制限に公開する AIの判断プロセスを全て削除する AIシステムにセキュリティ対策を施さない AIモデルのトレーニングデータを暗号化する None 4. AIシステム運用における「キャパシティプランニング」の目的は次のうちどれですか? データを効率的に圧縮することでストレージ容量を増やすこと モデルのハイパーパラメータを自動で最適化すること システムのリソースを効率的に管理し、今後の需要に対応できるよう準備すること トレーニングデータを増やしてモデルの精度を向上させること None 5. データサイエンスにおける「特徴量選択」の目的として最も適切なものは次のうちどれですか? 不必要な特徴量を削除し、モデルの精度と計算効率を向上させる データセットを大きくする モデルのパラメータを自動設定する モデルの複雑さを高める None 6. データ共有において、データの「キャッシュ」を利用する主な目的は次のうちどれですか? データの圧縮を行い、保存スペースを節約するため データのアクセス権を管理するため データの暗号化強度を高めるため 頻繁にアクセスされるデータの応答時間を短縮するため None 7. データ収集において、「データ品質」を向上させるために重要な要素は次のうちどれですか? データの量と速度 データの完全性、一貫性、精度 データの物理的な保存場所 データのファイル形式 None 8. データサイエンスの最新動向において、「フェデレーテッドラーニング(Federated Learning)」がもたらす利点として正しいものは次のうちどれですか? 中央集権的に全てのデータを収集する 全てのデータを公開する 個々の端末でデータを学習し、プライバシーを保護する 分散学習を排除する None 9. 課題定義のプロセスにおいて、最初に行うべきステップは次のうちどれですか? 現状分析 解決策の提案 チーム編成 予算の確保 None 10. データサイエンスにおける「フィーチャーエンジニアリング」の目的は次のうちどれですか? モデルの精度を向上させるために、重要な特徴量を作成・選択すること データの可視化を行うこと データの取得元を確認すること モデルの精度を低下させること None 11. 標準偏差を求める際に必要な計算は何ですか? 分散を2乗する 平均値を引く 分散の平方根を取る 標本数を掛ける None 12. Pythonでオブジェクト指向プログラミング(OOP)を行う際、クラス内で初期化メソッドを定義するための特別なメソッドは次のうちどれですか? __new__() __init__() __call__() __del__() None 13. 非構造化データを用いる機械学習において、ワードベクトル(word embeddings)を生成する技術として広く使用されている手法はどれですか? Word2Vec K-meansクラスタリング 主成分分析 決定木 None 14. AIの事業実装において、プロジェクトのROI(投資利益率)を評価するために最も適切な方法は次のうちどれですか? 投資額とAI導入による効果を定量的に比較する プロジェクトの進捗を評価する AIの精度のみを評価する モデルの複雑さを評価する None 15. モデルのパフォーマンスを評価するためにROC曲線を使用する主な目的は何ですか? モデルの予測値を確認するため モデルの複雑さを測定するため モデルがどのようにクラスを区別するかを評価するため モデルの正確な予測確率を示すため None 16. データ分析における「相関関係」と「因果関係」の違いとして、正しいものは次のうちどれですか? 相関関係は一方の変数がもう一方に直接影響を与えることを示すが、因果関係はそうではない 因果関係は一方の変数がもう一方に直接影響を与えることを示すが、相関関係は必ずしもそうではない 相関関係は必ず因果関係を意味する 因果関係は常に逆に働く None 17. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 18. ビッグデータの4つの「V」に含まれない要素は次のうちどれですか? Volume(量) Velocity(速度) Variety(多様性) Visualization(可視化) None 19. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 20. データ収集におけるプライバシー保護のために最も重要なことは次のうちどれですか? 個人情報を集める際に、事前に明確な同意を得る データを自由に共有する データを完全に匿名化しない 同意がなくても情報を使用できる None 21. プロジェクトの「ステークホルダー」とは次のうちどれですか? プロジェクトに関与するすべての利害関係者 プロジェクトの予算を提供する企業のみ プロジェクトの技術的なサポートを行うチーム プロジェクトの顧客のみ None 22. データ加工において、非線形な特徴量をモデルに取り入れるために一般的に使用される手法は次のうちどれですか? Zスコアを計算する ワンホットエンコーディングを行う 多項式特徴量(Polynomial Features)を作成する 正規化を行う None 23. 外れ値が多いデータセットで線形回帰モデルを構築する場合、外れ値の影響を軽減するための手法として適切なものは次のうちどれですか? 外れ値を削除する ロバスト回帰を使用する 標準回帰をそのまま使用する 外れ値を平均値で置き換える None 24. A B C D None 25. 欠損値が多く存在するデータに対して、モデル化を行う前に推奨される処理方法は次のどれですか? 欠損値の削除 多重代入法 平均補完 ラベルエンコーディング None 26. スマートシティの実現において、AIが果たす役割として最も重要なものは次のうちどれですか? 都市計画を完全に自動化する 全ての市民サービスをAIに置き換える 都市内のすべてのビルを自動的に設計する 交通管理やエネルギー消費の最適化など、都市運営を効率化する None 27. データ共有の場面で、パブリッククラウド環境を使用する際の主なリスクは次のうちどれですか? データの保存容量が制限されること データのセキュリティとプライバシーの確保が難しいこと データのバックアップが不要になること データの形式が変更されること None 28. GPTなどの生成AIモデルにおける「自己教師あり学習(Self-supervised Learning)」の役割は次のうちどれですか? モデルの出力を自己評価するプロセス ラベルなしデータから学習することで、モデルが自己改善するプロセス モデルを一から学習させるプロセス モデルのパフォーマンスを手動で監視するプロセス None 29. 自動運転車で使用されるAI技術に関する主な役割は次のうちどれですか? 車両の設計を行う 車両の安全運転を支援し、障害物を認識する 燃料の消費を管理する 乗客の体調管理を行う None 30. デザイン思考において「反復的なプロトタイピング」が重要とされる理由は次のうちどれですか? 繰り返しのテストを通じて、製品やサービスを改善し続けることができるため 最初のプロトタイプが必ずしも最終製品になるため プロトタイプを一度に多く作ることでコストを削減できるため プロジェクトの納期を短縮するため None 31. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 32. プロジェクトマネジメントにおいて、プロジェクトの進行を監視し、変更が必要かどうかを判断する手法は次のうちどれですか? スコープクリープ リソース最適化 クラウドマイグレーション モニタリングとコントロール None 33. A B C D None 34. 事業へのAI実装において、部門間の連携を効果的に行うために推奨されるアプローチは次のうちどれですか? 各部門の目標を統一し、共通のKPIを設定する 各部門が独自のデータを使用し、成果を比較する 技術部門のみがAIプロジェクトに参加する データサイエンティストのみが意思決定を行う None 35. テキストデータを扱う際、トークン化後の単語数が非常に多い場合に生じる問題は何ですか? 次元の呪い オーバーフィッティング アンダーフィッティング クラスターの数が増加する None 36. データのバイアスを除去するために最も適切な方法は次のうちどれですか? データをランダムに削除する 公平なサンプルを確保し、偏ったデータの修正を行う バイアスを気にせずデータをそのまま使う データを一部のみ使用する None 37. A B C D None 38. 組織内での「フィードバック文化」を醸成するために効果的な施策は次のうちどれですか? 定期的なフィードバックを行い、改善点を指摘する フィードバックを控え、自由に進行させる 問題が発生した時にのみフィードバックを行う チームメンバーからの意見を無視する None 39. 次の議論で用いられている誤謬を特定してください。 「この会社の業績は非常に良い。だから、この会社の経営陣は全員優秀である。」 因果関係の誤謬 演繹法の誤謬 過度の一般化 誤った類推 None 40. データの欠損率が高い場合に推奨される手法はどれですか? 多重代入法 欠損データの削除 平均値による補完 中央値による補完 None 41. GDPRにおける「データ主体の権利」として認められているものは次のうちどれですか? データの無制限な利用を許可する権利 データの公開を強制する権利 データの修正や削除を要求する権利 データの匿名化を禁止する権利 None 42. データ加工において、特徴量の次元削減を行う主な目的は次のうちどれですか? データの精度を向上させる データの欠損値を補完する データを完全に削除する データの次元数を減らし、計算コストを削減する None 43. ビジネスにおける「倫理的行動」とは次のうちどれですか? 企業が利益を最大化するために法を無視すること 顧客や取引先に対して誠実かつ公正な行動を取ること 競合他社のデータを違法に取得すること 社内で不正行為が発生した際に黙認すること None 44. 生成モデルにおける「確率的生成」とは何ですか? モデルが常に同じデータを生成すること モデルが観測されたデータだけを再構築すること モデルがランダムなノイズから新しいデータを生成すること モデルがデータのクラスを予測すること None 45. モデルのパフォーマンスを向上させるための「ハイパーパラメータチューニング」の一般的な方法は次のうちどれですか? データの削除 モデルの複雑化 正則化の排除 グリッドサーチ None 46. モデルのパフォーマンスを向上させるために、次元削減が必要な場合に使用される手法はどれですか? ランダムフォレスト PCA(主成分分析) ロジスティック回帰 k-近傍法 None 47. AIによる「需要予測」の導入が成功している業界として最も適切なものは次のうちどれですか? 教育 農業 製造業 エネルギー None 48. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 49. 線形計画法(LP)において、目的関数とは何ですか? 制約条件を表す数式 最大化または最小化を目指す数式 データの最適な分割を表す手法 コストの削減を示す指標 None 50. Transformerベースの生成AIモデルとして代表的なものは次のうちどれですか? CNN RNN LSTM GPT None 51. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 52. モデルの「正則化(regularization)」とは何を指しますか? モデルの複雑さを増やして、精度を向上させる手法 モデルのパラメータを制約することで、過学習を防ぐ手法 モデルの学習速度を速める手法 データの分布を正規化する手法 None 53. AIやデータサイエンスを事業に実装する際、最初に行うべきステップはどれですか? データサイエンスチームの編成 ビジネス課題の特定 モデルの選定 組織内での教育 None 54. AIモデルを事業に実装する際、モデルの持続的なパフォーマンスを維持するために重要な要素は次のうちどれですか? 継続的なデータの更新とモデルの再訓練 モデルを最初に設定した通りに維持する モデルのアルゴリズムを定期的に変更する モデルを一度設定した後は監視しない None 55. 分析評価における「ベイズ最適化」の利点として最も適切なものは次のうちどれですか? 全てのパラメータの組み合わせを網羅的に探索するため 少ない試行回数で最適なハイパーパラメータを見つけるため モデルの精度を向上させるためのデフォルト手法であるため 決定木に特化しているため None 56. ITセキュリティにおいて、ペネトレーションテスト(Penetration Test)の目的として正しいものは次のうちどれですか? データベースのパフォーマンスを最適化する 通信の暗号化方式を確認する システムの脆弱性を攻撃者の視点から発見する パスワードの強度を検証する None 57. 二分ヒープ(Binary Heap)の特性に関して正しい説明はどれですか? 親ノードの値は常に子ノードの値より大きいか、または小さい 親ノードの値は常に子ノードの値と等しい 親ノードの値は常に子ノードの値よりランダムに決まる ヒープは常に平衡状態を維持する None 58. 正規分布に従うデータを基にしたカイ二乗検定の帰無仮説は何ですか? 2つの変数が独立である データが正規分布に従っていない データが正規分布に従っている データの分散が等しい None 59. 小売業におけるAIの活用例として最も適切なものは次のうちどれですか? AIが在庫管理を効率化し、需要予測を行う AIが商品の配送を行う AIが販売員を完全に置き換える AIが商品のデザインを担当する None 60. 非構造化データとは何を指しますか? テーブル形式で保存されたデータ 事前に定義された形式がなく、自由な形で存在するデータ 時系列データ データベースに保存された数値データ None 61. 非構造化データにおける「アノテーション」とは何を指しますか? データのラベル付けを行う作業 データの可視化を行う作業 データの正規化を行う作業 データの欠損値を補完する作業 None 62. 非構造化データに対して、生成モデルを用いる場合の最大の利点は何ですか? 非構造化データから新しいデータサンプルを自動生成できる 非構造化データを自動的にラベル付けできる 非構造化データを低次元空間にマッピングできる 非構造化データの前処理が不要になる None 63. センサーデータの収集に使用される技術として、最も適切なのはどれですか? TCP/IP SMTP SQLクエリ IoT(Internet of Things) None 64. データベースの「トランザクション分離レベル」において、最も強い整合性を保証するレベルはどれですか? Read Committed Repeatable Read Serializable Read Uncommitted None 65. クラウド環境において、異なるユーザー間でデータを共有する際に考慮すべき主要な課題は次のうちどれですか? データのサイズと圧縮 データのファイル形式 データの権限管理とアクセス制御 データの可視化方法 None 66. モデルが本番環境で意図しないバイアスを持つ可能性を最小限に抑えるためには、次のどの手法が有効ですか? データの前処理のみを行う データのバランスを取る モデルの複雑さを増す モデルのハイパーパラメータを固定する None 67. モデルの性能を比較するために使用される「クロスバリデーション」の利点として最も適切なものは次のうちどれですか? データの一部のみでモデルを評価する トレーニングデータ全体を用いてモデルを評価できる 過学習を促進する テストデータを完全に除外する None 68. 仮説検定で「帰無仮説」とは何を意味しますか? 研究仮説が正しいという主張 データに基づかない推測 差がない、または効果がないという仮説 結果が偶然であることを示す仮説 None 69. 「フェアネスアウェアネス(Fairness Awareness)」を考慮したAIシステムの設計において、重要な点は次のうちどれですか? AIが判断する際に公正性を確保し、特定のグループに不利益が生じないようにする AIの判断をすべて無条件に信頼する AIのすべての決定をブラックボックス化する 公平性を考慮せずにAIを訓練する None 70. 暗号化アルゴリズムのうち、対称鍵暗号の例として正しいものは次のうちどれですか? AES RSA DSA ECC None 71. データベースにおける「インデックス」の主な目的は何ですか? データの保存容量を削減する データの検索を高速化する データのバックアップを取る データを圧縮する None 72. 契約において「成果物の保証」が規定される理由は次のうちどれですか? 成果物が契約で期待される品質基準を満たすことを保証するため 成果物の納品を遅らせるため 契約相手の責任を回避するため 追加費用を請求するため None 73. AIが金融業界で行う「不正検知システム」の特徴として正しいものは次のうちどれですか? 不正取引を手動で確認する 顧客のデータを削除する 全ての取引を同一基準で扱う 顧客の取引データをリアルタイムで分析し、異常なパターンを検出する None 74. 小売業において、消費者の購買行動を予測するために使用される「購買履歴データ」の活用法として最も効果的なものは次のうちどれですか? 購買履歴データを削除する 購買履歴データをランダムに選別する 購買履歴データを販売しない 消費者の過去の購入履歴に基づいたパーソナライズドな推薦を行う None 75. AIシステム運用における「コンティニュアスデリバリー(CD)」の目的として正しいものは次のうちどれですか? モデルのパフォーマンスを手動でモニタリングする コードやモデルの変更を本番環境に自動的にデプロイするプロセスを確立する トレーニングデータを定期的にバックアップする モデルのハイパーパラメータを自動で調整する None 76. 幅優先探索(BFS)を使用してグラフの最短経路を見つける際、適切なデータ構造は次のうちどれですか? キュー(Queue) スタック(Stack) ヒープ(Heap) 配列(Array) None 77. 「インサイダー取引」に該当する行動は次のうちどれですか? 取引先との秘密保持契約を結ぶこと 株主総会での議論に参加すること 市場の公開情報を基に投資を行うこと 一般に公開されていない企業情報を基に株式を売買すること None 78. 「発散的思考」とは、どのようなプロセスを指しますか? 1つの問題に対して特定の解決策を深掘りするプロセス 問題を解決するためのデータを収集するプロセス さまざまな視点から自由にアイデアを広げるプロセス 解決策を具体的に実行するプロセス None 79. 大規模データセットのサンプリングを行う際に、サンプリングバイアスを防ぐために重要な手法はどれですか? 系統抽出 ランダムフォレストを使用する クロスバリデーション 無作為抽出 None 80. プロジェクトマネジメントの5つのプロセス群に含まれないものは次のうちどれですか? 立ち上げ 計画 実行 評価 None 81. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 82. データの「アノマリ検出」が金融業界で特に重視される理由として最も適切なものは次のうちどれですか? 取引データを無視するため 不正取引や異常なパターンを検出するため 全ての取引を承認するため 取引の詳細を削除するため None 83. ハッシュテーブルで「オープンアドレッシング」を使用する主な目的は次のうちどれですか? データのソートを行うため メモリの使用量を削減するため エラーを防ぐため 衝突を管理するため None 84. クラウド環境でデータの可用性を高めるために使用されるストレージ技術は次のうちどれですか? ローカルストレージ テープバックアップ NFS(ネットワークファイルシステム) オブジェクトストレージ None 85. データベースに対する「SQLインジェクション攻撃」を防ぐための最も効果的な対策は次のうちどれですか? データベースの全データを公開する クエリをランダムに実行する SQL文のエラーメッセージを非表示にする パラメータ化されたクエリを使用する None 86. AIを活用した「顧客リテンション分析」の主な目的は次のうちどれですか? 顧客の離脱を予測し、離脱を防止するための施策を講じる 新規顧客を獲得する すべての顧客に同じ対応をする 顧客データを削除する None 87. AIによる「自動翻訳技術」がビジネスコミュニケーションに与える影響として最も適切なものは次のうちどれですか? 異なる言語を話す相手とのコミュニケーションがスムーズに行えるようになる 翻訳精度が低くなるため、コミュニケーションが困難になる 通訳者が必要になる 自動翻訳技術は商用利用が難しい None 88. Pythonでのデータ処理環境を整えるために、一般的に使用されるパッケージマネージャーはどれですか? npm pip Docker Kubernetes None 89. 「著作権」の対象として、データサイエンスプロジェクトに関連するものは次のうちどれですか? アルゴリズムのアイデア コードやドキュメントの記述内容 データそのもの データの集計結果 None 90. AIが金融業界で特に活用されている分野は次のうちどれですか? 融資判断とリスク管理 金庫管理 物理的な現金の流通 店舗デザイン None 91. Pythonでジェネレータを使用する利点は次のうちどれですか? 関数の実行速度を大幅に向上させることができる ジェネレータは自動的にデータを並列処理する 関数の返り値をキャッシュする 大量のデータをメモリ効率良く扱うことができる None 92. AIが「マーケティング分野」において特に効果的に活用されている例として正しいものは次のうちどれですか? 顧客データを削除する 顧客の購買行動データを分析し、パーソナライズされた広告を提供する 顧客に対して無作為に広告を配信する 顧客行動を分析しない None 93. 組織における「ダイバーシティ推進」の目的は次のうちどれですか? チームの意思決定をリーダーに集中させるため 組織の規模を縮小するため 組織の目標を定めないため 組織内に多様な背景やスキルを持つ人材を集め、組織の競争力を高めるため None 94. 課題定義における「問題の本質を掘り下げる」手法の一つとして、どのアプローチが最も有効ですか? チームメンバー全員でブレインストーミングを行う ロジックツリーを使って問題を分解し、根本原因を探る 既存のデータを基に定量的な分析を行う 他社の事例を参考にし、同じアプローチを試す None 95. データ共有の際に、「データの非対称暗号化」が採用される理由は次のうちどれですか? 全てのユーザーが同じ鍵を使用して、データを暗号化できるため データの送信者と受信者が異なる鍵を使用して、データの安全性を高めるため データのサイズを圧縮するため データのリアルタイム性を保証するため None 96. AIが「ヘルスケア分野のパーソナライズド医療」に貢献する方法として、最も適切なものは次のうちどれですか? AIが患者の遺伝情報を基に、最適な治療法を提案する AIがすべての患者に同じ治療法を提供する 患者の遺伝情報を無視する AIが患者のデータを削除する None 97. Diffusionモデルにおいて、生成過程で使用される「逆拡散(reverse diffusion)」とはどのようなものですか? データを圧縮してから再構築するプロセス 生成されたデータの順序を逆に並べ替えるプロセス データの生成過程を最適化するプロセス ノイズを徐々に除去し、データを生成するプロセス None 98. AIを使った「自動運転車」の主要な技術として最も関連が深いものは次のうちどれですか? AIによるカメラやセンサーのデータ解析を通じた周囲の環境認識 AIがエネルギー消費を制御する AIが道路を設計する AIが車両のデザインを自動化する None 99. 時系列データの自己相関関数 (ACF) を使用して確認できるものは何ですか? データ間の線形関係 データ間の時間依存性 データの外れ値 データの平均 None 100. データを「説明する」ときに最も重要なポイントの1つは次のうちどれですか? データを使わず、主観的な意見を述べる データを細かく説明せずに要約を省く データの出典を示さない 結論に基づいた根拠をデータとして示す None Time's up