DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. データ理解のために行う「相関分析」の目的は次のうちどれですか? データの分布を確認するため 時系列データの予測を行うため 2つの変数間の関係性を測定するため 欠損値を補完するため None 2. 輸送問題において、「北西角法(Northwest Corner Method)」とは何を意味しますか? コストを最小化する解法 初期解を生成するためのヒューリスティック法 線形計画法の一部 データを可視化する方法 None 3. 「データガバナンス」における主な目的は次のうちどれですか? データの圧縮を最適化し、保存容量を減らすこと データベースのクエリを最適化すること データの品質、整合性、安全性を確保し、適切に管理すること データのリアルタイム共有を実現すること None 4. プロジェクトの「アジャイル型アプローチ」がウォーターフォール型と異なる点として最も正しいものは次のうちどれですか? アジャイルは反復的であり、適応的な計画変更が可能である アジャイルは計画変更を行わない アジャイルは全体のスコープを最初に決める アジャイルは一度に全てのタスクを完了させる None 5. 画像認識において、画像のサイズや位置の違いに対してロバストなモデルを作成するために使用される手法はどれですか? データ拡張 クラスタリング 主成分分析 ロジスティック回帰 None 6. AIが工場の生産ラインで最も一般的に使用される目的は次のうちどれですか? 製造プロセスの自動化と品質管理の最適化 製品のデザイン作成 販売促進活動 顧客サービスの提供 None 7. Pythonにおいて、functools.lru_cacheデコレータを使用する主な目的は次のうちどれですか? 関数のエラーハンドリングを強化する 関数の引数を動的に変更する 関数の実行を遅延させる 関数の結果をキャッシュし、同じ入力に対する計算を高速化する None 8. A B C D None 9. 「ファイル共有サービス」で一般的に使用されるプロトコルは次のうちどれですか? SMTP FTP IMAP HTTP/2 None 10. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 11. 組織における「ダイバーシティ推進」の目的は次のうちどれですか? チームの意思決定をリーダーに集中させるため 組織の規模を縮小するため 組織の目標を定めないため 組織内に多様な背景やスキルを持つ人材を集め、組織の競争力を高めるため None 12. データ加工で、カテゴリ変数を数値データに変換する手法として正しいものはどれですか? 正規化 ワンホットエンコーディング 標準化 フィルタリング None 13. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 14. モデルの「過学習」とは何を指しますか? モデルが訓練データに対して高い精度を示すが、新しいデータに対しては精度が低下する現象 モデルが複雑すぎて、全てのデータに対して正確な予測ができる状態 モデルが簡単すぎて、訓練データにも対応できない状態 モデルがデータのすべてのパターンを学習する状態 None 15. 事業へのAIの実装において、運用フェーズでの「ドリフト(モデルの劣化)」に対処するために適切な手法は次のうちどれですか? モデルのアルゴリズムを定期的に変更する モデルの初期設定を常に維持する モデルのパフォーマンスを定期的にモニタリングし、必要に応じて再訓練する モデルのトレーニングデータを固定する None 16. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 17. データを可視化する際に使用される「散布図」の主な目的は次のうちどれですか? データの分布を確認する データの平均値を表示する 2つの変数間の相関を視覚的に確認する データの外れ値を自動的に削除する None 18. GANの判別ネットワークの役割は何ですか? 生成ネットワークの重みを調整する 生成されたデータが本物か偽物かを判定する 生成ネットワークの損失関数を最適化する モデルの生成精度を評価する None 19. データのバイアスを除去するために最も適切な方法は次のうちどれですか? データをランダムに削除する 公平なサンプルを確保し、偏ったデータの修正を行う バイアスを気にせずデータをそのまま使う データを一部のみ使用する None 20. ITセキュリティの脅威の一つである「フィッシング攻撃」とは何ですか? ネットワークトラフィックを監視してデータを盗む行為 ウイルスを送りつけることでシステムを破壊する行為 サーバーに過負荷をかけてサービスを停止させる行為 ユーザーを欺いて機密情報を提供させるための詐欺行為 None 21. ビジネスにおける「倫理的行動」とは次のうちどれですか? 企業が利益を最大化するために法を無視すること 顧客や取引先に対して誠実かつ公正な行動を取ること 競合他社のデータを違法に取得すること 社内で不正行為が発生した際に黙認すること None 22. AIによる「自動翻訳技術」がビジネスコミュニケーションに与える影響として最も適切なものは次のうちどれですか? 異なる言語を話す相手とのコミュニケーションがスムーズに行えるようになる 翻訳精度が低くなるため、コミュニケーションが困難になる 通訳者が必要になる 自動翻訳技術は商用利用が難しい None 23. 動的計画法を用いた在庫管理モデルでは、需要の不確実性を考慮するために使用される手法はどれですか? ベルマン方程式 ロジスティック回帰 ヒューリスティックアルゴリズム モンテカルロシミュレーション None 24. 交通ネットワークにおける最適化問題を解くために、オペレーションズリサーチで使用される手法は次のうちどれですか? シンプレックス法 フローネットワーク法 ゲーム理論 ナップサック問題 None 25. 多変量正規分布における共分散行列の役割は何ですか? 各変数の分散と相関関係を表す 各変数の平均値を表す 各変数の相関を表す 各変数の標準偏差を表す None 26. データ収集の段階で、欠損データが発生した場合に行うべき処理は次のうちどれですか? データを補完するか、削除する データをそのまま使用する データを新たに収集し直す データのフォーマットを変更する None 27. AIシステム運用において、モデルの「フェアネス(公平性)」を確保するための手法として正しいものは次のうちどれですか? モデルのハイパーパラメータを手動で調整する データの前処理を行わずにそのままモデルに投入する モデルのバイアスを定期的に検査し、必要に応じて再トレーニングを行う モデルの精度だけを評価し、他の要素は考慮しない None 28. インフラストラクチャをコードとして定義し、環境構築の自動化を行うためのツールは次のうちどれですか? SQL pandas Terraform FTP None 29. 契約書における「免責条項」の主な役割は次のうちどれですか? 成果物の品質を保証するため 契約を早期に終了するため コストを削減するため 特定の条件下で責任を免除するため None 30. 複数の変数間の関係を示す散布図を一つの可視化に統合して表示する手法はどれですか? ヒストグラム 散布図行列 折れ線グラフ 円グラフ None 31. 課題定義において「問題の本質を捉える」とは、どのようなことを意味しますか? 表面的な症状ではなく、根本的な原因を明確にすること 問題が存在することを記録すること 問題を全ての関係者に周知すること 問題が発生した時点でのデータを収集すること None 32. モデルの性能向上を目的とした「ブースティング」の手法として正しいものは次のうちどれですか? 個々の弱い学習器を順次組み合わせ、最終的に強い学習器を作る モデルのサイズを減らす 単一の大規模な学習器を使用する データの正規化を行う None 33. データ蓄積における「キャッシング」の主な目的は次のうちどれですか? 頻繁にアクセスされるデータを一時的に高速メモリに保存して、応答時間を短縮する データを圧縮して保存することで、ストレージの使用量を減らす データのバックアップを取るためのメカニズム データを暗号化して保存すること None 34. 小売業において、消費者の購買行動を予測するために使用される「購買履歴データ」の活用法として最も効果的なものは次のうちどれですか? 購買履歴データを削除する 購買履歴データをランダムに選別する 購買履歴データを販売しない 消費者の過去の購入履歴に基づいたパーソナライズドな推薦を行う None 35. 農業分野におけるAIの利活用として最も効果的なものは次のうちどれですか? 農作物の種類をAIが決定する AIを利用して農作物の成長を監視し、収穫時期を最適化する 農業のすべての作業をAIに任せる 気象予測を無視して作業を進める None 36. 生成モデルにおいて、GAN(Generative Adversarial Network)で使用される2つのネットワークは何ですか? 生成器と判別器 リカレントニューラルネットワークと畳み込みニューラルネットワーク 回帰モデルと分類モデル 主成分分析とクラスタリング None 37. デザインプロセスにおける「デザインシンキング」の特徴として正しいものは次のうちどれですか? 製品の技術的性能を最優先するアプローチ コスト削減を最優先するアプローチ ユーザー中心のアプローチを取り、反復的なプロセスで解決策を創出する デザインの見た目や美観を重視するアプローチ None 38. ウェブスクレイピングを行う際、ウェブサイトが提供するデータの取り扱いに関して考慮すべき法的要件は次のうちどれですか? ウェブページのソースコードの変更 APIエンドポイントの自由な利用 データの利用許諾とプライバシーポリシーの遵守 データのファイル形式の変更 None 39. 「エッジAI」の最新技術に関する利点として正しいものは次のうちどれですか? データ処理をクラウドで行い、低遅延で結果を得る データ処理をデバイス自体で行い、リアルタイムで応答が可能 データの保存ができない データ処理に時間がかかる None 40. データ共有において、データの「レプリケーション」を行う目的は次のうちどれですか? データの圧縮率を向上させるため データの暗号化を強化するため データの可用性を高め、システム障害時にもデータアクセスを確保するため データのフォーマットを標準化するため None 41. 相関行列の可視化に使用される一般的な手法はどれですか? 散布図 円グラフ 箱ひげ図 ヒートマップ None 42. データサイエンスプロジェクトにおいて、予測モデルの精度が期待を下回った場合、プロジェクトマネージャーが最初に行うべき対応は次のうちどれですか? モデルの再評価と改善策の検討 データサイエンティストを交代させる プロジェクトを終了する 予算を増やす None 43. 組織における「従業員エンゲージメント」を向上させるための最も効果的な施策は次のうちどれですか? 従業員に一切のフィードバックを与えない 従業員の業務を定期的に変える 従業員の評価を公開する 従業員の意見を尊重し、定期的なフィードバックを行う None 44. 組織マネジメントにおける「透明性の確保」が重要な理由は次のうちどれですか? チームメンバーに情報を隠すため 組織のルールを厳格にするため チームのスピードを低下させるため チームの信頼性を高め、意思決定の過程を明確にするため None 45. 標準偏差を求める際に必要な計算は何ですか? 分散を2乗する 平均値を引く 分散の平方根を取る 標本数を掛ける None 46. 時系列データの予測結果を説明する際に、データのトレンドや季節性を強調するために最も適したグラフは次のうちどれですか? 折れ線グラフ 散布図 棒グラフ 円グラフ None 47. ITセキュリティにおいて、「データ漏洩防止(DLP)」の目的は次のうちどれですか? データの圧縮を最適化するため ウイルスを検出して削除するため ネットワークのトラフィックを監視するため 機密データが不正に外部へ流出するのを防ぐため None 48. 特徴量選択の手法として「逐次後退選択法(Backward Elimination)」を使用する利点は次のうちどれですか? 全ての特徴量を保持しながらモデルの精度を最大化できる 最も重要でない特徴量を順次削除し、最適な特徴量セットを見つけることができる 特徴量の数を増やすことでモデルの過学習を防ぐことができる カテゴリカルデータを自動的に数値に変換できる None 49. AIシステムにおける「コンプライアンス対応」が重要である理由は次のうちどれですか? AIのブラックボックス化を促進するため 法律や規制に違反しない運用を確保するため データの無制限利用を許可するため 全てのデータを自動で削除するため None 50. データサイエンスを事業に実装する際に用いる「PoC(概念実証)」の目的は次のうちどれですか? 事業全体に導入する前に小規模で効果を確認するため データの前処理を行うため モデルを訓練するため データ分析ツールの選定を行うため None 51. AIが「スマートシティ」の構築において果たす役割として最も適切なものは次のうちどれですか? 都市全体の運営をリアルタイムで最適化し、持続可能な社会の実現を支援する 都市の人口を減少させる 都市内のすべての活動を停止する 都市の環境を無視する None 52. データの標準化と正規化の違いとして、正しい説明は次のうちどれですか? 標準化はデータを範囲0から1に変換し、正規化はデータの平均を0にする 標準化は数値データにのみ適用され、正規化はカテゴリデータに適用される 標準化と正規化は同じ操作を指す 標準化はデータを平均0、標準偏差1にスケーリングし、正規化はデータを指定された範囲にスケーリングする None 53. 「ペルソナ」とは、デザインプロセスにおいて何を指しますか? 製品のブランディングに用いるキャラクター 典型的なユーザー像を具体化した架空の人物 チームメンバーの役割を定義する概念 デザインの最終成果物を指す None 54. AIモデルに対する「敵対的攻撃(Adversarial Attack)」に対する防御策として最も効果的な方法は次のうちどれですか? 敵対的なデータをトレーニングに組み込む モデルの内部構造を全て公開する モデルを常に更新しない データを暗号化しない None 55. データベースにおける「レプリケーション」の目的は何ですか? データの保存容量を減らす データの暗号化を行う データのスキーマを自動生成する データの可用性を高め、障害に対する耐性を向上させる None 56. カテゴリカル変数と数値変数の関係を視覚化する際に適したグラフはどれですか? ヒストグラム 散布図 ペアプロット 箱ひげ図 None 57. 最新のAI倫理に関する議論で注目されている課題は次のうちどれですか? AIによるバイアスや公平性の問題 AIがすべての仕事を自動化すること AIの使用を完全に禁止すること AIによるデータ削除 None 58. 次のうち、モデルのハイパーパラメータを調整する手法はどれですか? ロジスティック回帰 決定木 正規化 グリッドサーチ None 59. モデルの性能を評価するために使用される「混同行列」の要素に含まれないものは次のうちどれですか? True Positive False Negative True Negative Recall None 60. 「UX(ユーザーエクスペリエンス)」デザインにおける重要な要素として正しいものは次のうちどれですか? 製品の技術的な性能を最大化すること ユーザーの体験全体を設計し、使いやすさや満足度を向上させる デザインのコストを最小化すること 製品の外観や見た目に重点を置くこと None 61. 分析評価における「F1スコア」とは何を表していますか? モデルの計算速度 データセットのサイズとモデルの適合性 モデルの訓練時間 精度と再現率の調和平均 None 62. 生成モデルのトレーニングにおいて「潜在空間の探索」が重要である理由は何ですか? 潜在空間を探索しないと、モデルが過学習するから 潜在空間を探索すると、モデルの計算速度が向上するから 潜在空間の探索は必ずしも重要ではない 潜在空間を適切に探索することで、新しいデータの生成品質が向上するから None 63. 課題の定義において、「解決策を先に考えてしまう」ことのリスクは次のうちどれですか? 課題の本質を見逃し、誤ったアプローチを取る可能性が高まる 迅速に解決策を見つけることができなくなる チーム内での合意形成が困難になる 問題が複雑化する None 64. サポートベクターマシン (SVM) では、カーネル関数を使用する主な理由は何ですか? 非線形なデータを高次元空間に写像し、線形分離可能にするため 訓練データを効率的に処理するため データのスケーリングを容易にするため 過学習を防ぐため None 65. データの散らばり具合を示す指標である「標準偏差」は、次のうちどのような意味を持ちますか? データの平均値 データの中央値 データが平均からどれだけ離れているかを示す データの最大値と最小値の差 None 66. 小売業におけるAIの活用例として最も適切なものは次のうちどれですか? AIが在庫管理を効率化し、需要予測を行う AIが商品の配送を行う AIが販売員を完全に置き換える AIが商品のデザインを担当する None 67. AI技術の進化により、社会に最も顕著に見られる変化の1つは次のうちどれですか? 人間による意思決定が増加している 自動化による業務効率の向上 人々の労働時間が大幅に増加している データの重要性が低下している None 68. ストリーミングデータを蓄積する際に使用される「Kinesis Data Streams」の主な利点は次のうちどれですか? 大量のデータをリアルタイムで処理しながら蓄積できる データを定期的にバッチ処理する データを圧縮して保存する データを他のシステムと共有しない None 69. 企業の行動規範における「データ保護」の重要性について正しい説明は次のうちどれですか? データ保護は法律上の義務ではないため、任意に行うもの データ保護は企業の利益には直接関係しないため、優先度は低い 個人情報や機密情報を適切に保護することで、法的リスクや信頼の喪失を防ぐため データ保護は、取引先にすべてを委任しても問題ない None 70. AIモデルのバイアスが事業に与える影響として考えられるリスクは次のうちどれですか? モデルの処理速度が低下する モデルの精度が一時的に上昇する バイアスが発生しても、事業には影響を与えない 不公平な判断が下され、顧客や従業員の信頼を失う可能性がある None 71. 生成モデルにおいて、VAE(Variational Autoencoder)と通常のオートエンコーダの違いは何ですか? VAEはデータを圧縮するが、通常のオートエンコーダはデータを分類する VAEは生成タスクに使われ、通常のオートエンコーダは再構築タスクに使われる VAEは確率的アプローチを採用し、通常のオートエンコーダは決定論的アプローチを採用する VAEは次元削減に特化している None 72. 大量のセンサーデータをリアルタイムに収集する際に、データの処理を分散させることでパフォーマンスを向上させるために使用される技術は次のうちどれですか? SQLクエリ pandas VirtualBox Apache Flink None 73. 生成モデルを用いて新しいデータを生成する際、正規分布からサンプルを取得する理由は何ですか? 正規分布は生成されたデータの分布に最も近いから 正規分布はデータの次元を低減できるから 正規分布は他の分布より計算が容易だから 正規分布は潜在変数空間において連続的かつスムーズな変化を表現できるから None 74. クロス集計表を用いる主な目的は次のうちどれですか? 1つの変数の分布を見る 2つ以上のカテゴリ変数の関係性を把握する データの相関関係を確認する データの標準偏差を計算する None 75. ラグランジュの未定乗数法を使用して、制約付き最適化問題を解く際に最も重要なポイントはどれですか? ラグランジュ乗数が負のとき、解が最適となる 目的関数と制約条件を同時に最大化する 制約条件を無視して目的関数を最適化する 制約条件を考慮しながら目的関数を最適化する None 76. CycleGANの主な利点は次のうちどれですか? 非常に短い時間で学習できる クラスの不均衡なデータに対して強い 多次元データの処理に優れている ラベルなしデータでも異なるドメイン間の変換が可能 None 77. AIが気候変動対策で活用される場面として、最も適切なものは次のうちどれですか? 自然災害の予測と早期警報システムの強化 大気汚染の拡大 自然エネルギーの使用を制限する 気候変動に関するデータの非公開 None 78. 相関関係を持つ2つの変数間の因果関係を説明する際に避けるべきことは次のうちどれですか? 相関関係を強調する グラフを使用して視覚的に説明する 相関係数を用いる 因果関係がない場合も因果関係があると主張する None 79. AIモデルを事業に実装する際、モデルの持続的なパフォーマンスを維持するために重要な要素は次のうちどれですか? 継続的なデータの更新とモデルの再訓練 モデルを最初に設定した通りに維持する モデルのアルゴリズムを定期的に変更する モデルを一度設定した後は監視しない None 80. AIシステム運用において「ログ管理」が重要な理由として最も適切なものは次のうちどれですか? システムの動作状況やエラーを追跡し、問題が発生した際に迅速に対応できるため データの保存容量を最適化するため モデルの精度を手動で確認するため モデルのハイパーパラメータを監視するため None 81. 動的配列(Dynamic Array)において、要素を追加する際にリサイズが行われる理由は何ですか? 配列内の要素が全て重複している場合 配列内の要素が全てnullである場合 要素が逆順に追加されている場合 現在の配列のサイズが不足している場合 None 82. 論理的思考における「反証可能性」とは何ですか? 仮説がすでに証明されていること ある仮説が常に正しいことを示すこと 仮説が他の仮説と比較して優れていること ある仮説が誤っているかどうかを実験や観察で検証できること None 83. AIシステム運用において「バッチ処理」とは何ですか? データをリアルタイムで処理する方式 モデルのトレーニングを一度に複数回実行する方式 データの前処理を自動化する方式 一定期間ごとにデータをまとめて処理する方式 None 84. モデルの汎化性能を評価するために行う手法の一つはどれですか? 正則化 モデルの再トレーニング クロスバリデーション モデルの複雑化 None 85. ビッグデータの分析において「分散処理」が必要とされる理由は次のうちどれですか? データの重複を防ぐため 大規模データを効率的に処理するために、データを複数のマシンに分散して処理する必要があるため データをより高速に削除するため 分析結果を分割して表示するため None 86. Pythonにおける「ラムダ式」とは何ですか? 無名関数を作成するための簡潔な構文 関数の中で別の関数を呼び出すための手法 引数のない関数を定義するための手法 関数の結果をキャッシュするための手法 None 87. 課題定義のプロセスで発生する「認知バイアス」を排除するための方法として最も適切なものは次のうちどれですか? すべてのチームメンバーの意見を無条件で採用する データに基づいて客観的に課題を評価し、多様な視点を取り入れる 既存の成功事例を参考にして、同様のアプローチを取る チームリーダーの指示に従い、意思決定を迅速に進める None 88. データ保護の観点から、「多要素認証(MFA)」が効果的である理由は次のうちどれですか? 複数の認証要素を組み合わせることで、不正アクセスのリスクを減少させる データを全て削除することができるため 認証手続きが1回で完了するため データのバックアップを取らなくてもよい None 89. A B C D None 90. クラウド環境でのデータ保護において、最も重要なポイントの1つは次のうちどれですか? データをクラウド上で全て公開する データのバックアップを行わない データの監査ログを無効にする データを暗号化して保管し、アクセス制限を設ける None 91. 科学的解析における外れ値の影響を最小化するために有効な手法はどれですか? 平均値を使用する メディアンを使用する 回帰分析を行う 分散分析を行う None 92. データ共有において、データの「キャッシュ」を利用する主な目的は次のうちどれですか? データの圧縮を行い、保存スペースを節約するため データのアクセス権を管理するため データの暗号化強度を高めるため 頻繁にアクセスされるデータの応答時間を短縮するため None 93. クラウド環境でデータの可用性を高めるために使用されるストレージ技術は次のうちどれですか? ローカルストレージ テープバックアップ NFS(ネットワークファイルシステム) オブジェクトストレージ None 94. データの次元が多すぎるときに、次元削減を行うために適切な手法はどれですか? 主成分分析 (PCA) k-平均法 決定木 サポートベクターマシン (SVM) None 95. Pythonにおいて、ソートアルゴリズムの一つである「クイックソート」の平均時間計算量は次のうちどれですか? O(n^2) O(n log n) O(n) O(log n) None 96. 「特許権」が保護する対象として、次のうち正しいものはどれですか? 芸術的表現 既存のデータ分析手法 新しいアイデアや発明 公共の情報 None 97. AIモデルを第三者に提供する際、ライセンス契約において重要となる項目は次のうちどれですか? モデルのアルゴリズムを公開する モデルの精度を保証する モデルの再販を推奨する モデルの使用範囲と利用目的を明確に規定する None 98. 分析評価において、適合率(precision)を向上させるためには、次のどの要素に焦点を当てるべきですか? モデルが誤って予測する「偽陽性」を減らす モデルの計算速度を向上させる データセットを小さくする モデルの訓練時間を短縮する None 99. 事業にAIを実装する際の主要な課題として、次のうち最も一般的なものはどれですか? コストの問題 モデルの性能不足 経営層の技術的知識不足 データの質や量の不足 None 100. データ管理における「ログ管理」の目的は次のうちどれですか? データを自動的に削除する データのサイズを減らす データの変更履歴を追跡し、不正アクセスを検知する データを全て公開する None Time's up