DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. 事業へのAIの実装において、運用フェーズでの「ドリフト(モデルの劣化)」に対処するために適切な手法は次のうちどれですか? モデルのアルゴリズムを定期的に変更する モデルの初期設定を常に維持する モデルのパフォーマンスを定期的にモニタリングし、必要に応じて再訓練する モデルのトレーニングデータを固定する None 2. AIが「スマートシティ」の構築において果たす役割として最も適切なものは次のうちどれですか? 都市全体の運営をリアルタイムで最適化し、持続可能な社会の実現を支援する 都市の人口を減少させる 都市内のすべての活動を停止する 都市の環境を無視する None 3. 輸送問題において、MODI法(Modified Distribution Method)は何を目的として使用されますか? 初期解を生成する 最適解を改良する コストの上限を決定する 供給量と需要量を均等にする None 4. 大規模データセットにおいて、相関関係が高いとされる2つの変数が実際には因果関係を持たないことを示す概念は何ですか? 分散分析 決定係数 標準偏差 偽相関 None 5. シンプレックス法とは何ですか? 線形計画問題を解くための手法 非線形計画問題を解くための手法 グラフ理論を用いた最適化手法 動的計画法の一種 None 6. 大規模な画像データセットを効率的に処理するために使用されるテクニックはどれですか? 正則化 グリッドサーチ ミニバッチ学習 主成分分析 None 7. AIシステム運用における「コンティニュアスデリバリー(CD)」の目的として正しいものは次のうちどれですか? モデルのパフォーマンスを手動でモニタリングする コードやモデルの変更を本番環境に自動的にデプロイするプロセスを確立する トレーニングデータを定期的にバックアップする モデルのハイパーパラメータを自動で調整する None 8. データ収集におけるプライバシー保護のために最も重要なことは次のうちどれですか? 個人情報を集める際に、事前に明確な同意を得る データを自由に共有する データを完全に匿名化しない 同意がなくても情報を使用できる None 9. プロジェクトの進行中に、ステークホルダーから予期しない要件変更が求められた場合、プロジェクトマネージャーが最初に行うべき対応は次のうちどれですか? 要件変更の影響を評価し、変更がプロジェクト全体に与えるリスクやコストを見積もる すぐに要件を反映させる 要件変更を拒否する 要件変更の責任を他のチームに移す None 10. AIシステム運用において「A/Bテスト」の目的は何ですか? モデルのハイパーパラメータを自動的に調整すること データの前処理方法を評価すること 2つの異なるモデルの性能を比較し、最適なモデルを選定すること モデルの精度を監視するためにデータを分割すること None 11. Pythonで大規模なデータフレームを高速に操作するために、pandasよりも高性能な代替手段として使われるライブラリは次のうちどれですか? Scikit-learn Dask TensorFlow PyTorch None 12. AIが医療分野で使用される主な目的として最も適切なものは次のうちどれですか? すべての医師を置き換えるため 患者の診断をサポートし、早期発見を促進するため 医療機器の管理のみに使用するため 手術のみを担当するため None 13. AIによる「在庫管理システム」を導入することの利点として最も適切なものは次のうちどれですか? 在庫管理の精度が下がる 人手による在庫確認が増える リアルタイムで在庫量を監視し、需要予測に基づいた発注を自動化できる 在庫データが失われるリスクが高まる None 14. 「問題をフレーミングする」とは、どのようなプロセスですか? 問題を特定の視点から定義し、問題の範囲や焦点を明確にすること 問題を抽象的に定義し、解決策を多角的に検討すること 問題を数値化し、具体的な測定指標を設定すること 問題をステークホルダー間で共有し、合意を得ること None 15. 時系列データの分析において、データのトレンドを除去するための手法はどれですか? データの標準化 移動平均法 クラスタリング カイ二乗検定 None 16. ITセキュリティにおいて、「認証」とは何を指しますか? ユーザーやシステムが正当なものであることを確認するプロセス データの改ざんを防止するプロセス サーバーの負荷を軽減するプロセス データの圧縮を行うプロセス None 17. クロスバリデーションの主な目的は何ですか? モデルの性能を評価し、過学習を防ぐこと モデルのパラメータ数を減らすこと モデルの複雑さを増やすこと モデルの学習速度を速めること None 18. 外れ値が多く含まれるデータセットを扱う際、最も適切な手法は次のうちどれですか? 外れ値を全て削除する 外れ値を中央値で補完する 外れ値に対してロバストな手法を使用する 外れ値を全て0にする None 19. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 20. データ共有プラットフォームで「データのインタープリタビリティ(相互運用性)」を確保するために必要なものは次のうちどれですか? 大規模なデータストレージ データの暗号化アルゴリズム データベースのスケーリング機能 標準化されたデータフォーマットとAPI None 21. データの正規化の目的は何ですか? データのばらつきを減らす データを一定の範囲にスケールする データの外れ値を除外する データの欠損値を補完する None 22. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 23. カテゴリカルデータの頻度分布を視覚化する際に最も適したグラフはどれですか? 散布図 ヒストグラム 棒グラフ 箱ひげ図 None 24. GANのトレーニング過程で発生する「勾配消失問題」を軽減するために有効な技術は次のうちどれですか? 学習率の低減 パラメータの初期化 重みの正則化 勾配クリッピング None 25. 「UX(ユーザーエクスペリエンス)」デザインにおける重要な要素として正しいものは次のうちどれですか? 製品の技術的な性能を最大化すること ユーザーの体験全体を設計し、使いやすさや満足度を向上させる デザインのコストを最小化すること 製品の外観や見た目に重点を置くこと None 26. 「中間項不周延の誤謬」が発生するのは次のどのケースですか? 前提と結論が論理的に関係していない場合 二つの異なる前提が正しく結びつけられていない場合 中間項がすべての前提に適切に当てはまらない場合 結論が前提に基づかない場合 None 27. A B C D None 28. 「PDCAサイクル」における最初のステップである「Plan」では何を行いますか? 解決策を実行する 実行した結果を検証する 課題を分析し、解決策を計画する 改善策を実施する None 29. データの「異常値」を説明する際に使用する適切な手法は次のうちどれですか? 平均値を強調する 外れ値を無視する 箱ひげ図を使って外れ値を視覚的に示す 外れ値を削除して説明する None 30. データを扱う際に重要な「分位点」とは何を意味しますか? データを特定の割合で区分した点 データの平均値 データの最大値と最小値の平均 データの標準偏差 None 31. 論理的思考において、「誤った類推」とは何を指しますか? 同じデータを使って二つの異なる結論を導くこと 二つの異なる事象を不適切に比較し、誤った結論を導くこと 類似した事象を基に正しい結論を導くこと データの一部を無視して結論を出すこと None 32. CI/CDパイプラインにおいて、環境の自動テストやデプロイを行うために使われる一般的なツールはどれですか? Hadoop Jenkins pandas Kubernetes None 33. 科学的解析における外れ値の影響を最小化するために有効な手法はどれですか? 平均値を使用する メディアンを使用する 回帰分析を行う 分散分析を行う None 34. データ蓄積における「Cold Storage」とはどのようなデータを保存するためのものですか? 頻繁にアクセスされないが、長期的に保存する必要があるデータ 高速でアクセスされるリアルタイムデータ セキュリティが強化されたデータ データベース内のインデックス情報 None 35. 最新のAI技術「フェアネスアウェアネス(Fairness Awareness)」の目的は次のうちどれですか? AIが判断する際に、公平性を確保し、特定のグループに不利益が生じないようにする AIの結果をランダムに決定する AIの判断を全て手動で行う 公平性を考慮せずにAIを訓練する None 36. データの相関係数が+1である場合、2つの変数間の関係をどのように解釈しますか? 2つの変数間には強い負の相関がある 2つの変数間には無相関である 2つの変数間には相関はない 2つの変数間には強い正の相関がある None 37. モデルの「過学習」とは何を指しますか? モデルが訓練データに対して高い精度を示すが、新しいデータに対しては精度が低下する現象 モデルが複雑すぎて、全てのデータに対して正確な予測ができる状態 モデルが簡単すぎて、訓練データにも対応できない状態 モデルがデータのすべてのパターンを学習する状態 None 38. データの前処理における「欠損データの処理」方法として適切なものは次のうちどれですか? 欠損データを全て削除する 欠損データを適切な値で補完する 欠損データは無視して分析を続行する 欠損データを平均値で埋める None 39. キュー(Queue)のデータ構造において、最初に追加された要素が最初に削除される方式は何と呼ばれますか? LIFO FIFO FILO LILO None 40. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 41. モデルの性能を評価するために使用される「混同行列」の要素に含まれないものは次のうちどれですか? True Positive False Negative True Negative Recall None 42. クラウド環境におけるコスト管理を最適化するために使用される技術は次のうちどれですか? クラウドストレージの分散化 コンテナのスケジューリング クラウドモニタリング Auto Scaling None 43. 論理的思考において、三段論法の基本構造は次のうちどれですか? 前提 → 結論 → 反証 大前提 → 小前提 → 結論 結論 → 検証 → 前提 前提 → 検証 → 結論 None 44. データセットの「多重共線性」を検出するために使用される指標として最も適切なものは次のうちどれですか? 決定係数 相関係数 VIF(Variance Inflation Factor) 平均二乗誤差 None 45. 相関係数が -1 に近い場合、2つの変数間にはどのような関係がありますか? 強い正の相関がある 強い負の相関がある 変数間に相関はない 変数間には線形関係がない None 46. ITセキュリティにおける「リスクアセスメント」とは何を指しますか? セキュリティ侵害が発生した後に、データを復元するプロセス ネットワークのトラフィックをモニタリングするプロセス セキュリティリスクを特定し、評価して対策を講じるプロセス ソフトウェアのバグを修正するプロセス None 47. 決定木モデルにおいて、各ノードに分岐する際の基準としてよく使われる指標はどれですか? 標準偏差 相関係数 ジニ係数 決定係数 None 48. ITセキュリティにおける「ディープパケットインスペクション(DPI)」とは、次のうちどれを指しますか? データの暗号化を行う技術 ハッシュ値を計算してデータの整合性を確認する技術 ネットワーク上の通信パケットの内容を解析し、不正なデータを検出する技術 ファイルのバックアップを自動で行う技術 None 49. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 50. 時系列データの分析において、データの「自己相関」を確認する理由として最も適切なものは次のうちどれですか? データ間に因果関係があるかどうかを確認するため データが一定の間隔で繰り返すパターンを持つかどうかを確認するため データがすべて独立しているかを確認するため データの平均値を計算するため None 51. 課題定義において、ステークホルダーからのフィードバックを効果的に活用する方法として適切なものは次のうちどれですか? フィードバックを受けたら、すぐにその意見を基に解決策を実施する すべてのフィードバックをまとめて、解決策の検討に利用する 重要なステークホルダーのフィードバックのみを反映させる フィードバックを検討し、課題の定義が適切かどうか再評価する None 52. データサイエンスプロジェクトにおける「リスクマネジメント」の目的は次のうちどれですか? プロジェクトの予算を削減すること プロジェクト中に発生し得るリスクを特定し、対応策を立てること プロジェクトのスコープを広げること プロジェクトの関係者を減らすこと None 53. 次のデータの分散を求めてください: 5, 10, 15, 20, 25 50 62.5 75 100 None 54. 生成モデルにおける「パラメトリック生成」と「ノンパラメトリック生成」の違いは何ですか? パラメトリック生成はデータの事前分布を仮定し、ノンパラメトリック生成はデータから直接学習する パラメトリック生成は教師あり学習、ノンパラメトリック生成は教師なし学習 パラメトリック生成は画像生成、ノンパラメトリック生成はテキスト生成 パラメトリック生成は単純なモデル、ノンパラメトリック生成は複雑なモデル None 55. データの種類を理解する上で、次のうち「構造化データ」とはどのようなものを指しますか? 一定の形式で組織化されたデータ 画像や動画などの形式を持たないデータ センサーデータなどのリアルタイム情報 データ収集の途中で不完全なデータ None 56. Pythonでforループを用いて、リスト[1, 2, 3]の各要素に1を加えた結果を新しいリストとして出力するコードは次のうちどれですか? [x+1 for x in [1, 2, 3]] list(map(lambda x: x+1, [1, 2, 3])) for x in [1, 2, 3]: x += 1 map(x+1, [1, 2, 3]) None 57. ITセキュリティにおいて、セキュリティパッチ管理の目的として最も適切なものは次のうちどれですか? システムのパフォーマンスを向上させる データの圧縮率を最適化する システムやソフトウェアの脆弱性を修正し、攻撃のリスクを軽減する データのバックアップを自動化する None 58. データのクリーニングにおいて最も一般的に行われる操作は次のうちどれですか? データの増強 ノイズや欠損値の削除 データの学習 モデルの構築 None 59. 二分探索木(Binary Search Tree)において、各ノードの左側のサブツリーに含まれる値はどのように配置されますか? 親ノードよりも大きい 親ノードと等しい 親ノードよりも小さい 親ノードとは関係ない None 60. 大規模なデータセットに対して、データのメモリ使用量を削減し、効率的に処理するための一般的な手法は次のうちどれですか? データをシャッフルする データをソートする データの型を最適化する データを削除する None 61. AIモデルが意図しないバイアスを学習することを防ぐために行うべき最適な対策は次のうちどれですか? バイアスのないデータを使用してモデルを訓練する バイアスを意図的にモデルに組み込む AIモデルのトレーニングを行わない バイアスを無視してモデルを運用する None 62. 環境構築において、クラウドネイティブアプリケーションのスケーリングを自動化する技術はどれですか? Dockerのビルドシステム Jenkinsのジョブスケジューリング KubernetesのHorizontal Pod Autoscaler(HPA) Hadoopのデータ分散システム None 63. CycleGANの主な利点は次のうちどれですか? 非常に短い時間で学習できる クラスの不均衡なデータに対して強い 多次元データの処理に優れている ラベルなしデータでも異なるドメイン間の変換が可能 None 64. 非構造化データの典型的な例として適切なものは次のうちどれですか? Excelスプレッドシートに記録された売上データ 画像ファイルやビデオデータ データベースに格納された顧客情報 アンケートで集められた選択肢データ None 65. モデルのパフォーマンスを向上させるための「ハイパーパラメータチューニング」の一般的な方法は次のうちどれですか? データの削除 モデルの複雑化 正則化の排除 グリッドサーチ None 66. BERTなどのトランスフォーマーモデルが従来のRNN(リカレントニューラルネットワーク)に対して優れている点はどれですか? 訓練時間が短い 小規模なデータセットでも優れた性能を発揮する 高度な前処理が不要である 長い依存関係を捉えやすい None 67. インフラストラクチャをコードとして定義し、環境構築の自動化を行うためのツールは次のうちどれですか? SQL pandas Terraform FTP None 68. AIシステムにおける「モデルの改ざん」を防ぐために最も効果的な手法は次のうちどれですか? モデルをすべて公開する モデルとトレーニングデータの暗号化 モデルを定期的に削除する モデルの内部構造を隠す None 69. 音声データを処理する際、音の周波数成分を時間とともに解析するために使用される手法はどれですか? Fourier変換 自己相関 遅延プロット サポートベクターマシン None 70. 「自然言語処理(NLP)」が活用される場面として、最も適切なものは次のうちどれですか? 画像を自動で生成する 音声データを画像データに変換する 数値データの解析を行う 顧客の問い合わせを自動で分類し、対応策を提案する None 71. 木構造(Tree)において、全ての子ノードが2つ以下のノードを持つ木のことを何と呼びますか? 完全二分木 二分木 完全グラフ 平衡木 None 72. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 73. 次のうち、データをサンプルする際に最も適切な方法はどれですか? 全データを使用する ランダムサンプリングを行う サンプリングを行わない データの一部だけを任意に選ぶ None 74. AIやデータサイエンスを事業に実装する際、最初に行うべきステップはどれですか? データサイエンスチームの編成 ビジネス課題の特定 モデルの選定 組織内での教育 None 75. データの散らばり具合を示す指標である「標準偏差」は、次のうちどのような意味を持ちますか? データの平均値 データの中央値 データが平均からどれだけ離れているかを示す データの最大値と最小値の差 None 76. 幅優先探索(BFS)を使用してグラフの最短経路を見つける際、適切なデータ構造は次のうちどれですか? キュー(Queue) スタック(Stack) ヒープ(Heap) 配列(Array) None 77. AIが「人権」に関連して問題を引き起こす可能性がある分野として、最も適切なものは次のうちどれですか? AIが平等な判断を行う AIが雇用において不公平な判断を下す可能性がある AIが個人の意思決定を補助する AIが社会福祉を支援する None 78. Pythonでマルチスレッドプログラミングを行う際に注意すべき点は次のうちどれですか? スレッド間のデータ共有が自動的に行われる マルチスレッド環境ではエラーハンドリングが不要である グローバルインタプリタロック(GIL)が並列実行を制限するため、I/Oバウンドな処理に適している CPUバウンドな処理ではスレッドが効果的に動作する None 79. 「フェアネスアウェアネス(Fairness Awareness)」を考慮したAIシステムの設計において、重要な点は次のうちどれですか? AIが判断する際に公正性を確保し、特定のグループに不利益が生じないようにする AIの判断をすべて無条件に信頼する AIのすべての決定をブラックボックス化する 公平性を考慮せずにAIを訓練する None 80. データ分析における「エンコーディング」とは、どのようなプロセスを指しますか? カテゴリデータを数値データに変換するプロセス データの欠損を補完するプロセス 時系列データを分析するためのプロセス データのクレンジングを行うプロセス None 81. AI技術が交通業界にもたらす主な変化として、正しいものは次のうちどれですか? 交通事故の増加 自動運転技術の進展による安全性の向上 交通システムの複雑化 交通データの減少 None 82. ITセキュリティの脅威の一つである「フィッシング攻撃」とは何ですか? ネットワークトラフィックを監視してデータを盗む行為 ウイルスを送りつけることでシステムを破壊する行為 サーバーに過負荷をかけてサービスを停止させる行為 ユーザーを欺いて機密情報を提供させるための詐欺行為 None 83. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 84. ラベルエンコーディングを使用する場合、どのような問題が発生する可能性がありますか? カテゴリ間に序列が生じてしまう 外れ値が増加する データの次元が増加する 欠損値が生じる None 85. 大規模なデータセットを処理する際、データの計算負荷を軽減しつつ代表的なサンプルを使用する手法として適切なものは次のうちどれですか? ランダムサンプリング フルデータの使用 データの一部を削除 時系列データの全範囲を使用 None 86. 企業が遵守すべき「CSR(Corporate Social Responsibility)」の主な目的は次のうちどれですか? 企業の株主だけに利益を還元するため 企業が環境保護の義務を軽減するため 企業が競合他社を排除するため 企業が利益だけでなく、社会全体に対して責任を果たすため None 87. 非構造化データの分類において、深層学習の利点として正しいものはどれですか? 手作業での特徴抽出が不要になる モデルが単純で計算リソースを消費しない 全てのデータを同じアルゴリズムで処理できる 特徴量の選択が容易になる None 88. 組織マネジメントにおける「メンタリング」の利点は次のうちどれですか? メンターがすべての業務を代行する 新しいスキルや知識を効果的に習得できるようにする メンティーが独自に業務を進める メンターの仕事量を減らす None 89. 生成モデルにおいて「転移学習」を適用する利点は次のうちどれですか? データの前処理が不要になる 既存のモデルを使って新しいドメインに対する生成能力を迅速に獲得できる ノイズの多いデータセットでも高精度な生成が可能になる データのクレンジングが不要になる None 90. クラウド環境において、異なるユーザー間でデータを共有する際に考慮すべき主要な課題は次のうちどれですか? データのサイズと圧縮 データのファイル形式 データの権限管理とアクセス制御 データの可視化方法 None 91. 精度と再現率を評価する際、精度とはどのような指標を示していますか? 予測が正しい割合 モデルが外れ値を除外する能力 予測モデルの処理速度 モデルが予測しなかったデータの比率 None 92. Pythonでのデータ処理環境を整えるために、一般的に使用されるパッケージマネージャーはどれですか? npm pip Docker Kubernetes None 93. データ蓄積において、データの冗長性を減らし、効率的に保存するために使用される技術は何ですか? 正規化 非正規化 分割統治 シャーディング None 94. AIシステムの運用において「モデルの透明性」を確保するための手法として適切なものは次のうちどれですか? モデルの説明可能性(Explainability)を提供するために、SHAPやLIMEなどの手法を利用する モデルのパラメータを隠し、ブラックボックス化する モデルの精度が低下した場合は、手動で再トレーニングを行う モデルのトレーニングデータを圧縮して保存する None 95. トポロジカルソート(Topological Sort)は、次のうちどのタイプのグラフで使用されますか? 無向グラフ 有向非巡回グラフ(DAG) 完全グラフ 部分グラフ None 96. ビッグデータの4つの「V」に含まれない要素は次のうちどれですか? Volume(量) Velocity(速度) Variety(多様性) Visualization(可視化) None 97. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 98. AIとビッグデータが保険業界で活用されている分野の一つに「保険金詐欺の検出」があります。このプロセスにおけるAIの役割として最も適切なものは次のうちどれですか? すべての取引を無条件で承認する 保険金詐欺を人間が手動で確認する 保険金詐欺を無視する 保険金詐欺のパターンを学習し、疑わしい取引を特定する None 99. データ共有の場面で、パブリッククラウド環境を使用する際の主なリスクは次のうちどれですか? データの保存容量が制限されること データのセキュリティとプライバシーの確保が難しいこと データのバックアップが不要になること データの形式が変更されること None 100. データの分散を最大限に保ちながら次元削減を行う手法は次のうちどれですか? t-SNE 階層的クラスタリング ランダムフォレスト 主成分分析 (PCA) None Time's up