DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. AIが「医薬品開発」において果たす役割として最も適切なものは次のうちどれですか? すべての医薬品開発を廃止する 医薬品の需要予測を行わない 新薬の開発プロセスを効率化し、治験の成功確率を高める 新薬の開発を無制限に行う None 2. 「リッジ回帰」がL2正則化を使用する主な理由は次のうちどれですか? モデルのパフォーマンスを向上させるため モデルのトレーニング速度を向上させるため モデルの評価基準を単純化するため モデルの過学習を防ぐためにパラメータを制約するため None 3. ビジネスにおける「利益相反」とは何ですか? 企業の利益と個人の利益が対立する状況 顧客と従業員が互いに利益を提供すること 取引先と企業が同じ利益を得る状況 企業の利益が増加しない状況 None 4. データ分析において「因果関係」と「相関関係」の違いとして正しいものは次のうちどれですか? 因果関係は、2つの変数が無関係であることを示す 相関関係は、2つの変数が同時に変動するが、因果関係は1つの変数がもう1つに影響を与えることを意味する 相関関係は、常に因果関係を意味する 因果関係と相関関係は同義である None 5. モデルの性能を評価するために使用される「混同行列」の要素に含まれないものは次のうちどれですか? True Positive False Negative True Negative Recall None 6. データ収集において、定期的にデータを収集するために使用されるツールはどれですか? SQLクエリ cronジョブ JSONパーサー 正規表現 None 7. モデル評価において「損失関数」の役割は次のうちどれですか? モデルが予測した値と実際の値の誤差を数値化するため モデルの正答率を評価するため モデルの実行速度を計測するため モデルのパラメータを最適化するため None 8. 外れ値が多いデータセットで線形回帰モデルを構築する場合、外れ値の影響を軽減するための手法として適切なものは次のうちどれですか? 外れ値を削除する ロバスト回帰を使用する 標準回帰をそのまま使用する 外れ値を平均値で置き換える None 9. 科学的解析において「効果サイズ」とは何を指しますか? 仮説検定の結果がどれほど重要かを示す指標 分散の大きさを示す指標 標準誤差の大きさを示す指標 サンプルサイズの大きさを示す指標 None 10. 「相関関係が因果関係を示すとは限らない」という論理的思考における原則を指す言葉は何ですか? 後件肯定の誤謬 逆証明 相関誤謬 結論飛躍 None 11. 「特許権」が保護する対象として、次のうち正しいものはどれですか? 芸術的表現 既存のデータ分析手法 新しいアイデアや発明 公共の情報 None 12. 「ハイパーパラメータのチューニング」において「ランダムサーチ」の利点は次のうちどれですか? すべてのハイパーパラメータの組み合わせを試すことができる グリッドサーチに比べて計算コストを抑えながら、広範な探索ができる 決定木モデルに特化したチューニング方法である データセット全体を使って評価できる None 13. データの異常値を処理する一般的な方法として適切なものは次のうちどれですか? 異常値を削除する 異常値を平均値で置き換える 異常値の影響を無視して分析を進める 異常値を説明変数として取り入れる None 14. ITセキュリティにおいて、ファイルの整合性を監視する「FIM(File Integrity Monitoring)」の主な目的は次のうちどれですか? ファイルの変更が正当なものであるかどうかを確認する ファイルの暗号化強度を監視する ファイルの圧縮率を最適化する ファイルの転送速度を向上させる None 15. 課題定義において、ステークホルダーからのフィードバックを効果的に活用する方法として適切なものは次のうちどれですか? フィードバックを受けたら、すぐにその意見を基に解決策を実施する すべてのフィードバックをまとめて、解決策の検討に利用する 重要なステークホルダーのフィードバックのみを反映させる フィードバックを検討し、課題の定義が適切かどうか再評価する None 16. 線形計画法における「影響係数(シンプルックス乗数)」とは何ですか? 目的関数の傾き 制約条件を変更した際の目的関数の変化率 決定変数の値 可行領域の境界 None 17. 微分積分の基本定理に基づいて、積分とは何を計算する手法ですか? 関数の増加量 関数の面積 関数の傾き 関数の最大値 None 18. Pythonでのデータ処理環境を整えるために、一般的に使用されるパッケージマネージャーはどれですか? npm pip Docker Kubernetes None 19. 変数間の因果関係を説明するために用いられる「因果モデル」の一例として最も適切なものは次のうちどれですか? 散布図 中央値 ヒストグラム 因果推論モデル(Causal Inference Model) None 20. 相関関係がある2つの変数間で因果関係を示すためには、次のうちどの手法が適切ですか? 単純な回帰分析 グランジャー因果分析 t検定 カイ二乗検定 None 21. データ収集時に、ETLの「E」のプロセスに関連する主なタスクはどれですか? データの抽出 データの変換 データの検証 データの削除 None 22. AIが「ヘルスケア分野のパーソナライズド医療」に貢献する方法として、最も適切なものは次のうちどれですか? AIが患者の遺伝情報を基に、最適な治療法を提案する AIがすべての患者に同じ治療法を提供する 患者の遺伝情報を無視する AIが患者のデータを削除する None 23. 「UX(ユーザーエクスペリエンス)」デザインにおける重要な要素として正しいものは次のうちどれですか? 製品の技術的な性能を最大化すること ユーザーの体験全体を設計し、使いやすさや満足度を向上させる デザインのコストを最小化すること 製品の外観や見た目に重点を置くこと None 24. データ共有において、ファイルベースの共有よりも「データベースを介した共有」が推奨される理由は次のうちどれですか? データのサイズを圧縮できるため データの更新や検索が効率的に行えるため データの共有が容易に行えるため データの形式が自動的に標準化されるため None 25. GDPR(一般データ保護規則)において、データ漏洩が発生した際に企業が取るべき対応は次のうちどれですか? データ漏洩を隠す データ漏洩を放置する 全てのデータを削除する 速やかに関係当局に報告する None 26. モデルの評価指標として、精度(accuracy)以外にモデルの性能を評価するために適切な指標はどれですか? AUC-ROC 平均二乗誤差(MSE) p値 偏差 None 27. データサイエンスプロジェクトにおける「スプリント」は何を指しますか? プロジェクトのリスク評価手法 特定の期間内に行われる作業サイクル プロジェクト終了後の評価 プロジェクトの予算決定手法 None 28. 相関関係を説明する際に使用される統計指標は次のうちどれですか? 中央値 相関係数 分散 四分位範囲 None 29. 論理的思考のプロセスにおいて、「前提」を正しく設定することが重要な理由として正しいものは次のうちどれですか? 前提が間違っていても、正しい結論を導けるため 前提が間違っていると、どれだけ正しい推論をしても、結論が間違う可能性があるため 前提を設定しない方が柔軟な思考ができるため 前提を正しく設定することは論理的思考には関係がないため None 30. AIモデルが意図しないバイアスを学習することを防ぐために行うべき最適な対策は次のうちどれですか? バイアスのないデータを使用してモデルを訓練する バイアスを意図的にモデルに組み込む AIモデルのトレーニングを行わない バイアスを無視してモデルを運用する None 31. 機械学習のモデル評価において、データのバランスが重要となるケースとして適切なものはどれですか? クラスタリング 回帰分析 分類問題 PCA None 32. Pythonでの「ジェネレータ」として正しいものは次のうちどれですか? すべての値を一度にリストとして返す関数 データベースのレコードを生成する関数 配列の要素を操作する関数 yieldを使って値を一つずつ返す関数 None 33. 着想プロセスにおいて「ブレインストーミング」の主な目的は何ですか? 自由なアイデアを多く集め、後で整理するため 特定の課題に対して迅速に解決策を導くため 既存のアイデアを深く分析するため 問題を明確に定義するため None 34. 「デザイン思考」のプロセスに含まれるステップとして正しいものは次のうちどれですか? 共感 → 定義 → 創造 → プロトタイプ → テスト 創造 → 評価 → テスト → 実装 問題定義 → 解決策探索 → 実行 分析 → 計画 → 評価 → 実行 None 35. AIの活用が進む医療分野での最新技術として最も関連が深いものは次のうちどれですか? 遺伝子編集 画像診断におけるAI支援 生体組織の生成 手術ロボットの完全自動化 None 36. データの歪度が正の値を持つとき、データの分布はどのような形をしていると考えられますか? 左に歪んでいる 右に歪んでいる 正規分布している 対称分布している None 37. 音声データを処理する際、音の周波数成分を時間とともに解析するために使用される手法はどれですか? Fourier変換 自己相関 遅延プロット サポートベクターマシン None 38. ビジネス行動規範において「サプライチェーン全体の倫理的責任」が求められるのはなぜですか? 企業はサプライチェーンに対しては責任を負わないため サプライチェーンの倫理的な問題は顧客に影響しないため 供給者の行動は企業の評判に影響を与えないため 企業が供給者やパートナーの不正行為にも責任を持つ必要があるため None 39. データの異常値(外れ値)を検出するために用いられる「箱ひげ図」の主な利点は次のうちどれですか? 平均値を明確に表示する データの相関を示す 時系列データを示す 外れ値を視覚的に確認できる None 40. ITセキュリティにおいて、「認証」とは何を指しますか? ユーザーやシステムが正当なものであることを確認するプロセス データの改ざんを防止するプロセス サーバーの負荷を軽減するプロセス データの圧縮を行うプロセス None 41. 「SMARTゴール」を使って課題を定義する際、何が重要とされるか? 課題が多様で、包括的で、創造的であること 課題が具体的で、測定可能で、達成可能で、関連性があり、期限が明確であること 課題が挑戦的で、リスクが高く、革新的であること 課題が単純で、分かりやすく、迅速に解決できるものであること None 42. データ共有プラットフォームで「データのインタープリタビリティ(相互運用性)」を確保するために必要なものは次のうちどれですか? 大規模なデータストレージ データの暗号化アルゴリズム データベースのスケーリング機能 標準化されたデータフォーマットとAPI None 43. Diffusionモデルにおいて、生成過程で使用される「逆拡散(reverse diffusion)」とはどのようなものですか? データを圧縮してから再構築するプロセス 生成されたデータの順序を逆に並べ替えるプロセス データの生成過程を最適化するプロセス ノイズを徐々に除去し、データを生成するプロセス None 44. データサイエンスにおける「特徴量選択」の目的として最も適切なものは次のうちどれですか? 不必要な特徴量を削除し、モデルの精度と計算効率を向上させる データセットを大きくする モデルのパラメータを自動設定する モデルの複雑さを高める None 45. A B C D None 46. カテゴリカルデータの頻度分布を視覚化するための最も適したグラフは次のうちどれですか? 棒グラフ 散布図 ヒストグラム 折れ線グラフ None 47. AIシステム運用において、「デプロイメント」の意味として正しいものは次のうちどれですか? データをクレンジングしてからモデルに投入すること 開発した機械学習モデルを本番環境に展開すること モデルの性能を監視すること モデルを再トレーニングすること None 48. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 49. データの利用に関して「データのガバナンス」が重要視される理由として最も適切なものは次のうちどれですか? データの自由な共有を促進するため データの利用ルールを定め、リスクを管理するため データを全て非公開にするため データの無制限な利用を推奨するため None 50. 環境構築において、クラウドネイティブアプリケーションのスケーリングを自動化する技術はどれですか? Dockerのビルドシステム Jenkinsのジョブスケジューリング KubernetesのHorizontal Pod Autoscaler(HPA) Hadoopのデータ分散システム None 51. アプローチ設計において「リソースアロケーション」とは何を指しますか? チームのメンバーに役割を割り当てること プロジェクトにおける成果を評価すること プロジェクトの進行に必要な資源(人員、予算、時間など)を適切に配分すること 解決策のリスクを最小化するためのプロセスを設定すること None 52. アプローチ設計における「アジャイル手法」の特徴として正しいものは次のうちどれですか? 事前に詳細な計画を立て、変更を最小限に抑える プロジェクトの全体像を一度に完了させる 柔軟に対応し、短期間で反復的に成果を出すことができる 固定されたスケジュールで一貫して進行する None 53. 大規模データセットに対する次元削減を行う主な目的は次のうちどれですか? データの一部を削除して、容量を削減するため データの精度を向上させるため データの相関性を高めるため データの特徴をシンプルにし、処理や分析を効率化するため None 54. AIシステムをセキュリティ攻撃から保護するために重要な対策の1つとして適切なものは次のうちどれですか? AIの出力結果を無制限に公開する AIの判断プロセスを全て削除する AIシステムにセキュリティ対策を施さない AIモデルのトレーニングデータを暗号化する None 55. ハッシュテーブルで「オープンアドレッシング」を使用する主な目的は次のうちどれですか? データのソートを行うため メモリの使用量を削減するため エラーを防ぐため 衝突を管理するため None 56. 時系列データの中で、トレンドや季節性、残差を同時に視覚化するために使用される手法はどれですか? 散布図行列 ヒストグラム 箱ひげ図 デコンポジションプロット None 57. 科学的解析において「信号対雑音比(SNR)」を最大化することが重要な理由は何ですか? データの正確さを向上させるため 誤差を最小化するため 雑音を減らして信号の強度を強調するため サンプルサイズを大きくするため None 58. 「商標権」とは何を保護する権利ですか? 特定のデータサイエンス手法 ソフトウェアのアルゴリズム 商品やサービスを識別するための名称やロゴ 公開されたデータベース None 59. デザイン思考において「反復的なプロトタイピング」が重要とされる理由は次のうちどれですか? 繰り返しのテストを通じて、製品やサービスを改善し続けることができるため 最初のプロトタイプが必ずしも最終製品になるため プロトタイプを一度に多く作ることでコストを削減できるため プロジェクトの納期を短縮するため None 60. AIとデータサイエンスの最新技術「GAN(Generative Adversarial Networks)」の主な役割は次のうちどれですか? データの正規化 データの生成 データの欠損補完 モデルの評価 None 61. データ収集プロセスにおける「バックプレッシャー」とは、どのような現象を指しますか? データベースへの接続が失敗すること データが不足していること APIリクエストが拒否されること 収集されたデータの処理が追いつかないこと None 62. AI技術を導入することで、都市計画においてどのような変化がもたらされると考えられますか? 都市計画はAI技術の影響を受けない AI技術によって都市計画が混乱する AIは都市の縮小を助ける 都市の効率的な運営と持続可能な発展が促進される None 63. AI導入において「スケーラビリティ」が重要な理由は次のうちどれですか? 導入コストを低く抑えるため プロジェクトの進捗を管理しやすくするため 成長するビジネスニーズに対応できるようにするため モデルの性能を高めるため None 64. AIが医療分野で使用される主な目的として最も適切なものは次のうちどれですか? すべての医師を置き換えるため 患者の診断をサポートし、早期発見を促進するため 医療機器の管理のみに使用するため 手術のみを担当するため None 65. 分析評価のプロセスで「AUC(ROC曲線下の面積)」を使用する理由は次のうちどれですか? モデルの処理速度を測定するため データセットのサイズを確認するため モデルの再現率を最適化するため モデルが様々な閾値でどの程度正確に分類できるかを測定するため None 66. BERTなどのトランスフォーマーモデルが従来のRNN(リカレントニューラルネットワーク)に対して優れている点はどれですか? 訓練時間が短い 小規模なデータセットでも優れた性能を発揮する 高度な前処理が不要である 長い依存関係を捉えやすい None 67. A B C D None 68. 正規分布に従うデータを基にしたカイ二乗検定の帰無仮説は何ですか? 2つの変数が独立である データが正規分布に従っていない データが正規分布に従っている データの分散が等しい None 69. データやAIの利活用に関する「偏り」を防ぐための主な手法は次のうちどれですか? データのバランスを確保する バイアスを無視する 特定のデータだけを使う データを全て削除する None 70. 課題を定義する際に使用される「SWOT分析」の要素に含まれないものは次のうちどれですか? 弱み(Weaknesses) 機会(Opportunities) リーダーシップ(Leadership) 強み(Strengths) None 71. GDPRに基づく「データポータビリティの権利」とは、個人が自身のデータに対してどのような権利を持っていることを意味しますか? データの削除を求める権利 データの無制限な利用を許可する権利 自身のデータを他のサービスプロバイダーに転送する権利 データを暗号化する権利 None 72. 「ハラスメント防止」に関する行動規範の主な目的は次のうちどれですか? 職場内での不正行為を防止するため 従業員の人権を尊重し、健全な職場環境を維持するため 従業員の労働時間を管理するため 従業員の個人情報を保護するため None 73. 大規模な欠損値を含むデータセットに対して、単純な平均補完では不十分な場合に推奨される手法は何ですか? k-近傍補完 (k-NN Imputation) 平均補完 欠損データの削除 モード補完 None 74. モデルのパフォーマンスを向上させるための「ハイパーパラメータチューニング」の一般的な方法は次のうちどれですか? データの削除 モデルの複雑化 正則化の排除 グリッドサーチ None 75. ハイパーパラメータチューニングにおいて、「グリッドサーチ」が適用される主な目的は何ですか? モデルのトレーニングデータを増やすため モデルの精度を評価するため ハイパーパラメータの最適な組み合わせを探索するため テストデータを生成するため None 76. AIシステム運用において、「ローリングアップデート」の主な利点は次のうちどれですか? 全てのユーザーに一度にモデルを更新することで、最短で最新バージョンを提供できる 新しいデータに対応するために、モデルをリアルタイムで再学習させることができる モデルの予測結果を自動的に評価することができる サービスを停止せずに、段階的にモデルを更新できる None 77. 契約書において、データサイエンスプロジェクトの成果物に対する「知的財産権」は、通常どのように規定されるべきですか? 全ての知的財産権は発注者に帰属する 知的財産権はプロジェクトの契約内容に基づいて明確に規定される 知的財産権は特に明記されない 知的財産権は開発者の所有となる None 78. 線形計画法の基本的な制約条件の一つは何ですか? 目的関数が線形であること 制約式が線形でなければならない 決定変数が連続でなければならない 全ての制約条件は等式でなければならない None 79. 論理的思考における「二重否定の法則」は、次のうちどの論理的関係を表していますか? ある命題が真である場合、その否定は偽である ある命題が真である場合、その否定の否定も偽である ある命題が偽である場合、その否定の否定は真である 否定された命題は常に真である None 80. AIを活用した「物流最適化システム」が導入されている企業の主な利点として正しいものは次のうちどれですか? 配送ルートの最適化によりコストを削減し、配送効率を向上させる 倉庫の管理をAIに任せる AIが荷物を自動的に運ぶ 在庫の削減 None 81. 時系列データのトレンドや季節性を視覚化するために最も適したグラフは次のどれですか? 散布図 棒グラフ 折れ線グラフ 箱ひげ図 None 82. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 83. 非構造化データを効率的に処理するために使用される技術として最も適切なものは次のうちどれですか? 正規化 相関分析 主成分分析(PCA) 自然言語処理(NLP) None 84. 欠損データの削除を行う際に、重要な注意点は次のうちどれですか? 削除されたデータが分析結果に与える影響を考慮する 欠損データの量にかかわらず、全て削除する 欠損値をランダムに削除する 欠損データが少ない場合でも多重代入法を使用する None 85. 次のうち、モデルのハイパーパラメータを調整する手法はどれですか? ロジスティック回帰 決定木 正規化 グリッドサーチ None 86. モデルのパフォーマンスを向上させるために、次元削減が必要な場合に使用される手法はどれですか? ランダムフォレスト PCA(主成分分析) ロジスティック回帰 k-近傍法 None 87. 時系列データに対する「ARIMAモデル」の主な用途は次のうちどれですか? 画像データの分類 テキストデータの処理 時系列データの予測 クラスタリング None 88. ヒストグラムの役割として正しいものは次のうちどれですか? データの平均値を求めるため データの散らばり具合を視覚的に示すため データの因果関係を示すため データの時系列変化を示すため None 89. データを効果的に説明するために最も重要なステップは次のうちどれですか? データを大量に提示する データの背景や目的を明確にし、ストーリーを持たせる グラフを多用する 専門用語を使う None 90. AIシステム運用において「ML Ops」の主な目的は何ですか? 機械学習モデルの開発から運用までを一貫して自動化すること データの圧縮と保存を最適化すること データベースのパフォーマンスを向上させること モデルの精度を一定に保つため、定期的に手動で再学習させること None 91. アプローチ設計において「デザイン思考」が重要とされる理由は次のうちどれですか? データに基づく精密な分析を行うため コスト削減を最優先するため 競合分析を徹底的に行うため ユーザー中心の視点から問題解決策を創造するため None 92. 時系列データの分析において、データのトレンドを除去するための手法はどれですか? データの標準化 移動平均法 クラスタリング カイ二乗検定 None 93. データの不均衡に対処するための「アンダーサンプリング」の主なデメリットは次のうちどれですか? データの一部を削除するため、重要な情報が失われるリスクがある データが増えることで処理時間が長くなる データの不均衡をさらに悪化させる可能性がある モデルの精度が低下する可能性がある None 94. 欠損データが大規模に発生しているデータセットに対して最も適切な処理方法は次のうちどれですか? モデルを用いて欠損値を予測し、補完する 欠損値をすべて削除する 欠損値をそのまま残し、他のデータで分析する 欠損値をランダムな値で埋める None 95. 時系列データの自己相関関数 (ACF) を使用して確認できるものは何ですか? データ間の線形関係 データ間の時間依存性 データの外れ値 データの平均 None 96. AIシステム運用における「ブルーグリーンデプロイメント」とは何ですか? モデルを複数のサーバーに分散してデプロイする手法 2つの異なる環境を用意し、片方をテスト環境として新しいモデルを試した後、問題がなければ全てのトラフィックを新環境に切り替える手法 モデルを逐次的に更新することで、システムのダウンタイムを最小化する手法 モデルを定期的に再トレーニングする手法 None 97. データサイエンスプロジェクトの契約において、「成果物の所有権」が曖昧な場合に起こり得る問題は次のうちどれですか? 成果物が正しく納品されない 成果物が契約外で使用される 成果物の精度が低下する 成果物の利用や商業化に関する権利争いが発生する可能性がある None 98. 生成モデルにおいて「転移学習」を適用する利点は次のうちどれですか? データの前処理が不要になる 既存のモデルを使って新しいドメインに対する生成能力を迅速に獲得できる ノイズの多いデータセットでも高精度な生成が可能になる データのクレンジングが不要になる None 99. アプローチ設計において「バックキャスティング」を使用する目的は何ですか? 未来の目標を達成するために、現在の状況から逆算して具体的なアクションを設定するため 現在の課題を分析し、将来的なシナリオを描くため データを基に未来の予測を行い、計画を立てるため プロジェクトのリソースを最適に配分するため None 100. チームの「自律性」を高めるための有効な方法は次のうちどれですか? 各メンバーに目標を設定させ、自分で進捗を管理させる リーダーが全てのタスクを割り当てる チームのリーダーに全ての責任を持たせる メンバーに対するフィードバックを行わない None Time's up