DS検定~模擬試験~ 2024年11月5日2024年11月6日 ailearn 1. AIを活用したチャットボットが主に導入されている領域は次のうちどれですか? 販売促進 顧客サービス 財務管理 製品設計 None 2. データの相関係数が+1である場合、2つの変数間の関係をどのように解釈しますか? 2つの変数間には強い負の相関がある 2つの変数間には無相関である 2つの変数間には相関はない 2つの変数間には強い正の相関がある None 3. 次のうち、モデルのハイパーパラメータを調整する手法はどれですか? ロジスティック回帰 決定木 正規化 グリッドサーチ None 4. アプローチ設計において「ファシリテーション」の役割は何ですか? データの収集と分析を管理する 解決策を評価し、フィードバックを提供する チームのコミュニケーションを円滑にし、効果的な意思決定をサポートする プロジェクトの予算を管理する None 5. NumPyでの配列(ndarray)の要素ごとに平方根を計算するための関数は次のうちどれですか? np.sqrt() np.log() np.square() np.power() None 6. 「ハイブリッドワーク環境」における組織マネジメントの課題として考えられるものは次のうちどれですか? メンバー間のコミュニケーションが分断される可能性がある すべてのメンバーがオフィスに常駐する オンライン会議が禁止される メンバー全員がリーダーの指示を待つ None 7. AI技術が進化する中で、プライバシー保護に対する最新の対応策として注目されている技術は次のうちどれですか? 中央集権的なデータ管理 データの分散処理やフェデレーテッドラーニングの導入 データの完全な公開 データの一元的な収集 None 8. 生成AIにおける「Attentionメカニズム」の役割は次のうちどれですか? モデルのパラメータを最適化する データをランダムに生成する モデルの損失関数を最小化する データの重要な部分に焦点を当てる None 9. 分析評価における「ヒストリカルバイアス」を排除するために有効な手法は次のうちどれですか? データ収集期間を見直し、最新のデータを優先する モデルのパラメータを変更する バイアスが含まれたデータをそのまま使用する データの分散を高める None 10. AIシステムのモニタリングにおいて「Prometheus」の主な役割は次のうちどれですか? モデルの再トレーニングを自動で実行する モデルのハイパーパラメータを調整する データを可視化してダッシュボードを作成する モデルのパフォーマンスやシステムの状態をリアルタイムで監視する None 11. データ理解において、「データの分布」を確認する理由として最も適切なものは次のうちどれですか? データの傾向や偏りを把握するため データの欠損箇所を確認するため データの統合方法を検討するため データの収集元を特定するため None 12. ビジネス行動規範において、利害関係者(ステークホルダー)に対する責任はどのようなものですか? 株主や取締役に対してのみ利益を追求する 顧客、従業員、取引先、地域社会、環境など、すべてのステークホルダーに対して公平な対応をする 企業の利益が優先される場合には、ステークホルダーの利益を無視してもよい ステークホルダーには法的責任がないため、特別な配慮は必要ない None 13. データ理解において、「特徴量エンジニアリング」が重要とされる理由は次のうちどれですか? モデルの性能を向上させるためにデータの特徴を最適化するため データの前処理を自動化するため データの可視化を行うため 外れ値を取り除くため None 14. AIが「人権」に関連して問題を引き起こす可能性がある分野として、最も適切なものは次のうちどれですか? AIが平等な判断を行う AIが雇用において不公平な判断を下す可能性がある AIが個人の意思決定を補助する AIが社会福祉を支援する None 15. データの説明において、偏りを防ぐために考慮すべき重要な要素は次のうちどれですか? データが全体を代表するかどうかを確認する データを無作為に削除する データの一部のみを使用して説明する 主観的な意見を混ぜる None 16. データの正規化とは何ですか? データの最小値と最大値を0と1の範囲に変換する データを標準偏差でスケーリングする データをランダムに並べ替える データの外れ値を取り除く None 17. 次のデータの分散を求めてください: 5, 10, 15, 20, 25 50 62.5 75 100 None 18. A B C D None 19. 主成分分析 (PCA) において、主成分を選定するために一般的に使用される基準は何ですか? 分散の大きさ p値の大きさ 相関係数の大きさ 標準偏差の大きさ None 20. データのクリーニングにおいて最も一般的に行われる操作は次のうちどれですか? データの増強 ノイズや欠損値の削除 データの学習 モデルの構築 None 21. AIがエネルギー分野で活用される場面として最も適切なものは次のうちどれですか? エネルギーを消費しない技術の開発 エネルギー消費量の削減を制限する エネルギーの流通に無関与である エネルギー供給の予測と最適化 None 22. プロジェクトマネージャーがチームメンバー間のコミュニケーションを促進するために使用すべき最も効果的な方法は次のうちどれですか? メールのみでやり取りを行う 定期的なミーティングを設定し、進捗と課題を共有する 全てのコミュニケーションを管理者経由で行う 個別に連絡を取り、個々の進捗を確認する None 23. データ共有の際に、「データの非対称暗号化」が採用される理由は次のうちどれですか? 全てのユーザーが同じ鍵を使用して、データを暗号化できるため データの送信者と受信者が異なる鍵を使用して、データの安全性を高めるため データのサイズを圧縮するため データのリアルタイム性を保証するため None 24. AIモデルを第三者に提供する際、ライセンス契約において重要となる項目は次のうちどれですか? モデルのアルゴリズムを公開する モデルの精度を保証する モデルの再販を推奨する モデルの使用範囲と利用目的を明確に規定する None 25. 「情報の機密保持」に関する行動規範において、企業が遵守すべき事項は次のうちどれですか? 重要な顧客データや技術情報を第三者に共有する 競合他社の情報を無断で収集する 顧客や従業員の個人情報を適切に管理し、許可なく外部に漏らさない 情報の機密性は守る必要はない None 26. データのバイアスを取り除くための適切な手法は次のうちどれですか? 標準化 無作為抽出 欠損値補完 正規化 None 27. 画像認識において、画像のサイズや位置の違いに対してロバストなモデルを作成するために使用される手法はどれですか? データ拡張 クラスタリング 主成分分析 ロジスティック回帰 None 28. Pythonの辞書型において、新しいキーと値のペアを追加する方法として適切なものは次のうちどれですか? dict.append(key, value) dict[key] = value dict.update(key, value) dict.insert(key, value) None 29. 変数間の因果関係を説明するために用いられる「因果モデル」の一例として最も適切なものは次のうちどれですか? 散布図 中央値 ヒストグラム 因果推論モデル(Causal Inference Model) None 30. データ共有において、ファイルベースの共有よりも「データベースを介した共有」が推奨される理由は次のうちどれですか? データのサイズを圧縮できるため データの更新や検索が効率的に行えるため データの共有が容易に行えるため データの形式が自動的に標準化されるため None 31. AIを活用した「ゼロショット学習」の最新動向について最も適切な説明は次のうちどれですか? 新しいデータセットを用いてモデルを再訓練する手法 複数のデータセットを用いて同時に学習を行う手法 新しいクラスのデータが与えられたとき、訓練されていないデータでも予測できるモデル データの可視化に特化した学習手法 None 32. 次の推論における誤謬は何ですか? 「この新製品は多くの消費者に好評だから、今後も売上が伸び続けるだろう。」 演繹法の誤謬 演繹法の正当性 不確実性の誤謬 誤った一般化 None 33. GANのトレーニングにおいて、生成器と判別器が「収束しない」とはどのような問題を指しますか? 生成器が判別器に対して常に優位な状態になる 生成器と判別器の学習が進まず、最適なバランスが取れない状態になる 判別器が生成器よりも早く収束する 学習データが不十分である None 34. データエンジニアリング環境構築において、一般的に使用される仮想化技術はどれですか? Docker HTTP SMTP TCP/IP None 35. 事業へのAIの実装において、事前に整備すべき要素として最も重要なものは次のうちどれですか? 高性能なハードウェア 十分なデータ データサイエンティストの確保 予算の確保 None 36. 「自動運転車」におけるAIの役割として最も適切なものは次のうちどれですか? AIがリアルタイムで周囲の環境を認識し、安全な運転を支援する AIが車両のエネルギー供給を担当する AIが運転者を無視する 自動運転車ではAIが不要である None 37. AIシステム運用において、モデルの「ドリフト」を検知するために行うことは何ですか? モデルのパラメータを手動で更新する モデルの予測結果と実際の結果の差異をモニタリングする モデルの入力データをフィルタリングする モデルのトレーニングデータを削除する None 38. データ可視化において、変数の密度分布を滑らかに表現するために使用される手法はどれですか? ヒストグラム KDE(カーネル密度推定) 散布図 箱ひげ図 None 39. AI技術の進化により、社会に最も顕著に見られる変化の1つは次のうちどれですか? 人間による意思決定が増加している 自動化による業務効率の向上 人々の労働時間が大幅に増加している データの重要性が低下している None 40. データを扱う際に重要な「分位点」とは何を意味しますか? データを特定の割合で区分した点 データの平均値 データの最大値と最小値の平均 データの標準偏差 None 41. データの標準化と正規化の違いとして、正しい説明は次のうちどれですか? 標準化はデータを範囲0から1に変換し、正規化はデータの平均を0にする 標準化は数値データにのみ適用され、正規化はカテゴリデータに適用される 標準化と正規化は同じ操作を指す 標準化はデータを平均0、標準偏差1にスケーリングし、正規化はデータを指定された範囲にスケーリングする None 42. ITセキュリティの脅威の一つである「フィッシング攻撃」とは何ですか? ネットワークトラフィックを監視してデータを盗む行為 ウイルスを送りつけることでシステムを破壊する行為 サーバーに過負荷をかけてサービスを停止させる行為 ユーザーを欺いて機密情報を提供させるための詐欺行為 None 43. 変数間の相関関係を視覚化するためのペアプロットは、どのようなデータに適していますか? カテゴリカルデータ 時系列データ 数値データ テキストデータ None 44. 「フェアネスアウェアネス(Fairness Awareness)」を考慮したAIシステムの設計において、重要な点は次のうちどれですか? AIが判断する際に公正性を確保し、特定のグループに不利益が生じないようにする AIの判断をすべて無条件に信頼する AIのすべての決定をブラックボックス化する 公平性を考慮せずにAIを訓練する None 45. 「差別を助長するAIシステム」の発生を防ぐために考慮すべきことは次のうちどれですか? バイアスを無視する 特定の属性を強調する AIの判断を全て手動で行う データのバイアスを検出し、修正する None 46. データの欠損が発生した場合の一般的な対処方法として正しいものはどれですか? 欠損値をそのまま使用する 欠損値を平均値で補完する 欠損値を全て0にする 欠損値を削除する None 47. ビッグデータが公共政策の分野で活用される際の主な利点は次のうちどれですか? 政策の決定にデータを使用せず、直感に頼る 市民のニーズをデータに基づいて正確に把握できる 政策の結果を無視する ビッグデータの解析は政策に役立たない None 48. AIシステムのセキュリティを強化する際に考慮すべき「アドバサリアル・ロバストネス(Adversarial Robustness)」とは何を指しますか? モデルのトレーニング時間を短縮する手法 敵対的攻撃に対してモデルが強靭であること モデルのデータをすべて削除する手法 モデルの出力結果を非公開にする手法 None 49. クラウドベースのデータベースサービスである「Amazon RDS」の特徴として正しいものは次のうちどれですか? データベースのパフォーマンスチューニングが不要である データベースの分散構造を持つ SQLクエリは使用できない データベースのスケーリングとバックアップが自動化されている None 50. 動的計画法を用いた在庫管理モデルでは、需要の不確実性を考慮するために使用される手法はどれですか? ベルマン方程式 ロジスティック回帰 ヒューリスティックアルゴリズム モンテカルロシミュレーション None 51. 生成AIにおいて「クリッピング」とは何を指しますか? 生成データを削除する手法 モデルの重みが特定の範囲を超えないように制限する手法 モデルの学習率を制御する手法 データの圧縮を行う手法 None 52. 分析評価において、「リコール(再現率)」が高いことが重要とされる場面は次のうちどれですか? クレジットカードのスコアリング 商品のおすすめエンジン 広告のクリック予測 健康診断でのがん検出 None 53. ハッシュテーブルで「オープンアドレッシング」を使用する主な目的は次のうちどれですか? データのソートを行うため メモリの使用量を削減するため エラーを防ぐため 衝突を管理するため None 54. データの分布を視覚化するために最も適したグラフは次のうちどれですか? ヒストグラム 棒グラフ 散布図 箱ひげ図 None 55. AIの発展により「労働市場」に現れている変化は次のうちどれですか? すべての仕事がAIに置き換わる 労働時間が増える傾向にある 新しい職種が生まれつつある 人間のスキルが無価値になる None 56. アプローチ設計において「スプリント」という概念は、次のどの手法に関連していますか? ウォーターフォール手法 アジャイル手法 リーンスタートアップ デザイン思考 None 57. Pythonにおける「デコレータ(decorator)」の主な役割は次のうちどれですか? 関数やメソッドに追加の機能を動的に付与する クラスを生成するためのテンプレートを提供する 関数の実行結果をキャッシュする 配列の要素をフィルタリングする None 58. モデルのフェアネス(公平性)を担保するために使用される評価手法はどれですか? AUC-ROC バイアス検出ツール クロスバリデーション 精度評価 None 59. データ収集におけるプライバシー保護のために最も重要なことは次のうちどれですか? 個人情報を集める際に、事前に明確な同意を得る データを自由に共有する データを完全に匿名化しない 同意がなくても情報を使用できる None 60. 「HTTPS」が従来の「HTTP」よりも安全とされる理由は次のうちどれですか? 通信が暗号化されているため、中間者攻撃を防ぐことができる データの圧縮が行われ、転送速度が速くなるため データが複数のサーバーに分散されているため データベースへのアクセスが制限されているため None 61. インフラストラクチャをコードとして定義し、環境構築の自動化を行うためのツールは次のうちどれですか? SQL pandas Terraform FTP None 62. GDPRに基づく「データポータビリティの権利」とは、個人が自身のデータに対してどのような権利を持っていることを意味しますか? データの削除を求める権利 データの無制限な利用を許可する権利 自身のデータを他のサービスプロバイダーに転送する権利 データを暗号化する権利 None 63. 分散データベースのレプリケーション方式の一つである「マスタースレーブレプリケーション」の特徴は何ですか? 全てのサーバーが同時に書き込みと読み込みを行う データがリアルタイムで同期される データベースのスケーリングが不可能である マスターサーバーが書き込みを担当し、スレーブサーバーが読み込みを担当する None 64. モデルの利活用において、バイアスとバリアンスのトレードオフはどのように関連していますか? バイアスが高いほど、モデルの複雑さが増す バリアンスが高いほど、モデルは過学習しやすくなる バリアンスが低いほど、モデルは過学習しやすくなる バイアスが高いほど、モデルの精度が上がる None 65. AIを運用する際、結果の透明性を確保するために有効な手法は次のうちどれですか? モデルの決定プロセスを明確に説明する モデルの中身をブラックボックス化する 全てのデータを公開する 人間の介入を完全に排除する None 66. 契約における「損害賠償条項」が重要な理由は次のうちどれですか? 双方の責任を回避するため 契約を終了するため コストを削減するため 契約違反が発生した場合の賠償責任を明確にするため None 67. データサイエンスにおける「特徴量選択」の目的として最も適切なものは次のうちどれですか? 不必要な特徴量を削除し、モデルの精度と計算効率を向上させる データセットを大きくする モデルのパラメータを自動設定する モデルの複雑さを高める None 68. AI導入において「スケーラビリティ」が重要な理由は次のうちどれですか? 導入コストを低く抑えるため プロジェクトの進捗を管理しやすくするため 成長するビジネスニーズに対応できるようにするため モデルの性能を高めるため None 69. データの「アクセス制御」における主な目的は次のうちどれですか? 誰でも自由にデータにアクセスできるようにする データへのアクセスを適切な権限を持つ人に限定する データをすべて削除する データを自動的に公開する None 70. NoSQLデータベースの特徴として正しいものはどれですか? トランザクションのサポートが強力である 関係データベースの一種である スキーマが柔軟である クエリはSQLで書く必要がある None 71. 生成AIモデルにおける「フィードバックループ」とはどのような現象を指しますか? モデルの出力が自動的に評価されるプロセス モデルの生成結果が次の入力データとして再利用され、誤差が蓄積する現象 モデルのパラメータが繰り返し最適化されるプロセス モデルのトレーニングデータが無限に循環される現象 None 72. デザイン思考において「反復的なプロトタイピング」が重要とされる理由は次のうちどれですか? 繰り返しのテストを通じて、製品やサービスを改善し続けることができるため 最初のプロトタイプが必ずしも最終製品になるため プロトタイプを一度に多く作ることでコストを削減できるため プロジェクトの納期を短縮するため None 73. 複数の解決策を比較するために「コストベネフィット分析」を使用する際、考慮すべき要素として適切なものは次のうちどれですか? 各解決策のコストと、それに伴う利益や効果 各解決策にかかる時間とリスク 各解決策に必要なリソースと技術的難易度 各解決策の影響範囲と利益率 None 74. 非構造化データ処理において、画像データの特徴抽出によく使用される手法はどれですか? CNN(畳み込みニューラルネットワーク) K-meansクラスタリング 決定木 線形回帰 None 75. AIによる「在庫管理システム」を導入することの利点として最も適切なものは次のうちどれですか? 在庫管理の精度が下がる 人手による在庫確認が増える リアルタイムで在庫量を監視し、需要予測に基づいた発注を自動化できる 在庫データが失われるリスクが高まる None 76. 小売業界でのAI活用の典型的な用途は次のうちどれですか? 店舗の設計をAIが行う 顧客の購買データを基にしたパーソナライズドレコメンデーションの提供 顧客が購入する商品をランダムに決定する 価格設定を自動化することなく固定する None 77. データを可視化する際に使用される「散布図」の主な目的は次のうちどれですか? データの分布を確認する データの平均値を表示する 2つの変数間の相関を視覚的に確認する データの外れ値を自動的に削除する None 78. 多変量正規分布における共分散行列の役割は何ですか? 各変数の分散と相関関係を表す 各変数の平均値を表す 各変数の相関を表す 各変数の標準偏差を表す None 79. AI技術を導入することで、都市計画においてどのような変化がもたらされると考えられますか? 都市計画はAI技術の影響を受けない AI技術によって都市計画が混乱する AIは都市の縮小を助ける 都市の効率的な運営と持続可能な発展が促進される None 80. AIシステムの運用において「モデルの透明性」を確保するための手法として適切なものは次のうちどれですか? モデルの説明可能性(Explainability)を提供するために、SHAPやLIMEなどの手法を利用する モデルのパラメータを隠し、ブラックボックス化する モデルの精度が低下した場合は、手動で再トレーニングを行う モデルのトレーニングデータを圧縮して保存する None 81. 輸送問題において、「北西角法(Northwest Corner Method)」とは何を意味しますか? コストを最小化する解法 初期解を生成するためのヒューリスティック法 線形計画法の一部 データを可視化する方法 None 82. 契約書における「エスカレーション条項」の主な目的は次のうちどれですか? 契約を早期に終了させるため 成果物の納品を遅らせるため トラブルが発生した際に、責任者を上位に報告し、迅速に解決策を講じるため 費用を増加させるため None 83. データサイエンスプロジェクトにおける「スコープ管理」とは何を指しますか? プロジェクトの目標や成果物を定義し、その範囲を管理するプロセス プロジェクトの予算を管理するプロセス プロジェクトの品質を管理するプロセス プロジェクトのスケジュールを管理するプロセス None 84. AIがエネルギー管理システムで活用される場合の主な利点は次のうちどれですか? エネルギー供給と消費を最適化し、コストを削減する エネルギー供給を停止する エネルギーの消費量を増加させる エネルギーの管理に人手を増やす None 85. 輸送問題において、MODI法(Modified Distribution Method)は何を目的として使用されますか? 初期解を生成する 最適解を改良する コストの上限を決定する 供給量と需要量を均等にする None 86. カテゴリカルデータを分析する際に、データ間の関係を評価するために使用される統計手法は何ですか? t検定 カイ二乗検定 ANOVA ピアソン相関係数 None 87. 生成モデルのトレーニングにおいて、モンテカルロ法が適用されるのはどのような状況ですか? 高次元の潜在空間からのサンプルを効率的に取得する必要がある場合 データが非常に大きい場合 データが欠損している場合 データがクラスに分けられる場合 None 88. 精度と再現率を評価する際、精度とはどのような指標を示していますか? 予測が正しい割合 モデルが外れ値を除外する能力 予測モデルの処理速度 モデルが予測しなかったデータの比率 None 89. データ共有における「REST API」の特徴として正しいものは次のうちどれですか? HTTPプロトコルを使用して、ステートレスな通信を行う リアルタイムのデータ共有をサポートする 大量データのバッチ処理に特化している データを暗号化して転送する None 90. Pythonで、コンテキストマネージャ(Context Manager)を作成するための方法として適切なものは次のうちどれですか? with文を使用する yield文を使用する return文を使用する exec文を使用する None 91. 自動運転車で使用されるAI技術に関する主な役割は次のうちどれですか? 車両の設計を行う 車両の安全運転を支援し、障害物を認識する 燃料の消費を管理する 乗客の体調管理を行う None 92. データ共有における「Data Lake」と「Data Warehouse」の主な違いは次のうちどれですか? Data Lakeはデータをリアルタイムで処理し、Data Warehouseはバッチ処理を行う Data Lakeは非構造化データを扱い、Data Warehouseは構造化データを扱う Data Lakeは小規模なデータを対象とし、Data Warehouseは大規模なデータを対象とする Data Lakeはトランザクションをサポートし、Data Warehouseはサポートしない None 93. 次のうち、データのスケーリングを行う方法として正しいものはどれですか? データの最小値と最大値を使用してスケーリングする データの中央値を使用してスケーリングする データの範囲を倍にする データの外れ値を除去する None 94. データ収集において、収集されたデータの信頼性を確保するために行うべき最初のステップは何ですか? データのバリデーション データのクリーニング データのモデリング データの視覚化 None 95. Pythonでの「ジェネレータ」として正しいものは次のうちどれですか? すべての値を一度にリストとして返す関数 データベースのレコードを生成する関数 配列の要素を操作する関数 yieldを使って値を一つずつ返す関数 None 96. ITセキュリティにおける「リスクアセスメント」とは何を指しますか? セキュリティ侵害が発生した後に、データを復元するプロセス ネットワークのトラフィックをモニタリングするプロセス セキュリティリスクを特定し、評価して対策を講じるプロセス ソフトウェアのバグを修正するプロセス None 97. Pandasライブラリを使用して、dfというデータフレームのage列に50歳以上の行を抽出する方法は次のうちどれですか? df['age'] >= 50 df['age'].apply(lambda x: x >= 50) df[df.age >= 50] df[df['age'] >= 50] None 98. Diffusionモデルにおいて、生成過程で使用される「逆拡散(reverse diffusion)」とはどのようなものですか? データを圧縮してから再構築するプロセス 生成されたデータの順序を逆に並べ替えるプロセス データの生成過程を最適化するプロセス ノイズを徐々に除去し、データを生成するプロセス None 99. 微分積分の基本定理に基づいて、積分とは何を計算する手法ですか? 関数の増加量 関数の面積 関数の傾き 関数の最大値 None 100. データが不均衡である場合にモデル評価の指標として推奨されるのは次のうちどれですか? 精度 AUC-ROC 平均二乗誤差 F1スコア None Time's up