DS検定~模擬試験①~ 2024年12月7日2025年1月12日 ailearn 1. CI/CDパイプラインにおいて、環境の自動テストやデプロイを行うために使われる一般的なツールはどれですか? Hadoop Jenkins pandas Kubernetes None 2. 企業の行動規範において「人権の尊重」が重視される理由として正しいものは次のうちどれですか? すべての従業員や関係者が平等に扱われ、差別や不当な扱いを受けない権利を保護するため 労働時間の管理を厳格に行うため 企業の業績を最大化するため 競合他社との競争を促進するため None 3. 論理的思考のプロセスにおいて、「前提」を正しく設定することが重要な理由として正しいものは次のうちどれですか? 前提が間違っていても、正しい結論を導けるため 前提が間違っていると、どれだけ正しい推論をしても、結論が間違う可能性があるため 前提を設定しない方が柔軟な思考ができるため 前提を正しく設定することは論理的思考には関係がないため None 4. データ収集の段階で、欠損データが発生した場合に行うべき処理は次のうちどれですか? データを補完するか、削除する データをそのまま使用する データを新たに収集し直す データのフォーマットを変更する None 5. 「コーポレートガバナンス」の主な目的は次のうちどれですか? 企業の利益を最大化するための戦略を立てること 取締役会の権限をすべての意思決定に委ねること 企業の健全な経営と透明性を確保するための体制を整えること 株主にすべての経営判断を任せること None 6. 「論理的整合性」とは次のうちどれを指しますか? 一つの命題が常に真であること 論理的な推論が常に正しい結果を導くこと データが正確であること 複数の命題が互いに矛盾しないこと None 7. 次のうち、「演繹法」の特徴として正しいものはどれですか? 一般的な原則から具体的な結論を導く 具体的な事例から一般的な法則を導く 結論を予測する際に感覚を重視する データを分析せずに直感的な判断を行う None 8. 次の推論に含まれる誤謬を指摘してください。 「すべてのリーダーは影響力を持っている。 Bさんはリーダーではない。 したがって、Bさんには影響力がない。」 相関誤謬 後件肯定の誤謬 前件否定の誤謬 結論飛躍 None 9. 医療分野でのAI活用による「パーソナライズド医療」の利点として、最も適切なものは次のうちどれですか? 患者一人ひとりの特性に合わせた治療法が提供される すべての患者に同じ治療法が適用される 患者の個別データが必要ない 患者の治療結果が予測不可能になる None 10. A B C D None 11. 次のうち、特異値分解(SVD)において得られる3つの主要な成分はどれですか? 固有値、固有ベクトル、対角行列 行列のランク、転置行列、逆行列 左特異ベクトル、特異値、右特異ベクトル 行列式、逆行列、スカラー値 None 12. クラウド環境におけるデータパイプラインの管理で、特定のタスクが失敗した際に、再試行を自動化するために使われる技術は何ですか? 自動リトライ機能を持つAirflow Kubernetesによるスケーリング Docker Composeによる再配置 Jenkinsによる継続的デリバリー None 13. 不明 1 10 0 None 14. ビジネス行動規範における「エシカルサプライチェーン」とはどのような概念ですか? 労働者の権利や環境保護に配慮した倫理的なサプライチェーンの構築 コスト削減を最優先とするサプライチェーンの構築 すべての供給者が同じ国に所属するサプライチェーンの構築 短期的な利益を追求するためのサプライチェーンの構築 None 15. 自然言語処理(NLP)が活用される具体例として最も適切なものは次のうちどれですか? データの可視化 数値データの分析 自動翻訳やチャットボットでの顧客サポート データの保存 None 16. データ収集において、リアルタイム処理とバッチ処理の主な違いは何ですか? リアルタイム処理はAPIを使用し、バッチ処理は手動で実行される リアルタイム処理はデータが発生するとすぐに処理し、バッチ処理は一定期間のデータをまとめて処理する リアルタイム処理はデータを変更せず、バッチ処理はデータを削除する リアルタイム処理はクラウド環境でしか動作しない None 17. ラグランジュの未定乗数法を使用して、制約付き最適化問題を解く際に最も重要なポイントはどれですか? ラグランジュ乗数が負のとき、解が最適となる 目的関数と制約条件を同時に最大化する 制約条件を無視して目的関数を最適化する 制約条件を考慮しながら目的関数を最適化する None 18. データエンジニアリング環境構築において、一般的に使用される仮想化技術はどれですか? Docker HTTP SMTP TCP/IP None 19. クラウド環境でデータ処理パイプラインを構築する際、サーバーレスアーキテクチャを選択する利点として最も適切なものはどれですか? コストが固定され、予算管理がしやすい。 全てのデータ処理をローカル環境で実行できる。 コンテナオーケストレーションが容易になる。 リソースのプロビジョニングが不要で、スケーラビリティが向上する。 None 20. データの「前処理」において最も重要なステップの一つである「データクリーニング」とは、何を行うプロセスですか? データの欠損や誤りを検出して修正する データの可視化を行う データの取得元を特定する データの分析を行う None 21. 次のデータの分散を求めてください: 5, 10, 15, 20, 25 50 62.5 75 100 None 22. AI技術を導入することで、都市計画においてどのような変化がもたらされると考えられますか? 都市計画はAI技術の影響を受けない AI技術によって都市計画が混乱する AIは都市の縮小を助ける 都市の効率的な運営と持続可能な発展が促進される None 23. データ収集プロセスで、ストリーミングデータを収集する際に「バックプレッシャー」を管理するために有効な方法は次のうちどれですか? データ処理速度を自動的に調整するフロー制御を導入する。 収集データを一時的にディスクに保存する。 APIリクエストのレートを手動で調整する。 データストリームを中断して負荷を軽減する。 None 24. データの主成分分析 (PCA) で得られる「主成分」とは何ですか? データ内のノイズを削減する データ内で最も多くの分散を説明する新しい軸 データの標準化を行う手法 データ内の外れ値を検出する手法 None 25. クラウド環境におけるコスト管理を最適化するために使用される技術は次のうちどれですか? クラウドストレージの分散化 コンテナのスケジューリング クラウドモニタリング Auto Scaling None 26. 「ハラスメント防止」に関する行動規範の主な目的は次のうちどれですか? 職場内での不正行為を防止するため 従業員の人権を尊重し、健全な職場環境を維持するため 従業員の労働時間を管理するため 従業員の個人情報を保護するため None 27. インフラストラクチャをコードとして定義し、環境構築の自動化を行うためのツールは次のうちどれですか? SQL pandas Terraform FTP None 28. AIが「農業分野」において引き起こしている変化として最も適切なものは次のうちどれですか? 農作物の価格を完全に固定化する ドローンやセンサーを用いた精密農業の普及 全ての農地を無人化する計画の推進 気象データの廃止 None 29. AIやデータ分析技術が小売業において最も活用されている場面は次のうちどれですか? 顧客データを用いた個別化されたマーケティング 店舗の在庫管理の廃止 店員の人数を増やすため 製品の価格を無作為に決定するため None 30. ビジネスにおける「持続可能性」とは次のうちどれですか? 企業が長期的に利益を維持するための方針 企業が環境、社会、経済のバランスを取りながら、長期的に発展するための概念 企業の資産を短期的に増加させるための戦略 企業の利益を従業員に分配する制度 None 31. AIが医療分野に与えている影響として、正しいものは次のうちどれですか? AIが全ての診断を行うようになった 医師の業務を支援するツールとしてAIが活用されている 患者とのコミュニケーションがなくなった 医師が不要になっている None 32. 公共交通機関における「スマートカードデータ」の活用法として最も効果的なものは次のうちどれですか? スマートカードデータを破棄する 乗客のデータを公開する 乗客の利用パターンを分析し、運行スケジュールの最適化を行う 乗客のデータを使用しない None 33. 「相関関係が因果関係を示すとは限らない」という論理的思考における原則を指す言葉は何ですか? 後件肯定の誤謬 逆証明 相関誤謬 結論飛躍 None 34. 「情報の機密保持」に関する行動規範において、企業が遵守すべき事項は次のうちどれですか? 重要な顧客データや技術情報を第三者に共有する 競合他社の情報を無断で収集する 顧客や従業員の個人情報を適切に管理し、許可なく外部に漏らさない 情報の機密性は守る必要はない None 35. データ収集において、「データ品質」を向上させるために重要な要素は次のうちどれですか? データの量と速度 データの完全性、一貫性、精度 データの物理的な保存場所 データのファイル形式 None 36. センサーデータの収集に使用される技術として、最も適切なのはどれですか? TCP/IP SMTP SQLクエリ IoT(Internet of Things) None 37. A B C D None 38. データプライバシーを確保するために必要な技術や対策として、正しいものは次のうちどれですか? データを完全に公開する データの匿名化や暗号化を行う データの取得を一切行わない データの保存期間を無制限にする None 39. A B C D None 40. 「内部告発制度」の有効性を高めるために企業が行うべき対応は次のうちどれですか? 告発者の匿名性を確保する 告発を受けても内容を公開しない 告発を行った従業員に処罰を与える 告発内容を無視する None 41. データ分析における「相関関係」と「因果関係」の違いとして、正しいものは次のうちどれですか? 相関関係は一方の変数がもう一方に直接影響を与えることを示すが、因果関係はそうではない 因果関係は一方の変数がもう一方に直接影響を与えることを示すが、相関関係は必ずしもそうではない 相関関係は必ず因果関係を意味する 因果関係は常に逆に働く None 42. 「ソーシャルメディアデータ」を活用する際に最も重要な注意点は次のうちどれですか? データが常に正確であると仮定する 全てのデータをそのまま活用する データの出所を特定しない データのプライバシーや規制を遵守する None 43. 次のシナリオを基に、どのような行動規範違反が発生しているかを特定してください。 「従業員が顧客データを個人的な目的で利用し、外部に共有した。」 コンプライアンス違反 プライバシー侵害 データ倫理違反 以上すべて None 44. ビジネスにおける「コンプライアンス」とは何を指しますか? 法律や規則を遵守すること 顧客に対する製品保証を行うこと 社内の従業員を監視すること 取引先との契約を強制的に履行させること None 45. データエンジニアリング環境でのジョブスケジューリングを自動化するために使われるツールはどれですか? Docker Kubernetes HTTP Airflow None 46. 環境構築における「インフラストラクチャコード化」の主な利点は次のうちどれですか? 環境の再現性を高め、管理を自動化できる 環境の構築時間を大幅に短縮できる コストを削減し、物理サーバーを減らせる 手作業での構築ミスを防ぎ、パフォーマンスを最適化する None 47. マルコフ連鎖において、「定常状態」とは何を意味しますか? 各状態が常に同じ確率で遷移する すべての状態に同じ確率で遷移する 系が時間経過とともに特定の確率分布に収束する 系が無限の時間を経過しても一定の変化がない状態 None 48. 「利益相反」を防ぐために企業が取るべき最適な対策は次のうちどれですか? 利益相反の可能性を無視する 従業員の副業や外部活動をすべて禁止する 事前に従業員に利益相反を自己申告させる 利益相反が発覚した場合でも特に対応しない None 49. Kubernetesにおける「ポッド」とは何ですか? クラスタ全体の負荷分散を行う機能 コンテナ間の通信を管理するプロトコル コンテナの依存関係を管理するシステム 1つまたは複数のコンテナを含む最小のデプロイメント単位 None 50. クラウド上でのデータ収集において、サーバーレスアーキテクチャの利点は次のうちどれですか? サーバーの運用管理が不要になる データベースのスキーマを定義しやすくなる データ収集の速度が制限される 大量データの保存が困難になる None 51. 企業の行動規範における「データ保護」の重要性について正しい説明は次のうちどれですか? データ保護は法律上の義務ではないため、任意に行うもの データ保護は企業の利益には直接関係しないため、優先度は低い 個人情報や機密情報を適切に保護することで、法的リスクや信頼の喪失を防ぐため データ保護は、取引先にすべてを委任しても問題ない None 52. 勾配降下法(Gradient Descent)の学習率(learning rate)が大きすぎる場合、予想される問題は次のうちどれですか? 最適解に収束するのが非常に遅くなる。 最適解を飛び越えて振動する可能性がある。 局所解に閉じ込められる可能性が高くなる。 勾配が計算されないため、進行が停止する。 None 53. 標準偏差を求める際に必要な計算は何ですか? 分散を2乗する 平均値を引く 分散の平方根を取る 標本数を掛ける None 54. 「論理的整合性」を保つために、議論を構築する際に避けるべき行動は次のうちどれですか? 結論が根拠と矛盾しないことを確認する 複数の視点を考慮して根拠を構築する データ分析に基づいた根拠を用いる 結論に合わせて根拠を改変する None 55. センサーデータの収集において、MQTTプロトコルが適している理由として正しいものは次のうちどれですか? 大量のデータをバッチ処理することに適しているため。 複雑なデータ構造をサポートしているため。 データの完全性を保証するため。 高速で軽量なプロトコルであり、リソース制約のある環境でも動作可能なため。 None 56. 大量のセンサーデータをリアルタイムに収集する際に、データの処理を分散させることでパフォーマンスを向上させるために使用される技術は次のうちどれですか? SQLクエリ pandas VirtualBox Apache Flink None 57. データサイエンスやAIの利活用における最大のメリットは次のうちどれですか? 大量のデータを効率的に分析し、迅速な意思決定が可能になる 人間の直感に基づいた判断を助ける 人間の判断を排除する データの分析スピードを低下させる None 58. データ収集において、ETLパイプラインが失敗した際の一般的な対応は次のうちどれですか? パイプラインを再インストールする ログを確認し、エラー原因を特定して修正する データをすべて削除してやり直す 別のデータソースを使用する None 59. データ収集において、「ログデータ」を収集する主な目的として最も適切なものは次のうちどれですか? データ分析に使用するため。 アプリケーションのデバッグや監視を行うため。 データベースのストレージを最適化するため。 ユーザーのプライバシーを保護するため。 None 60. AIが「医療のパーソナライズド診断」においてもたらしている変化として最も適切なものは次のうちどれですか? 個人の遺伝情報や生活習慣に基づいた治療の提案 すべての患者に同じ治療法を適用する 医療データの収集を完全に廃止する 医療従事者を完全に置き換える None 61. 企業の行動規範における「透明性」の重要性について、最も適切な説明は次のうちどれですか? 透明性は企業の競争力を弱めるため、できるだけ公開しない方がよい 企業の意思決定や業務プロセスが開かれていることで、ステークホルダーからの信頼を得られるため 透明性が高まると、企業の利益が減少する可能性がある 透明性は株主のみに適用され、他のステークホルダーには関係しない None 62. データサイエンスにおける「フィーチャーエンジニアリング」の目的は次のうちどれですか? モデルの精度を向上させるために、重要な特徴量を作成・選択すること データの可視化を行うこと データの取得元を確認すること モデルの精度を低下させること None 63. データの「アノマリ検出」が金融業界で特に重視される理由として最も適切なものは次のうちどれですか? 取引データを無視するため 不正取引や異常なパターンを検出するため 全ての取引を承認するため 取引の詳細を削除するため None 64. 論理的思考において、「パラドックス」とは何ですか? 複数の仮説が同時に成立しないこと 一見すると矛盾しているように見えるが、実は矛盾していない論理 真である前提から誤った結論が導かれること 反証が不可能な命題のこと None 65. 次の仮説を検証するために最も適切な方法を選んでください。 「新しいマーケティング戦略は、製品の売上を10%増加させる。」 既存の売上データと新しい戦略の実施後の売上データを比較する 経営者に戦略の効果について意見を求める 顧客に対してアンケートを実施する 競合他社の売上データと比較する None 66. A B C D None 67. データ収集において、ETLの「T」は何を意味しますか? Transaction(トランザクション) Transfer(転送) Transform(変換) Tagging(タグ付け) None 68. 「内部告発制度」が企業において重要な役割を果たす理由として最も適切なものは次のうちどれですか? 従業員のプライバシーを監視するため 企業の業績を評価するため 競合他社との戦略的パートナーシップを形成するため 従業員が企業内の不正行為を匿名で報告できるようにすることで、違法行為を未然に防ぐため None 69. ウェブスクレイピングを行う際に、ウェブサイトへのリクエストに使用するプロトコルは何ですか? HTTP/HTTPS FTP SMTP TCP/IP None 70. ビジネスにおける「利益相反」とは何ですか? 企業の利益と個人の利益が対立する状況 顧客と従業員が互いに利益を提供すること 取引先と企業が同じ利益を得る状況 企業の利益が増加しない状況 None 71. 以下の三段論法が論理的に正しいかを判断してください。 「すべてのデータサイエンティストはプログラミングを学ぶ必要がある。 Aさんはデータサイエンティストである。 したがって、Aさんはプログラミングを学ぶ必要がある。」 この結論は正しいですか? 正しくない 前提が不十分であるため、判断できない 結論が飛躍しているため、正しくない 正しい None 72. APIを利用して大量のデータを収集する際、APIリクエスト数を効率的に管理するための一般的な手法は次のうちどれですか? 正規表現 トークン化 ページネーション インデックス作成 None 73. ビジネスにおける論理的思考の重要性として、最も適切な説明はどれですか? 経営戦略や意思決定において、感情に左右されずに客観的な判断を下すため データが揃っていない状況で直感的に意思決定するため チームメンバーの意見を無視して一貫した行動を取るため 競合他社との競争において感情的な反応を示すため None 74. AIが金融業界にもたらしている変化として最も一般的なものは次のうちどれですか? 人間の判断に完全に依存する取引 リスク分析や融資判断における自動化 人間の労働時間の増加 顧客との対面相談の増加 None 75. 企業が利益相反を避けるために行うべき具体的な対策として最も適切なものは次のうちどれですか? 利益相反が発生しうる状況を事前に特定し、透明性のある報告体制を整える 従業員に利益相反が発生した際に個別の判断を任せる 利益相反が発生した場合、企業はその責任を取らない 企業のトップがすべての利益相反を管理する None 76. データの活用が急速に進んでいる農業分野において、「スマート農業」がもたらす主な利点は次のうちどれですか? 農作物の手作業での収穫を促進する 気象データや土壌データを基に効率的な農業が行える 農業におけるデータの利用を制限する 農作物の種類を減少させる None 77. 以下の要件を満たすために最も適切なツールはどれですか? Pythonスクリプトを定期的に実行し、ジョブのスケジュールを自動化したい。 タスクの依存関係を管理し、失敗した場合に再実行を容易にしたい。 Apache Kafka Apache Airflow Kubernetes Docker Compose None 78. データの相関係数が+1である場合、2つの変数間の関係をどのように解釈しますか? 2つの変数間には強い負の相関がある 2つの変数間には無相関である 2つの変数間には相関はない 2つの変数間には強い正の相関がある None 79. 環境構築時に使用される「仮想環境管理ツール」として適切なのは次のうちどれですか? SQL VirtualBox FTP JSON None 80. Docker環境において、同じアプリケーションの複数のコンテナを同時に稼働させるために適切な技術は何ですか? Docker Compose Docker Swarm Jenkins Airflow None 81. クラウド環境でデータの可用性を高めるために使用されるストレージ技術は次のうちどれですか? ローカルストレージ テープバックアップ NFS(ネットワークファイルシステム) オブジェクトストレージ None 82. コンテナオーケストレーションツールとして正しいものはどれですか? Kubernetes Apache Spark SQL Server JSON None 83. 論理的思考において、「誤った類推」とは何を指しますか? 同じデータを使って二つの異なる結論を導くこと 二つの異なる事象を不適切に比較し、誤った結論を導くこと 類似した事象を基に正しい結論を導くこと データの一部を無視して結論を出すこと None 84. コンテナ化されたアプリケーションのCI/CDパイプラインにおいて、Kubernetes環境に対して継続的デプロイを行うために必要なツールは何ですか? Helm Ansible Terraform Jenkins None 85. AIの発展により「労働市場」に現れている変化は次のうちどれですか? すべての仕事がAIに置き換わる 労働時間が増える傾向にある 新しい職種が生まれつつある 人間のスキルが無価値になる None 86. ビッグデータが公共政策の分野で活用される際の主な利点は次のうちどれですか? 政策の決定にデータを使用せず、直感に頼る 市民のニーズをデータに基づいて正確に把握できる 政策の結果を無視する ビッグデータの解析は政策に役立たない None 87. ビッグデータの4つの「V」に含まれない要素は次のうちどれですか? Volume(量) Velocity(速度) Variety(多様性) Visualization(可視化) None 88. 多変量正規分布における共分散行列の役割は何ですか? 各変数の分散と相関関係を表す 各変数の平均値を表す 各変数の相関を表す 各変数の標準偏差を表す None 89. データ収集時に、Webページから必要な情報を抽出するために使われる技術はどれですか? クエリパース データベースインデックス ウェブスクレイピング ネットワークトレース None 90. 公共交通機関で収集される「スマートカードデータ」の主な利用目的として最も適切なものは次のうちどれですか? 交通機関の運賃を均一化する 乗客の個人情報を公開する 乗客の利用パターンを分析し、運行スケジュールを最適化する 運賃を手動で調整する None 91. 微分積分の基本定理に基づいて、積分とは何を計算する手法ですか? 関数の増加量 関数の面積 関数の傾き 関数の最大値 None 92. 農業分野で利用される「気象データ」の具体的な活用方法として最も適切なものは次のうちどれですか? 収穫時期や灌漑スケジュールの最適化 作物の栽培地域を完全に機械化する 農作物の市場価格を決定する 農地の所有権を管理する None 93. Kubernetesクラスタにおいて、スケーリングを自動化するために使用される主要な機能はどれですか? Pod Autoscaler Load Balancer Persistent Volume Cluster Autoscaler None 94. データ収集プロセスにおける「バックプレッシャー」とは、どのような現象を指しますか? データベースへの接続が失敗すること データが不足していること APIリクエストが拒否されること 収集されたデータの処理が追いつかないこと None 95. 小売業において、消費者の購買行動を予測するために使用される「購買履歴データ」の活用法として最も効果的なものは次のうちどれですか? 購買履歴データを削除する 購買履歴データをランダムに選別する 購買履歴データを販売しない 消費者の過去の購入履歴に基づいたパーソナライズドな推薦を行う None 96. データ収集時に、ETLの「E」のプロセスに関連する主なタスクはどれですか? データの抽出 データの変換 データの検証 データの削除 None 97. A B C D None 98. ビジネス行動規範において、利害関係者(ステークホルダー)に対する責任はどのようなものですか? 株主や取締役に対してのみ利益を追求する 顧客、従業員、取引先、地域社会、環境など、すべてのステークホルダーに対して公平な対応をする 企業の利益が優先される場合には、ステークホルダーの利益を無視してもよい ステークホルダーには法的責任がないため、特別な配慮は必要ない None 99. AIとロボティクスの進展が「製造業」に与える影響として正しいものは次のうちどれですか? 労働力の需要が大幅に増加する 生産性が向上し、効率的な製造プロセスが実現する 製造コストが増加する 製品の品質が低下する None 100. 環境構築において、クラウドネイティブアプリケーションのスケーリングを自動化する技術はどれですか? Dockerのビルドシステム Jenkinsのジョブスケジューリング KubernetesのHorizontal Pod Autoscaler(HPA) Hadoopのデータ分散システム None Time's up