DS検定～模擬試験①～

データエンジニアリングにおいて、環境構築時に重要な役割を果たす「依存関係管理」とは何ですか？

ソフトウェアの動作に必要なライブラリやパッケージのバージョンを管理すること

データのバックアップを行うプロセス

ネットワークの通信を監視するシステム

仮想マシンのリソースをスケールアップすること

None

以下の三段論法が論理的に正しいかを判断してください。「すべてのデータサイエンティストはプログラミングを学ぶ必要がある。 Aさんはデータサイエンティストである。したがって、Aさんはプログラミングを学ぶ必要がある。」この結論は正しいですか？

正しくない

前提が不十分であるため、判断できない

結論が飛躍しているため、正しくない

正しい

None

データ収集において、ETLの「T」は何を意味しますか？

Transaction（トランザクション）

Transfer（転送）

Transform（変換）

Tagging（タグ付け）

None

ビッグデータの4つの「V」に含まれない要素は次のうちどれですか？

Volume（量）

Velocity（速度）

Variety（多様性）

Visualization（可視化）

None

公共交通機関における「スマートカードデータ」の活用法として最も効果的なものは次のうちどれですか？

スマートカードデータを破棄する

乗客のデータを公開する

乗客の利用パターンを分析し、運行スケジュールの最適化を行う

乗客のデータを使用しない

None

微分可能な関数𝑓( 𝑥 )がにおいて、二次導関数𝑓′′( 𝑥 )が正である場合、次のどれが正しいですか？

f(x)は𝑥の増加関数である。

f(x)は𝑥の減少関数である。

f(x)は凹である（Concave）。

f(x)は凸である（Convex）。

None

AIが医療分野に与えている影響として、正しいものは次のうちどれですか？

AIが全ての診断を行うようになった

医師の業務を支援するツールとしてAIが活用されている

患者とのコミュニケーションがなくなった

医師が不要になっている

None

10.

論理的思考における「非矛盾の原理」とは何ですか？

同時に真と偽であることはできないという原則

複数の結論が同時に成り立つという原則

複数の前提が矛盾する場合、結論は無効であるという原則

仮説が検証されない場合、結論は確立されないという原則

None

11.

「内部告発制度」の有効性を高めるために企業が行うべき対応は次のうちどれですか？

告発者の匿名性を確保する

告発を受けても内容を公開しない

告発を行った従業員に処罰を与える

告発内容を無視する

None

12.

AIが「環境保護」に貢献できる場面として、最も適切なものは次のうちどれですか？

AIが環境に与える影響は限定的である

AIが廃棄物管理を行うことは困難である

AIは環境保護に関わらない

AIがエネルギー消費を最適化し、温室効果ガスの排出を削減する

None

13.

AIとデータ分析技術の進展に伴い、「スマートシティ」としての都市が実現しつつありますが、この概念の基本的な目標は次のうちどれですか？

都市全体の運営コストを削減するため

都市の人口を減らすため

都市全体の効率と持続可能性を向上させるため

都市の拡張を阻止するため

None

14.

ロギングツールを使ってデータ収集を行う際、一般的に記録される情報は次のどれですか？

マシンのハードウェア仕様

データベースのスキーマ定義

HTMLタグの構造

エラーメッセージや警告、リクエストログ

None

15.

データ収集プロセスで、ストリーミングデータを収集する際に「バックプレッシャー」を管理するために有効な方法は次のうちどれですか？

データ処理速度を自動的に調整するフロー制御を導入する。

収集データを一時的にディスクに保存する。

APIリクエストのレートを手動で調整する。

データストリームを中断して負荷を軽減する。

None

16.

データの主成分分析 (PCA) で得られる「主成分」とは何ですか？

データ内のノイズを削減する

データ内で最も多くの分散を説明する新しい軸

データの標準化を行う手法

データ内の外れ値を検出する手法

None

17.

自然言語処理（NLP）が活用される具体例として最も適切なものは次のうちどれですか？

データの可視化

数値データの分析

自動翻訳やチャットボットでの顧客サポート

データの保存

None

18.

「論理的整合性」を保つために、議論を構築する際に避けるべき行動は次のうちどれですか？

結論が根拠と矛盾しないことを確認する

複数の視点を考慮して根拠を構築する

データ分析に基づいた根拠を用いる

結論に合わせて根拠を改変する

None

19.

ウェブスクレイピングを行う際、ウェブサイトが提供するデータの取り扱いに関して考慮すべき法的要件は次のうちどれですか？

ウェブページのソースコードの変更

APIエンドポイントの自由な利用

データの利用許諾とプライバシーポリシーの遵守

データのファイル形式の変更

None

20.

データエンジニアリング環境でのジョブスケジューリングを自動化するために使われるツールはどれですか？

Docker

Kubernetes

HTTP

Airflow

None

21.

AIの発展により「労働市場」に現れている変化は次のうちどれですか？

すべての仕事がAIに置き換わる

労働時間が増える傾向にある

新しい職種が生まれつつある

人間のスキルが無価値になる

None

22.

データ収集において、ウェブスクレイピングが禁止されているサイトのデータを収集する場合、適切な対応として最も正しいものは次のうちどれですか？

サイト運営者に許可を取るか、公開されているAPIを使用する。

IPアドレスを変更してスクレイピングを続ける。

ウェブページのHTMLを手動でダウンロードして使用する。

サードパーティのスクレイピングサービスを利用する。

None

23.

企業の行動規範において「人権の尊重」が重視される理由として正しいものは次のうちどれですか？

すべての従業員や関係者が平等に扱われ、差別や不当な扱いを受けない権利を保護するため

労働時間の管理を厳格に行うため

企業の業績を最大化するため

競合他社との競争を促進するため

None

24.

「行動規範」が組織内で有効に機能するために、最も重要な要素は次のうちどれですか？

全従業員への行動規範の教育と浸透

上層部のみが規範を遵守する

行動規範の内容を非公開とする

違反があっても特に対応しない

None

25.

クラウド環境でデータ処理パイプラインを構築する際、サーバーレスアーキテクチャを選択する利点として最も適切なものはどれですか？

コストが固定され、予算管理がしやすい。

全てのデータ処理をローカル環境で実行できる。

コンテナオーケストレーションが容易になる。

リソースのプロビジョニングが不要で、スケーラビリティが向上する。

None

26.

Docker環境において、同じアプリケーションの複数のコンテナを同時に稼働させるために適切な技術は何ですか？

Docker Compose

Docker Swarm

Jenkins

Airflow

None

27.

Kubernetesにおける「ポッド」とは何ですか？

クラスタ全体の負荷分散を行う機能

コンテナ間の通信を管理するプロトコル

コンテナの依存関係を管理するシステム

1つまたは複数のコンテナを含む最小のデプロイメント単位

None

28.

コンテナ化されたアプリケーションのCI/CDパイプラインにおいて、Kubernetes環境に対して継続的デプロイを行うために必要なツールは何ですか？

Helm

Ansible

Terraform

Jenkins

None

29.

AIが「金融分野」で引き起こしている変化の一つとして、最も適切なものは次のうちどれですか？

全ての取引を手動で記録する

金融商品の完全な廃止

リアルタイムでの不正取引検出システムの導入

全ての銀行支店を閉鎖する

None

30.

「中間項不周延の誤謬」が発生するのは次のどのケースですか？

前提と結論が論理的に関係していない場合

二つの異なる前提が正しく結びつけられていない場合

中間項がすべての前提に適切に当てはまらない場合

結論が前提に基づかない場合

None

31.

行列 𝐴 が逆行列を持つための条件として正しいものは次のうちどれですか？

行列 𝐴 が正方行列であること。

行列 𝐴 の行列式が 0 でないこと。

行列 𝐴 が対称行列であること。

行列 𝐴 の要素がすべて正であること。

None

32.

データ収集において、定期的にデータを収集するために使用されるツールはどれですか？

SQLクエリ

cronジョブ

JSONパーサー

正規表現

None

33.

クラウド環境におけるデータパイプラインの管理で、特定のタスクが失敗した際に、再試行を自動化するために使われる技術は何ですか？

自動リトライ機能を持つAirflow

Kubernetesによるスケーリング

Docker Composeによる再配置

Jenkinsによる継続的デリバリー

None

34.

None

35.

AI技術が「人材採用」において活用される場合のリスクとして考えられる問題は次のうちどれですか？

AIがすべての候補者を平等に評価する

AIが候補者のスキルを過小評価する可能性がある

AIがバイアスを持つ可能性がある

AIが候補者の学歴のみを重視する

None

36.

農業分野で利用される「気象データ」の具体的な活用方法として最も適切なものは次のうちどれですか？

収穫時期や灌漑スケジュールの最適化

作物の栽培地域を完全に機械化する

農作物の市場価格を決定する

農地の所有権を管理する

None

37.

「相関関係が因果関係を示すとは限らない」という論理的思考における原則を指す言葉は何ですか？

後件肯定の誤謬

逆証明

相関誤謬

結論飛躍

None

38.

「インサイダー取引」に該当する行動は次のうちどれですか？

取引先との秘密保持契約を結ぶこと

株主総会での議論に参加すること

市場の公開情報を基に投資を行うこと

一般に公開されていない企業情報を基に株式を売買すること

None

39.

ビジネスにおける「倫理的行動」とは次のうちどれですか？

企業が利益を最大化するために法を無視すること

顧客や取引先に対して誠実かつ公正な行動を取ること

競合他社のデータを違法に取得すること

社内で不正行為が発生した際に黙認すること

None

40.

勾配降下法（Gradient Descent）の学習率（learning rate）が大きすぎる場合、予想される問題は次のうちどれですか？

最適解に収束するのが非常に遅くなる。

最適解を飛び越えて振動する可能性がある。

局所解に閉じ込められる可能性が高くなる。

勾配が計算されないため、進行が停止する。

None

41.

AIが「人権」に関連して問題を引き起こす可能性がある分野として、最も適切なものは次のうちどれですか？

AIが平等な判断を行う

AIが雇用において不公平な判断を下す可能性がある

AIが個人の意思決定を補助する

AIが社会福祉を支援する

None

42.

クラウド環境におけるコスト管理を最適化するために使用される技術は次のうちどれですか？

クラウドストレージの分散化

コンテナのスケジューリング

クラウドモニタリング

Auto Scaling

None

43.

AI技術を導入することで、都市計画においてどのような変化がもたらされると考えられますか？

都市計画はAI技術の影響を受けない

AI技術によって都市計画が混乱する

AIは都市の縮小を助ける

都市の効率的な運営と持続可能な発展が促進される

None

44.

論理的思考における「反証可能性」とは何ですか？

仮説がすでに証明されていること

ある仮説が常に正しいことを示すこと

仮説が他の仮説と比較して優れていること

ある仮説が誤っているかどうかを実験や観察で検証できること

None

45.

AIが「プライバシー保護」に与える課題の一つとして考えられるものは次のうちどれですか？

データ収集が制限される

AIがプライバシーを侵害するリスクがある

AIが個人情報を正確に保護する

AIがプライバシーに関与しない

None

46.

次のシナリオを基に、どのような行動規範違反が発生しているかを特定してください。

「従業員が顧客データを個人的な目的で利用し、外部に共有した。」

コンプライアンス違反

プライバシー侵害

データ倫理違反

以上すべて

None

47.

企業の行動規範における「データ保護」の重要性について正しい説明は次のうちどれですか？

データ保護は法律上の義務ではないため、任意に行うもの

データ保護は企業の利益には直接関係しないため、優先度は低い

個人情報や機密情報を適切に保護することで、法的リスクや信頼の喪失を防ぐため

データ保護は、取引先にすべてを委任しても問題ない

None

48.

以下のシナリオに最も適したデータ収集手法はどれですか？

リアルタイムで生成されるクリックストリームデータを効率的に収集し、分析に利用したい。
大規模なトラフィックを処理できる耐障害性のあるシステムが必要である。

REST APIを使用したデータ収集

ウェブスクレイピング

ストリーミングデータプラットフォームの使用

手動でのデータ収集

None

49.

AWS（Amazon Web Services）を用いたクラウド環境の構築において、データストレージサービスとして使用されるものはどれですか？

FTP

HTTP

SMTP

None

50.

AIによる「バイアス」の問題が発生する可能性がある場面として、最も適切なものは次のうちどれですか？

データが大量すぎて解析できない場合

AIが完全に自動で動作している場合

データセットが少ない場合

データセットに偏りが含まれている場合

None

51.

公共交通機関で収集される「スマートカードデータ」の主な利用目的として最も適切なものは次のうちどれですか？

交通機関の運賃を均一化する

乗客の個人情報を公開する

乗客の利用パターンを分析し、運行スケジュールを最適化する

運賃を手動で調整する

None

52.

論理的思考において、「誤った類推」とは何を指しますか？

同じデータを使って二つの異なる結論を導くこと

二つの異なる事象を不適切に比較し、誤った結論を導くこと

類似した事象を基に正しい結論を導くこと

データの一部を無視して結論を出すこと

None

53.

データ収集時に、Webページから必要な情報を抽出するために使われる技術はどれですか？

クエリパース

データベースインデックス

ウェブスクレイピング

ネットワークトレース

None

54.

教育分野におけるAI活用の具体例として最も適切なものは次のうちどれですか？

教師の授業の代わりに全ての教育がAIで行われる

AIがテストの採点のみを行う

AIが生徒とのコミュニケーションを全て代行する

AIが個別学習をサポートし、生徒一人一人の進捗に応じたカリキュラムを提供する

None

55.

「情報の機密保持」に関する行動規範において、企業が遵守すべき事項は次のうちどれですか？

重要な顧客データや技術情報を第三者に共有する

競合他社の情報を無断で収集する

顧客や従業員の個人情報を適切に管理し、許可なく外部に漏らさない

情報の機密性は守る必要はない

None

56.

Kubernetesクラスタにおいて、スケーリングを自動化するために使用される主要な機能はどれですか？

Pod Autoscaler

Load Balancer

Persistent Volume

Cluster Autoscaler

None

57.

「論理的整合性」とは次のうちどれを指しますか？

一つの命題が常に真であること

論理的な推論が常に正しい結果を導くこと

データが正確であること

複数の命題が互いに矛盾しないこと

None

58.

論理的思考における「演繹法」とは何を指しますか？

一般的な法則から具体的な結論を導く推論法

実験結果を元に新しい仮説を立てること

データ分析の結果を統計的に解釈すること

不完全な情報から確率的な予測を行うこと

None

59.

データエンジニアリング環境構築において、一般的に使用される仮想化技術はどれですか？

Docker

HTTP

SMTP

TCP/IP

None

60.

Pythonでのデータ処理環境を整えるために、一般的に使用されるパッケージマネージャーはどれですか？

npm

pip

Docker

Kubernetes

None

61.

コンテナオーケストレーションツールとして正しいものはどれですか？

Kubernetes

Apache Spark

SQL Server

JSON

None

62.

「コーポレートガバナンス」の主な目的は次のうちどれですか？

企業の利益を最大化するための戦略を立てること

取締役会の権限をすべての意思決定に委ねること

企業の健全な経営と透明性を確保するための体制を整えること

株主にすべての経営判断を任せること

None

63.

AWSでデータ処理基盤を構築する際、以下の要件を満たすために最も適したサービスはどれですか？

分散データ処理が必要。
スケーラブルで、イベント駆動型のデータ処理が可能。

AWS S3

AWS Lambda

Amazon EMR

Amazon RDS

None

64.

小売業における「消費者行動データ」の主な活用目的として最も適切なものは次のうちどれですか？

商品のデザインを一新する

顧客の購入傾向を分析し、マーケティング戦略を最適化する

全顧客に同一のプロモーションを提供する

店舗の賃貸契約を変更する

None

65.

データエンジニアリング環境の構築において、スケーラブルな分散データ処理を実現するために使用されるプラットフォームはどれですか？

Hadoop

MySQL

FTP

JSON

None

66.

AIが「農業分野」において引き起こしている変化として最も適切なものは次のうちどれですか？

農作物の価格を完全に固定化する

ドローンやセンサーを用いた精密農業の普及

全ての農地を無人化する計画の推進

気象データの廃止

None

67.

クラウド環境でのスケーラブルなデータパイプライン構築において、分散処理をサポートするサービスは次のうちどれですか？

Terraform

SQL Server

AWS Glue

Hadoop HDFS

None

68.

CI/CDパイプラインにおいて、環境の自動テストやデプロイを行うために使われる一般的なツールはどれですか？

Hadoop

Jenkins

pandas

Kubernetes

None

69.

データ収集において、APIを使用してデータを取得する際に重要な要素はどれですか？

エンドポイント

データベース

クライアント側の設定

ログファイルの解析

None

70.

論理的思考における「二重否定の法則」は、次のうちどの論理的関係を表していますか？

ある命題が真である場合、その否定は偽である

ある命題が真である場合、その否定の否定も偽である

ある命題が偽である場合、その否定の否定は真である

否定された命題は常に真である

None

71.

不明

None

72.

企業の行動規範における「透明性」の重要性について、最も適切な説明は次のうちどれですか？

透明性は企業の競争力を弱めるため、できるだけ公開しない方がよい

企業の意思決定や業務プロセスが開かれていることで、ステークホルダーからの信頼を得られるため

透明性が高まると、企業の利益が減少する可能性がある

透明性は株主のみに適用され、他のステークホルダーには関係しない

None

73.

AIを活用した「サプライチェーンマネジメント」の進展により、企業が享受できる最大のメリットは次のうちどれですか？

サプライチェーン全体のリアルタイム監視と予測が可能になること

在庫の増加と管理コストの増加

サプライチェーンの複雑化

サプライチェーンのリスク増加

None

74.

医療分野において、患者のバイタルデータ（心拍数、血圧など）を収集する主な方法として最も適切なものは次のうちどれですか？

オンラインアンケート

ウェアラブルデバイス

手書きのカルテ

社会保険のデータベース

None

75.

ビッグデータが公共政策の分野で活用される際の主な利点は次のうちどれですか？

政策の決定にデータを使用せず、直感に頼る

市民のニーズをデータに基づいて正確に把握できる

政策の結果を無視する

ビッグデータの解析は政策に役立たない

None

76.

データの活用が急速に進んでいる農業分野において、「スマート農業」がもたらす主な利点は次のうちどれですか？

農作物の手作業での収穫を促進する

気象データや土壌データを基に効率的な農業が行える

農業におけるデータの利用を制限する

農作物の種類を減少させる

None

77.

オンラインプラットフォームにおける「推薦システム」の主な役割は次のうちどれですか？

利用者の選択肢を制限する

全ての利用者に同じ商品を推薦する

推薦システムを使用しない

利用者に対してパーソナライズされた商品やコンテンツを提案する

None

78.

「後件肯定の誤謬」が発生するのは次のどの場合ですか？

前提が正しいにもかかわらず、誤った結論に至る場合

結論を根拠にして前提を証明しようとする場合

後件が成り立つことで前件も成り立つと誤って推論する場合

仮定が間違っている場合

None

79.

論理的思考において、「パラドックス」とは何ですか？

複数の仮説が同時に成立しないこと

一見すると矛盾しているように見えるが、実は矛盾していない論理

真である前提から誤った結論が導かれること

反証が不可能な命題のこと

None

80.

次の推論に含まれる誤謬を指摘してください。「すべてのリーダーは影響力を持っている。 Bさんはリーダーではない。したがって、Bさんには影響力がない。」

相関誤謬

後件肯定の誤謬

前件否定の誤謬

結論飛躍

None

81.

標準偏差を求める際に必要な計算は何ですか？

分散を2乗する

平均値を引く

分散の平方根を取る

標本数を掛ける

None

82.

AIが「教育分野」で生み出している最も重要な変化として適切なものは次のうちどれですか？

学生全員に同じ教育プランを提供する

教材の印刷を完全に廃止する

教育者の役割を完全にAIに置き換える

各学生の進捗状況を分析し、個別に最適化された学習プランを作成する

None

83.

データの相関係数が+1である場合、2つの変数間の関係をどのように解釈しますか？

2つの変数間には強い負の相関がある

2つの変数間には無相関である

2つの変数間には相関はない

2つの変数間には強い正の相関がある

None

84.

センサーデータの収集に使用される技術として、最も適切なのはどれですか？

TCP/IP

SMTP

SQLクエリ

IoT（Internet of Things）

None

85.

次のうち、「論理的思考」の応用として適切な場面はどれですか？

チーム内での直感的な意思決定を優先する場合

多様なデータを分析して根拠を明確にする場合

感情的な議論を促進する場合

競合他社の成功事例をそのまま模倣する場合

None

86.

次の仮説を検証するために最も適切な方法を選んでください。「新しいマーケティング戦略は、製品の売上を10％増加させる。」

既存の売上データと新しい戦略の実施後の売上データを比較する

経営者に戦略の効果について意見を求める

顧客に対してアンケートを実施する

競合他社の売上データと比較する

None

87.

AIとビッグデータが保険業界で活用されている分野の一つに「保険金詐欺の検出」があります。このプロセスにおけるAIの役割として最も適切なものは次のうちどれですか？

すべての取引を無条件で承認する

保険金詐欺を人間が手動で確認する

保険金詐欺を無視する

保険金詐欺のパターンを学習し、疑わしい取引を特定する

None

88.

「利益相反」を防ぐために企業が取るべき最適な対策は次のうちどれですか？

利益相反の可能性を無視する

従業員の副業や外部活動をすべて禁止する

事前に従業員に利益相反を自己申告させる

利益相反が発覚した場合でも特に対応しない

None

89.

正規分布の累積分布関数 (CDF) は何を表していますか？

特定の値以下の確率

特定の値以上の確率

特定の値の発生確率

特定の範囲の期待値

None

90.

ビジネスにおける「利益相反」とは何ですか？

企業の利益と個人の利益が対立する状況

顧客と従業員が互いに利益を提供すること

取引先と企業が同じ利益を得る状況

企業の利益が増加しない状況

None

91.

ビジネスにおける論理的思考の重要性として、最も適切な説明はどれですか？

経営戦略や意思決定において、感情に左右されずに客観的な判断を下すため

データが揃っていない状況で直感的に意思決定するため

チームメンバーの意見を無視して一貫した行動を取るため

競合他社との競争において感情的な反応を示すため

None

92.

クラウド上でのデータ収集において、サーバーレスアーキテクチャの利点は次のうちどれですか？

サーバーの運用管理が不要になる

データベースのスキーマを定義しやすくなる

データ収集の速度が制限される

大量データの保存が困難になる

None

93.

マルコフ連鎖において、「定常状態」とは何を意味しますか？

各状態が常に同じ確率で遷移する

すべての状態に同じ確率で遷移する

系が時間経過とともに特定の確率分布に収束する

系が無限の時間を経過しても一定の変化がない状態

None

94.

環境構築において、「仮想環境」と「コンテナ」の違いとして最も適切な説明は次のうちどれですか？

仮想環境はハードウェアの仮想化を行い、コンテナはアプリケーションレベルの仮想化を行う。

仮想環境はオープンソースのみで構築できるが、コンテナはプロプライエタリソフトウェアが必要である。

コンテナは複数のオペレーティングシステムを同時に動作させるために使用される。

仮想環境はスケーラブルではないが、コンテナはスケーラブルである。

None

95.

確率密度関数（PDF）𝑓(𝑥)の性質として正しいものは次のうちどれですか？

f(x)≥0 である。

確率密度関数の積分値は無限大になる。

f(x)は必ず正規分布を表す。

確率密度関数の最大値は常に1である。

None

96.

論理的思考のプロセスにおいて、「前提」を正しく設定することが重要な理由として正しいものは次のうちどれですか？

前提が間違っていても、正しい結論を導けるため

前提が間違っていると、どれだけ正しい推論をしても、結論が間違う可能性があるため

前提を設定しない方が柔軟な思考ができるため

前提を正しく設定することは論理的思考には関係がないため

None

97.

None

98.

次の推論における誤謬は何ですか？「この新製品は多くの消費者に好評だから、今後も売上が伸び続けるだろう。」

演繹法の誤謬

演繹法の正当性

不確実性の誤謬

誤った一般化

None

99.

ソーシャルメディアから得られるデータを活用する際に重要な注意点は次のうちどれですか？

データの量よりも質を重視する

データが必ずしも正確でない可能性がある

全てのデータが分析可能である

データの出所を気にする必要はない

None

100.

AIとデータサイエンスが「公共政策」に与える変化として、最も適切なものは次のうちどれですか？

政策決定を完全にAIに依存させる

データを基にしたエビデンスベースの政策立案の促進

市民からの意見を無視する方向性を強化する

政策を全て定量化する

None

Time's up