DS検定～模擬試験⑤～

データライセンス契約で、特に注意が必要な項目として最も適切なものは次のうちどれですか？

データの物理的保存場所

データの利用範囲と再利用に関する制約

データ提供者の個人的な意見

データの削除時期に関する規定の排除

None

「HTTPS」が従来の「HTTP」よりも安全とされる理由は次のうちどれですか？

通信が暗号化されているため、中間者攻撃を防ぐことができる

データの圧縮が行われ、転送速度が速くなるため

データが複数のサーバーに分散されているため

データベースへのアクセスが制限されているため

None

「GDPR（一般データ保護規則）」に基づき、データサイエンスプロジェクトが遵守すべき主な要件として最も適切なものは次のうちどれですか？

すべてのデータを匿名化し、利用者に事前の説明を行わない

個人データの利用目的を明確にし、データ主体から同意を取得する

データ主体から同意を得た場合、全ての利用が無制限で許可される

データ主体の削除要求を拒否する権利を持つ

None

非構造化データ処理において、画像データの特徴量抽出に「ResNet」が有効とされる主な理由は次のうちどれですか？

高次元データを低次元に圧縮するため。

訓練時間を大幅に短縮するため。

データのラベルなしで学習を進めるため。

勾配消失問題を軽減し、非常に深いネットワークを構築可能にするため。

None

AIを事業に実装する際、「フェアネス（公平性）」が重要視される理由として最も適切なものは次のうちどれですか？

モデルの計算速度を向上させるため

ビジネス上の決定が特定のグループを不当に排除しないようにするため

全てのデータを無差別に扱うため

技術チームの作業負担を軽減するため

None

分散型DoS攻撃（DDoS）を軽減するために一般的に使用される技術は次のうちどれですか？

データの暗号化

コンテンツデリバリネットワーク（CDN）

セマフォの使用

ソルトの使用

None

AIを事業に実装する際に、モデルの「ブラックボックス性」が問題となるのは次のうちどの理由ですか？

モデルが複雑すぎて、ビジネスに応用できないため

モデルのパフォーマンスが低いから

モデルの意思決定プロセスが不透明で、説明が難しいため

モデルの計算速度が遅いから

None

Pythonでの「ジェネレータ」として正しいものは次のうちどれですか？

すべての値を一度にリストとして返す関数

データベースのレコードを生成する関数

配列の要素を操作する関数

yieldを使って値を一つずつ返す関数

None

動画データ処理において、アクション認識（Action Recognition）を実現するために使用される技術の組み合わせとして最も適切なのは次のうちどれですか？

CNNとLSTM

RNNとTF-IDF

ResNetとBERT

GANとWord2Vec

None

10.

事業へのAI実装において、部門間の連携を効果的に行うために推奨されるアプローチは次のうちどれですか？

各部門の目標を統一し、共通のKPIを設定する

各部門が独自のデータを使用し、成果を比較する

技術部門のみがAIプロジェクトに参加する

データサイエンティストのみが意思決定を行う

None

11.

ITセキュリティにおける「ディープパケットインスペクション（DPI）」とは、次のうちどれを指しますか？

データの暗号化を行う技術

ハッシュ値を計算してデータの整合性を確認する技術

ネットワーク上の通信パケットの内容を解析し、不正なデータを検出する技術

ファイルのバックアップを自動で行う技術

None

12.

生成モデルのトレーニングにおいて、モンテカルロ法が適用されるのはどのような状況ですか？

高次元の潜在空間からのサンプルを効率的に取得する必要がある場合

データが非常に大きい場合

データが欠損している場合

データがクラスに分けられる場合

None

13.

AI技術の導入に伴い、契約において「プライバシー保護条項」が重要視される理由は次のうちどれですか？

契約の終了時にデータを削除するため

個人情報や機密データの不正利用を防ぐため

契約内容を一般に公開するため

データの質を向上させるため

None

14.

Pythonにおける「ラムダ式」とは何ですか？

無名関数を作成するための簡潔な構文

関数の中で別の関数を呼び出すための手法

引数のない関数を定義するための手法

関数の結果をキャッシュするための手法

None

15.

BERTなどのトランスフォーマーモデルが従来のRNN（リカレントニューラルネットワーク）に対して優れている点はどれですか？

訓練時間が短い

小規模なデータセットでも優れた性能を発揮する

高度な前処理が不要である

長い依存関係を捉えやすい

None

16.

「Data Augmentation（データ拡張）」が生成モデルで使用される理由は何ですか？

トレーニングデータを増やし、モデルの汎化性能を向上させるため

モデルの計算速度を向上させるため

データのラベル付けを簡素化するため

データの次元を削減するため

None

17.

Pythonにおいて、ソートアルゴリズムの一つである「クイックソート」の平均時間計算量は次のうちどれですか？

O(n^2)

O(n log n)

O(n)

O(log n)

None

18.

生成モデルを評価する際、Inception Score（IS）が主に評価する要素は何ですか？

生成されたデータの品質と多様性

生成モデルのトレーニング速度

モデルの過学習の程度

データの次元削減精度

None

19.

Pythonでマルチスレッドプログラミングを行う際に注意すべき点は次のうちどれですか？

スレッド間のデータ共有が自動的に行われる

マルチスレッド環境ではエラーハンドリングが不要である

グローバルインタプリタロック（GIL）が並列実行を制限するため、I/Oバウンドな処理に適している

CPUバウンドな処理ではスレッドが効果的に動作する

None

20.

自然言語処理において、トピックモデリングを行うために広く使われる手法はどれですか？

TF-IDF

LDA（潜在ディリクレ配分）

ワード2ベクトル

アテンションメカニズム

None

21.

テキストデータを扱う際、トークン化後の単語数が非常に多い場合に生じる問題は何ですか？

次元の呪い

オーバーフィッティング

アンダーフィッティング

クラスターの数が増加する

None

22.

ITセキュリティにおいて、ファイルの整合性を監視する「FIM（File Integrity Monitoring）」の主な目的は次のうちどれですか？

ファイルの変更が正当なものであるかどうかを確認する

ファイルの暗号化強度を監視する

ファイルの圧縮率を最適化する

ファイルの転送速度を向上させる

None

23.

データを扱う際に欠損値が多い場合に最も適切な対応は次のうちどれですか？

欠損値を推定して補完する

欠損値を全て削除する

欠損値の行だけを削除する

欠損値を無視して分析を進める

None

24.

データサイエンスプロジェクトにおける「NDA（秘密保持契約）」が求められる主な理由は次のうちどれですか？

プロジェクトのスケジュールを管理するため

機密情報の漏洩を防ぎ、ビジネス上の競争優位性を保つため

データを公開する許可を得るため

チームメンバーの仕事量を減らすため

None

25.

契約における「損害賠償条項」が重要な理由は次のうちどれですか？

双方の責任を回避するため

契約を終了するため

コストを削減するため

契約違反が発生した場合の賠償責任を明確にするため

None

26.

AI実装において「API」を利用するメリットとして最も適切なものは次のうちどれですか？

AIモデルのトレーニングを効率化する

モデルのパフォーマンスを最適化する

モデルのアルゴリズムを変更するための手段を提供する

外部システムと簡単に連携し、データやモデルを活用できる

None

27.

暗号化アルゴリズムのうち、対称鍵暗号の例として正しいものは次のうちどれですか？

AES

RSA

DSA

ECC

None

28.

ソフトウェア開発において「オープンソースライセンス」を利用する際、注意すべき点は次のうちどれですか？

ライセンス条件に従って利用しなければならない

商用利用が常に禁止されている

コードの改変が認められない

ソフトウェアを一切販売できない

None

29.

ITセキュリティにおいて「暗号化の鍵管理」が重要とされる理由として最も適切なものは次のうちどれですか？

暗号化プロセスを高速化するため。

鍵が漏洩すると暗号化されたデータが解読される可能性があるため。

暗号アルゴリズムを簡素化するため。

暗号化されたデータのバックアップを容易にするため。

None

30.

生成モデルで使用される「潜在変数」とは何ですか？

モデルの出力に直接関係する観測可能な変数

データの生成プロセスを表現するが、直接観測できない変数

モデルのハイパーパラメータ

出力のラベルに対応する変数

None

31.

生成モデルにおいて「転移学習」を適用する利点は次のうちどれですか？

データの前処理が不要になる

既存のモデルを使って新しいドメインに対する生成能力を迅速に獲得できる

ノイズの多いデータセットでも高精度な生成が可能になる

データのクレンジングが不要になる

None

32.

事業へのAIの実装において、事前に整備すべき要素として最も重要なものは次のうちどれですか？

高性能なハードウェア

十分なデータ

データサイエンティストの確保

予算の確保

None

33.

「ソーシャルエンジニアリング攻撃」を防ぐために最も有効な手段は次のうちどれですか？

ファイアウォールを設置する。

従業員へのセキュリティ意識向上のためのトレーニングを実施する。

データを常に暗号化する。

全てのシステムにバックアップを設定する。

None

34.

データサイエンスプロジェクトにおける「データライセンス契約」の目的は次のうちどれですか？

データの所有権を譲渡する

データの品質を保証する

データの削除を要求する

データの使用範囲や条件を明確にする

None

35.

テキストデータの前処理において、ストップワードとは何ですか？

重要な単語

頻繁に出現するが、意味的な価値が少ない単語

文書の最後に登場する単語

文書全体の主題を表す単語

None

36.

Pythonの辞書型において、新しいキーと値のペアを追加する方法として適切なものは次のうちどれですか？

dict.append(key, value)

dict[key] = value

dict.update(key, value)

dict.insert(key, value)

None

37.

GANのトレーニングにおいて、生成器と判別器のバランスを保つために重要なハイパーパラメータはどれですか？

エポック数

バッチサイズ

ドロップアウト率

学習率

None

38.

音声データを処理する際、音の周波数成分を時間とともに解析するために使用される手法はどれですか？

Fourier変換

自己相関

遅延プロット

サポートベクターマシン

None

39.

Pythonでforループを用いて、リスト[1, 2, 3]の各要素に1を加えた結果を新しいリストとして出力するコードは次のうちどれですか？

[x+1 for x in [1, 2, 3]]

list(map(lambda x: x+1, [1, 2, 3]))

for x in [1, 2, 3]: x += 1

map(x+1, [1, 2, 3])

None

40.

以下のPythonコードを実行した場合、結果として正しいものはどれですか？

a = [1, 2, 3, 4]
b = [2, 4, 6, 8]
result = list(map(lambda x, y: x + y, a, b))
print(result)

[1, 2, 3, 4, 2, 4, 6, 8]

[3, 6, 9, 12]

[1, 2, 3, 4, 6, 8]

エラーが発生する。

None

41.

次のうち、データを分割する際の方法として最も適切なものはどれですか？

データをランダムに分割する

データ全体をトレーニングデータとして使用する

トレーニングデータとテストデータに分割する

テストデータのみを使用する

None

42.

AIの事業実装において、プロジェクトのROI（投資利益率）を評価するために最も適切な方法は次のうちどれですか？

投資額とAI導入による効果を定量的に比較する

プロジェクトの進捗を評価する

AIの精度のみを評価する

モデルの複雑さを評価する

None

43.

データサイエンスを事業に実装する際に用いる「PoC（概念実証）」の目的は次のうちどれですか？

事業全体に導入する前に小規模で効果を確認するため

データの前処理を行うため

モデルを訓練するため

データ分析ツールの選定を行うため

None

44.

GANやVAEのような生成モデルを用いて、新しいデータを生成する際に直面する可能性のある課題は何ですか？

モデルのトレーニングに非常に時間がかかる

モデルが生成したデータが現実のデータと大きく異なる場合がある

ラベル付けが必要なデータでしか動作しない

ハイパーパラメータの調整が不要である

None

45.

データフレームを操作する際に、特定の列に重複する値が多く含まれている場合の最適な対応は次のうちどれですか？

重複する値をすべて削除する

重複した値を基準にデータをグループ化する

重複する行をランダムに削除する

重複する値を平均値で置き換える

None

46.

Pythonにおける「デコレータ（decorator）」の主な役割は次のうちどれですか？

関数やメソッドに追加の機能を動的に付与する

クラスを生成するためのテンプレートを提供する

関数の実行結果をキャッシュする

配列の要素をフィルタリングする

None

47.

AIの事業実装において、「継続的インテグレーション（CI）」が推奨される理由は次のうちどれですか？

モデルのトレーニング時間を短縮するため

モデルのアップデートを自動化し、常に最新の状態を保つため

データサイエンティストが手作業でモデルを更新できるようにするため

テストデータを使ってモデルを検証するため

None

48.

時系列データを扱う際に「自己相関」を処理するための手法として最も適切なものは次のうちどれですか？

ロジスティック回帰

クラスタリング

自己回帰モデル（AR）

データの標準化

None

49.

データフレーム内のカテゴリデータを数値に変換する際、最も適切な手法は次のうちどれですか？

すべてのカテゴリを数値のランダム値に置き換える

カテゴリをワンホットエンコーディングで変換する

カテゴリを辞書型に変換する

カテゴリ列を削除する

None

50.

「著作権」の対象として、データサイエンスプロジェクトに関連するものは次のうちどれですか？

アルゴリズムのアイデア

コードやドキュメントの記述内容

データそのもの

データの集計結果

None

51.

ITセキュリティにおいて、セキュリティパッチ管理の目的として最も適切なものは次のうちどれですか？

システムのパフォーマンスを向上させる

データの圧縮率を最適化する

システムやソフトウェアの脆弱性を修正し、攻撃のリスクを軽減する

データのバックアップを自動化する

None

52.

AIを事業に実装する際の「デジタルリテラシー」の向上が求められる理由は次のうちどれですか？

組織全体がAIの仕組みを理解し、効果的に活用できるようにするため

データサイエンティストのみがAIを使用するため

AIのアルゴリズムを開発するため

経営層のみがAIを管理するため

None

53.

AIモデルを事業に実装する際、ステークホルダーがモデルの出力に信頼を置くために必要な条件として最も適切なものは次のうちどれですか？

モデルの予測結果の説明可能性が確保されていること

モデルの動作が完全に自動化されていること

モデルが最高の精度を達成していること

モデルが他の事業と完全に連携していないこと

None

54.

データセットの特徴量のスケーリングを行う際、正規化（Normalization）を使用する主な理由は次のうちどれですか？

特徴量間の相関を高めるため

特徴量の分布を標準正規分布に合わせるため

特徴量の値を特定の範囲（例: 0～1）に収めるため

特徴量の名前を統一するため

None

55.

Pythonで「リスト内包表記」を使用して、リスト [2, 4, 6] の要素を2倍にした新しいリストを作成するコードとして正しいものは次のうちどれですか？

[x * 2 for x in [2, 4, 6]]

list(map(lambda x: x * 2, [2, 4, 6]))

[x + 2 for x in [2, 4, 6]]

[x ** 2 for x in [2, 4, 6]]

None

56.

事業へのAI実装において、「モデルのドリフト（劣化）」が発生した場合の最適な対応策として最も適切なものは次のうちどれですか？

モデルをそのまま使用し続ける

新しいモデルを構築せずに既存のルールベースに戻す

モデルのパフォーマンス評価を一切行わない

モデルの学習データを更新し、再トレーニングを行う

None

57.

非構造化データにおける「アノテーション」とは何を指しますか？

データのラベル付けを行う作業

データの可視化を行う作業

データの正規化を行う作業

データの欠損値を補完する作業

None

58.

Pythonにおいて、functools.lru_cacheデコレータを使用する主な目的は次のうちどれですか？

関数のエラーハンドリングを強化する

関数の引数を動的に変更する

関数の実行を遅延させる

関数の結果をキャッシュし、同じ入力に対する計算を高速化する

None

59.

次のうち、データをサンプルする際に最も適切な方法はどれですか？

全データを使用する

ランダムサンプリングを行う

サンプリングを行わない

データの一部だけを任意に選ぶ

None

60.

Pythonにおいて、tryブロック内で発生した例外を捕捉し、その例外に応じて処理を行うための構文は次のうちどれですか？

try-catch

try-exception

try-except

try-finally

None

61.

生成モデルにおいて、自己回帰モデルはどのようにしてデータを生成しますか？

データのすべてを一度に生成する

前の出力に基づいて次の出力を逐次的に生成する

ランダムにデータを生成する

データをクラスタリングしてから生成する

None

62.

GANにおける「モード崩壊」とは何を指しますか？

生成器が多様なデータを生成できなくなる現象

判別器が過学習する現象

データの一部が学習されない現象

生成器が学習しない現象

None

63.

データの正規性を確認するために最も適切な統計検定は次のうちどれですか？

シャピロ・ウィルク検定

カイ二乗検定

ロジスティック回帰

クラスター分析

None

64.

事業にAIを実装する際の主要な課題として、次のうち最も一般的なものはどれですか？

コストの問題

モデルの性能不足

経営層の技術的知識不足

データの質や量の不足

None

65.

データの前処理における「欠損値の補完」の方法として最も適切なものは次のうちどれですか？

欠損値を全て削除する

欠損値を平均値や中央値で補完する

欠損値をそのまま残す

欠損値にランダムな値を入力する

None

66.

データサイエンスプロジェクトの契約において、「成果物の所有権」が曖昧な場合に起こり得る問題は次のうちどれですか？

成果物が正しく納品されない

成果物が契約外で使用される

成果物の精度が低下する

成果物の利用や商業化に関する権利争いが発生する可能性がある

None

67.

AIモデルのバイアスが事業に与える影響として考えられるリスクは次のうちどれですか？

モデルの処理速度が低下する

モデルの精度が一時的に上昇する

バイアスが発生しても、事業には影響を与えない

不公平な判断が下され、顧客や従業員の信頼を失う可能性がある

None

68.

AIモデルのライセンス契約において、「第三者提供の禁止」が規定される理由として最も適切なものは次のうちどれですか？

モデルの性能を向上させるため

契約を複雑にするため

モデルを使用できないようにするため

モデルの無断利用や不正な拡散を防ぐため

None

69.

事業にAIを実装する際の「データサイロ」の問題を解決するために適切なアプローチは次のうちどれですか？

各部門が独自のデータベースを管理し、結果を共有しない

データを統合せず、必要なときだけアクセスする

組織全体でデータを共有し、統一されたデータ管理体制を整える

部門ごとに異なるデータフォーマットを使用する

None

70.

AIモデルを事業に実装する際、モデルの持続的なパフォーマンスを維持するために重要な要素は次のうちどれですか？

継続的なデータの更新とモデルの再訓練

モデルを最初に設定した通りに維持する

モデルのアルゴリズムを定期的に変更する

モデルを一度設定した後は監視しない

None

71.

音声データ処理において、リカレントニューラルネットワーク（RNN）の代わりにトランスフォーマーモデルが使用されることが増えている主な理由は次のうちどれですか？

トランスフォーマーモデルは、時間的な順序を完全に無視できるため。

トランスフォーマーモデルは、長い依存関係を効率的に学習できるため。

RNNよりも学習速度が遅く、精度が高いから。

トランスフォーマーモデルは、音声データ専用に設計されているから。

None

72.

AI導入において「スケーラビリティ」が重要な理由は次のうちどれですか？

導入コストを低く抑えるため

プロジェクトの進捗を管理しやすくするため

成長するビジネスニーズに対応できるようにするため

モデルの性能を高めるため

None

73.

「商標権」とは何を保護する権利ですか？

特定のデータサイエンス手法

ソフトウェアのアルゴリズム

商品やサービスを識別するための名称やロゴ

公開されたデータベース

None

74.

AIモデルを第三者に提供する際、ライセンス契約において重要となる項目は次のうちどれですか？

モデルのアルゴリズムを公開する

モデルの精度を保証する

モデルの再販を推奨する

モデルの使用範囲と利用目的を明確に規定する

None

75.

データ生成において、自己回帰モデルが特に有効なデータタイプは何ですか？

画像データ

カテゴリカルデータ

クラスタデータ

時系列データ

None

76.

契約書において、データサイエンスプロジェクトの成果物に対する「知的財産権」は、通常どのように規定されるべきですか？

全ての知的財産権は発注者に帰属する

知的財産権はプロジェクトの契約内容に基づいて明確に規定される

知的財産権は特に明記されない

知的財産権は開発者の所有となる

None

77.

ITセキュリティにおいて「ゼロトラストアーキテクチャ」が推奨される理由として正しいものは次のうちどれですか？

セキュリティコストを削減できるから。

ネットワークの境界だけを保護すれば十分であるから。

システム内のすべての通信とアクセスを常に検証し、信頼を前提としないため。

セキュリティシステムの管理を自動化するため。

None

78.

データサイエンスプロジェクトで「著作権」が主に保護する対象として最も適切なものは次のうちどれですか？

数値データそのもの

データベースの物理的なストレージ装置

データ分析結果をまとめたレポートやドキュメント

顧客との契約書のひな形

None

79.

Pythonのmultiprocessingモジュールを使って、複数のプロセスを並列実行する際に、プロセス間でデータを安全に共有するために使用される構造は次のうちどれですか？

スレッド（Thread）

イベント（Event）

キュー（Queue）

セマフォ（Semaphore）

None

80.

GANのトレーニングにおいて、生成器と判別器が「収束しない」とはどのような問題を指しますか？

生成器が判別器に対して常に優位な状態になる

生成器と判別器の学習が進まず、最適なバランスが取れない状態になる

判別器が生成器よりも早く収束する

学習データが不十分である

None

81.

ITセキュリティにおける「ゼロトラストモデル」とはどのようなセキュリティモデルですか？

ネットワーク内の全ての通信を信頼するアプローチ

全てのアクセスを検証し、内部ネットワークでも信頼しないセキュリティアプローチ

外部からの攻撃のみを防ぐためのセキュリティモデル

信頼できるネットワークデバイスのみを許可するアプローチ

None

82.

生成モデルのトレーニングにおいて「潜在空間の探索」が重要である理由は何ですか？

潜在空間を探索しないと、モデルが過学習するから

潜在空間を探索すると、モデルの計算速度が向上するから

潜在空間の探索は必ずしも重要ではない

潜在空間を適切に探索することで、新しいデータの生成品質が向上するから

None

83.

モデルの性能評価において、訓練データに対して高い精度を示すが、テストデータに対して低い精度を示す現象を何と呼びますか？

過学習（オーバーフィッティング）

欠損補完

ロジスティック回帰

標準化

None

84.

あるデータセットに外れ値が含まれており、線形回帰モデルを構築する際に問題を引き起こしています。外れ値の影響を軽減するために最適な方法は次のうちどれですか？

外れ値を削除せずにそのままモデルを構築する

外れ値を削除する

外れ値を平均値に置き換える

外れ値の影響を軽減するためにロバスト回帰を使用する

None

85.

データの「正規化」を行う目的は次のうちどれですか？

データの分布を平坦化するため

データを標準偏差で整えるため

データのノイズを削除するため

異なるスケールを持つデータを同一基準に揃えるため

None

86.

生成モデルにおいて、GAN（Generative Adversarial Network）で使用される2つのネットワークは何ですか？

生成器と判別器

リカレントニューラルネットワークと畳み込みニューラルネットワーク

回帰モデルと分類モデル

主成分分析とクラスタリング

None

87.

ITセキュリティにおいて「侵入検知システム（IDS）」と「侵入防止システム（IPS）」の違いとして正しいものは次のうちどれですか？

IDSはネットワークの速度を向上させるが、IPSはパフォーマンスを重視しない。

IDSは防御策を自動実行するが、IPSは管理者の判断を必要とする。

IDSとIPSは機能的に同じである。

IDSは攻撃を検知するが、IPSは攻撃を検知して防ぐ。

None

88.

生成モデルにおいて「対比学習（Contrastive Learning）」を取り入れる主な目的は何ですか？

モデルのトレーニング時間を短縮するため。

潜在空間の構造を明確化し、より判別可能な特徴を学習するため。

モード崩壊を防ぐため。

バッチサイズを減少させるため。

None

89.

Pythonで大規模なデータフレームを高速に操作するために、pandasよりも高性能な代替手段として使われるライブラリは次のうちどれですか？

Scikit-learn

Dask

TensorFlow

PyTorch

None

90.

ITセキュリティにおける「レインボーテーブル攻撃」を防ぐための有効な手段は次のうちどれですか？

パスワードを暗号化する

ソルトを使用してパスワードをハッシュ化する

ファイアウォールを設置する

ウイルス対策ソフトをインストールする

None

91.

契約において「解除条項」が定められる理由は次のうちどれですか？

契約を永続的に維持するため

双方の責任を軽減するため

コスト削減のために契約を見直すため

契約当事者が特定の条件下で契約を解除できることを規定するため

None

92.

ITセキュリティにおいて、SQLインジェクション攻撃を防ぐために効果的な対策は次のうちどれですか？

データを圧縮して送信する

プレースホルダーを使用したSQL文の作成

パスワードをハッシュ化する

ファイルの暗号化を行う

None

93.

テキスト分類モデルにおいて、マルチラベル分類の実装が必要な場合、次のうち適切なアプローチはどれですか？

各ラベルごとに独立したバイナリ分類器を作成する

一つの分類器で全てのラベルを一度に分類する

ラベルの相関を無視して処理する

ラベルの階層構造を前提とした回帰モデルを作成する

None

94.

非構造化データに対して、生成モデルを用いる場合の最大の利点は何ですか？

非構造化データから新しいデータサンプルを自動生成できる

非構造化データを自動的にラベル付けできる

非構造化データを低次元空間にマッピングできる

非構造化データの前処理が不要になる

None

95.

データの異常値を処理する一般的な方法として適切なものは次のうちどれですか？

異常値を削除する

異常値を平均値で置き換える

異常値の影響を無視して分析を進める

異常値を説明変数として取り入れる

None

96.

時系列データを扱う際に最も重要な前処理の1つは次のうちどれですか？

時系列データをカテゴリ型に変換する

欠損値を平均値で補完する

データを時間の順序に並び替える

時間に関係なく値をシャッフルする

None

97.

非構造化データの特徴量抽出において、音声データからメル周波数ケプストラム係数 (MFCC) を使用する主な理由は何ですか？

音声データを画像データに変換するため

音声信号を人間の聴覚に基づいた特徴量に変換するため

音声データを標準化するため

音声データを二値データに変換するため

None

98.

データサイエンスプロジェクトにおいて「成果物の所有権」を契約書で明確に規定する必要がある理由として最も適切なものは次のうちどれですか？

成果物がプロジェクト終了後に誰の管理下にあるかを明確にするため

成果物の品質を保証するため

成果物を全ての関係者が自由に利用できるようにするため

成果物を公開しないため

None

99.

事業におけるAI実装のROI（投資利益率）を評価するために最も重要な要素は次のうちどれですか？

モデルの精度だけを評価する

AI技術の開発コストを削減する

実装により得られるビジネス価値を定量化する

モデルが使用するデータ量を最小化する

None

100.

AIを事業に実装する際、「データの品質」が重要である理由として最も適切なものは次のうちどれですか？

データ量が多ければ品質は関係ないため

低品質なデータの方がモデルの多様性を高めるため

データの品質はビジネス目標に影響を与えないため

高品質なデータがなければモデルの学習が失敗する可能性が高いため

None

Time's up