AI実装検定S級～模擬試験①～

GoogLeNetで「バッチ正規化」を適用することで期待される効果は何ですか？

モデルの学習が安定し、収束速度が向上する

モデルのパラメータ数が減少する

活性化関数が不要になる

モデルの計算量が増加する

None

GPT-3のような大規模言語モデルにおいて「Few-shot learning」が効果的である理由は何ですか？

モデルが少量のデータで即座に新しいタスクを学習できるため

モデルのパラメータ数が少ないため、学習が効率的に進む

モデルのハイパーパラメータを最適化するため

モデルが並列処理を行うため

None

ResNetが「オーバーフィッティング」を防ぐために使用する手法は次のうちどれですか？

ドロップアウト

残差接続

正則化

L2正則化

None

Transformerモデルがseq2seqモデルに対して持つ最大の利点は何ですか？

アテンション機構のみを使用することで、並列処理が可能であり、長いシーケンスでも効率的に処理できるため

モデルのサイズを削減するため

パラメータ数を減らすため

モデルの訓練時間を短縮するため

None

Transformerモデルにおいて「Layer Normalization（層正規化）」が行われる主な理由は何ですか？

モデルの出力を正規化して勾配爆発や消失を防ぐため

モデルのサイズを削減するため

モデルのトレーニング速度を遅くするため

データを自動で前処理するため

None

GoogLeNetの設計で「プーリング層」を使用する主な目的は何ですか？

パラメータ数を増やすため

モデルの計算速度を低下させるため

特徴マップのサイズを縮小し、重要な特徴を強調するため

活性化関数を最適化するため

None

VGGネットワークの設計において「全結合層」を使用する目的は何ですか？

特徴マップのサイズを減らすため

畳み込み層で抽出した特徴を元に、最終的なクラス分類を行うため

モデルのパラメータ数を削減するため

活性化関数を変更するため

None

GoogLeNetのInceptionモジュールにおいて、「1x1の畳み込み層」を事前に適用しない場合、どういった問題が発生する可能性がありますか？

モデルの性能が向上する

計算量が大幅に増加し、訓練に時間がかかる

特徴マップのサイズが増加しすぎて、過学習が発生する

モデルのパラメータ数が減少する

None

seq2seqモデルのエンコーダとデコーダ間の情報伝達において、エンコーダの最終隠れ状態だけでなく、アテンション機構が重要となる理由は何ですか？

全ての入力シーケンスに均等に注意を向けるため

エンコーダの全ての隠れ状態にアクセスすることで、長いシーケンスの情報を劣化させずに利用できるため

モデルの訓練時間を短縮するため

デコーダの性能を低下させないため

None

10.

VGGネットワークの層の総数が多い理由は何ですか？

複雑な画像処理をシンプルにするため

各層で異なるレベルの特徴を学習し、高次の抽象的特徴を得るため

各層のパラメータ数を減らすため

モデルの訓練を容易にするため

None

11.

WideResNetのようなモデルで「スキップ接続」が無い場合、どのような影響が考えられますか？

モデルの性能が向上する

モデルのパラメータ数が増加する

学習速度が向上する

勾配消失問題が悪化し、学習が進まなくなる可能性がある

None

12.

seq2seqモデルで「デコーダ」が生成するのは何ですか？

入力シーケンスの次元数

出力シーケンス

モデルの重み

エンコーダの隠れ状態

None

13.

GoogLeNetにおいて「複数の出力層（auxiliary classifiers）」を追加する目的は何ですか？

モデルのパラメータ数を増加させるため

中間層でも学習を行い、勾配消失問題を防ぐため

訓練データの量を増やすため

全結合層を削減するため

None

14.

VGGネットワークで「転移学習」が効果的な理由は何ですか？

モデルが浅いネットワーク構造を持つため

事前学習された特徴が多くの異なるタスクに対して汎用的であるため

モデルのパラメータ数が少ないため

モデルが固定された出力サイズを持つため

None

15.

VGGネットワークが従来のCNNモデルと比較して持つ利点は何ですか？

訓練時間が大幅に短縮される

より浅いネットワークで同等の性能を達成する

より深い層を使用することで、より抽象的な特徴を学習できる

全結合層を減らすことでパラメータ数が減る

None

16.

VGGネットワークの「プーリング層」の主な役割は何ですか？

畳み込み層の出力を正規化するため

モデルのパラメータ数を増加させるため

モデルの訓練時間を増加させるため

特徴マップのサイズを縮小し、重要な特徴を抽出するため

None

17.

VGGネットワークのような深層学習モデルで、深い層を追加する際に発生する「勾配消失問題」を解決するための手法はどれですか？

ReLU活性化関数を使用する

重み減衰を適用する

全結合層を削除する

バッチ正規化を導入する

None

18.

VGG16とVGG19の違いとして正しいものはどれですか？

VGG16は全てのカーネルが5x5で、VGG19は3x3である

VGG16は16層、VGG19は19層の畳み込み層と全結合層を持つ

VGG16はプーリング層を持たず、VGG19は持つ

VGG19はVGG16と比較して、全結合層が1層多い

None

19.

GPT（Generative Pre-trained Transformer）モデルがBERTとは異なる点は何ですか？

GPTは双方向の文脈を同時に学習するが、BERTは単方向の文脈しか学習しない

GPTは単方向の文脈を学習し、テキスト生成タスクに特化している

GPTはエンコーダのみを使用し、BERTはデコーダのみを使用する

GPTは翻訳タスク専用で、BERTは分類タスク専用である

None

20.

BERT（Bidirectional Encoder Representations from Transformers）がTransformerのエンコーダを使用することで、従来のseq2seqモデルに対して持つ利点は何ですか？

単方向の文脈しか学習できないため、情報が失われにくい

両方向の文脈を同時に学習し、より精度の高い文脈理解が可能になるため

モデルのサイズが小さくなるため

モデルの訓練時間が短縮されるため

None

21.

WideResNetが「深さ」を増やす代わりに「幅」を増やす選択をする理由は何ですか？

訓練データの量を減らすため

計算量を削減するため

勾配消失問題を軽減しつつ、より多様な特徴を学習するため

モデルのパラメータ数を減らすため

None

22.

VGGネットワークを転移学習に使用する際、全結合層を新しいタスクに合わせて再トレーニングする理由は何ですか？

全結合層は画像全体の意味を捉えるため、他のタスクに対応する必要があるから

全結合層は学習済みの重みを使えないため

全結合層の活性化関数が異なるため

全結合層は事前学習に含まれないため

None

23.

ResNetで「非常に深いネットワーク」を使用するとき、勾配消失問題を完全に解決できない場合、他にどのような問題が発生する可能性がありますか？

モデルの精度が大幅に向上する

ネットワークが適切に収束せず、精度が低下する

残差接続が無効になる

モデルのパラメータ数が減少する

None

24.

seq2seqモデルのエンコーダにおいて、「長短期記憶（LSTM）」を用いるメリットとして正しいものはどれですか？

モデルの学習時間を短縮できる

長期的な依存関係を保持しやすく、勾配消失問題を回避できる

デコーダの出力を最適化する

パディングを行わずに入力シーケンスを処理できる

None

25.

ResNet-50の「50」という数字が示しているのは次のうちどれですか？

ネットワークの残差ブロック数

全ての層の合計数（畳み込み層、プーリング層、全結合層の合計）

最終出力の次元数

各ブロックで使用されるカーネルサイズ

None

26.

ResNetで「勾配消失問題」を防ぐための他の手法として考えられるものは次のうちどれですか？

全結合層を削除する

残差接続を無効にする

バッチ正規化を導入する

パラメータをランダムに初期化する

None

27.

VGG16において「16」という数字が示しているものは何ですか？

畳み込み層のカーネルサイズ

ネットワーク内の畳み込み層と全結合層の合計数

ネットワークの深さ

プーリング層の数

None

28.

VGGモデルにおいて、「過学習」を防ぐために取られる一般的な対策は何ですか？

モデルの層数を増やす

ドロップアウト層を導入する

重みのランダム初期化を行う

活性化関数を変更する

None

29.

ResNet/WideResNetにおける「Global Average Pooling（GAP）」の使用は何を目的としていますか？

パラメータ数を増加させるため

最終的な特徴マップを集約し、過学習を防ぐため

特徴マップのサイズを増加させるため

勾配消失問題を軽減するため

None

30.

GoogLeNetの設計において、「dropout」を使用する理由は何ですか？

モデルの訓練速度を向上させるため

モデルのパラメータ数を増やすため

過学習を防ぎ、モデルの汎化性能を高めるため

モデルの出力をシャッフルするため

None

31.

ResNetの設計において、最大の特徴である「残差接続（Residual Connection）」の目的は何ですか？

モデルの計算コストを削減するため

非線形性を増加させるため

勾配消失問題を軽減し、深い層でも学習が安定するようにするため

モデルのパラメータ数を増加させるため

None

32.

VGGネットワークが多くのパラメータを持つことの欠点を軽減するために、近年利用される技術は何ですか？

データ拡張

モデルの蒸留

転移学習

プルーニング（剪定）

None

33.

GoogLeNetモデルの主な特徴は次のうちどれですか？

全結合層の数を増やしたモデル

Inceptionモジュールを使用し、畳み込みとプーリングを並列に処理する

ReLUを活性化関数として使用しないモデル

深さが浅いCNNモデル

None

34.

seq2seqモデルにおいて、入力シーケンスの長さが異なるデータを処理するために最も適している手法はどれですか？

固定長のベクトルに入力シーケンスを切り捨てる

パディングを使い、入力シーケンスを同じ長さに揃える

全ての入力シーケンスを同じ長さのデータに変換する

入力シーケンスを無視する

None

35.

ResNetで使用される「バッチ正規化（Batch Normalization）」の主な役割は何ですか？

学習率を自動で最適化するため

モデルの計算量を減らすため

各層の出力を正規化し、学習の安定性を向上させるため

残差接続の効果を無効にするため

None

36.

Transformerモデルのトレーニングにおいて「学習率ウォームアップ」を使用する理由は何ですか？

モデルの学習を開始する前に、学習率を徐々に増加させて安定した学習を行うため

モデルの重みを初期化するため

モデルの過学習を防ぐため

データの正規化を行うため

None

37.

Transformerモデルにおいて「残差接続（Residual Connection）」の目的は何ですか？

モデルの重みを削減するため

モデルの学習速度を向上させるため

データの前処理を自動化するため

各層の出力に入力を加算し、勾配消失を防ぎ、深いネットワークでも学習を安定化させるため

None

38.

GoogLeNetにおいて「1x1畳み込み」の役割は何ですか？

特徴マップのサイズを縮小するため

モデルの計算量を減少させるため

次元削減を行い、計算効率を向上させるため

モデルのパラメータ数を増加させるため

None

39.

VGGネットワークで「カーネルサイズを小さくする」設計の意図は何ですか？

モデルの精度を低下させるため

訓練データを削減するため

パラメータ数を削減しながら、同等の受容野を確保するため

モデルの出力サイズを変更するため

None

40.

VGGネットワークが「事前学習済みモデル」としてよく使用される理由は何ですか？

モデルが軽量であるため

ネットワークの深さが浅いため

パラメータ数が少ないため

多くの異なる画像データセットで良好な性能を発揮するため

None

41.

ResNetが「非常に深いネットワーク」においても有効に機能する理由は何ですか？

全ての層で勾配を消失させるため

残差接続が勾配消失問題を防ぎ、層が深くなっても学習が安定するため

全結合層を多用するため

勾配爆発を引き起こすため

None

42.

VGGネットワークの設計において、特徴的な要素は何ですか？

大きなカーネルサイズを持つ畳み込み層

複数の小さい3x3のカーネルを積み重ねる設計

平均プーリングのみを使用する

ReLU活性化関数を使用しない

None

43.

GoogLeNetの「Inceptionモジュール」の設計において、次元削減を行わないとどのような影響がありますか？

モデルの性能が向上する

モデルのパラメータ数が減少する

モデルの学習速度が向上する

モデルの計算量が増加し、メモリ使用量が大幅に増加する

None

44.

WideResNetが標準のResNetに比べて「計算効率」を高めるために採用している設計方針は次のうちどれですか？

残差ブロックの数を減らし、幅を増やすことで学習速度を向上させる

全ての畳み込み層を1x1に置き換える

モデルの深さをさらに増やす

全結合層を削除する

None

45.

GoogLeNetの「Inception-v3」と「Inception-v1」の主な違いは何ですか？

Inception-v1は次元削減を行わないが、Inception-v3は行う

Inception-v3は、より効率的な畳み込みや正則化技術を採用している

Inception-v1はReLUを使用しないが、Inception-v3は使用する

Inception-v3は全ての層にバッチ正規化を適用している

None

46.

seq2seqモデルで使用される基本的なアーキテクチャはどれですか？

畳み込みニューラルネットワーク (CNN)

再帰型ニューラルネットワーク (RNN)

ガウス過程 (Gaussian Process)

ランダムフォレスト (Random Forest)

None

47.

Transformerモデルで用いられる「FFN（Feed-Forward Network）」の役割は何ですか？

エンコーダとデコーダの出力を統合するため

各単語に対して非線形変換を適用し、モデルの表現力を向上させるため

モデルの計算コストを削減するため

モデルの学習率を最適化するため

None

48.

seq2seqモデルにおいて「エンコーダ」の役割は何ですか？

入力シーケンスを受け取り、隠れ状態に変換する

出力シーケンスを生成する

モデルの重みを最適化する

入力データの次元を削減する

None

49.

Transformerモデルにおける「学習率スケジューリング」の効果は何ですか？

モデルのサイズを削減する

モデルの重みを初期化する

学習率を段階的に調整することで、最適な学習速度を維持する

モデルの出力を正規化する

None

50.

GoogLeNetの設計において、Inceptionモジュールを使用する利点は何ですか？

全ての特徴を1つのカーネルサイズで学習する

畳み込み層のパラメータ数を増やす

異なるサイズの特徴を同時に学習し、より多様な特徴抽出が可能になる

モデルの学習速度を低下させる

None

Time's up